Độ tin cậy của dữ liệu, cách thức thu thập dữ liệu?

  1. Data Mining

  2. Nguyễn Thị Lan Phượng

theo chị, dựa vào đâu để đánh giá được độ tin cậy của dữ liệu? chị có thể nêu ví dụ về một bộ câu hỏi để thu thập dữ liệu người dùng cho một chiến dịch Marketing về ngành hàng FMCG không? xin cảm ơn chị!
Từ khóa: 

dữ liệu

,

fmcg

,

marketing

,

data mining

,

chuyên gia đào tạo phân tích và trực quan dữ liệu

Về đánh giá độ tin cậy của dữ liệu sẽ dựa trên 2 tiêu chí chính:
- Cách thức thu thập số liệu
- Độ chính xác của các giá trị thu thập

Ví dụ: Về tiêu chí cách thức thu thập số liệu: có mức độ tin cậy khác nhau trên 2 kênh thu thập online và offline: với thu thập online sẽ hạn chế được khá nhiều rủi ro trong việc nhập sai lệch, trong một số trường hợp thực hiện bảng hỏi trên giấy thì có thể có sai lệch trong việc nhập kết quả từ giấy lên trên máy tính.

Thông thường mỗi bộ dữ liệu đều có thể để lại một tỉ lệ sai số nhất định từ 1%-5% và người xử lý thường phải sử dụng một số công cụ để cleansing và chuẩn hóa lại các dữ liệu cho các trường hợp sai lệch thường gặp.

Về bộ câu hỏi và data set kết quả thu thập dữ liệu người dùng cho chiến dịch Marketing thì bạn có thể tham khảo bộ dataset tại link này nhé:

Trả lời

Về đánh giá độ tin cậy của dữ liệu sẽ dựa trên 2 tiêu chí chính:
- Cách thức thu thập số liệu
- Độ chính xác của các giá trị thu thập

Ví dụ: Về tiêu chí cách thức thu thập số liệu: có mức độ tin cậy khác nhau trên 2 kênh thu thập online và offline: với thu thập online sẽ hạn chế được khá nhiều rủi ro trong việc nhập sai lệch, trong một số trường hợp thực hiện bảng hỏi trên giấy thì có thể có sai lệch trong việc nhập kết quả từ giấy lên trên máy tính.

Thông thường mỗi bộ dữ liệu đều có thể để lại một tỉ lệ sai số nhất định từ 1%-5% và người xử lý thường phải sử dụng một số công cụ để cleansing và chuẩn hóa lại các dữ liệu cho các trường hợp sai lệch thường gặp.

Về bộ câu hỏi và data set kết quả thu thập dữ liệu người dùng cho chiến dịch Marketing thì bạn có thể tham khảo bộ dataset tại link này nhé: