Độ tin cậy của dữ liệu, cách thức thu thập dữ liệu?
dữ liệu
,fmcg
,marketing
,data mining
,chuyên gia đào tạo phân tích và trực quan dữ liệu
Về đánh giá độ tin cậy của dữ liệu sẽ dựa trên 2 tiêu chí chính:
- Cách thức thu thập số liệu
- Độ chính xác của các giá trị thu thập
Ví dụ: Về tiêu chí cách thức thu thập số liệu: có mức độ tin cậy khác nhau trên 2 kênh thu thập online và offline: với thu thập online sẽ hạn chế được khá nhiều rủi ro trong việc nhập sai lệch, trong một số trường hợp thực hiện bảng hỏi trên giấy thì có thể có sai lệch trong việc nhập kết quả từ giấy lên trên máy tính.
Thông thường mỗi bộ dữ liệu đều có thể để lại một tỉ lệ sai số nhất định từ 1%-5% và người xử lý thường phải sử dụng một số công cụ để cleansing và chuẩn hóa lại các dữ liệu cho các trường hợp sai lệch thường gặp.
Về bộ câu hỏi và data set kết quả thu thập dữ liệu người dùng cho chiến dịch Marketing thì bạn có thể tham khảo bộ dataset tại link này nhé:
Nguyễn Thị Lan Phượng
Về đánh giá độ tin cậy của dữ liệu sẽ dựa trên 2 tiêu chí chính:
- Cách thức thu thập số liệu
- Độ chính xác của các giá trị thu thập
Ví dụ: Về tiêu chí cách thức thu thập số liệu: có mức độ tin cậy khác nhau trên 2 kênh thu thập online và offline: với thu thập online sẽ hạn chế được khá nhiều rủi ro trong việc nhập sai lệch, trong một số trường hợp thực hiện bảng hỏi trên giấy thì có thể có sai lệch trong việc nhập kết quả từ giấy lên trên máy tính.
Thông thường mỗi bộ dữ liệu đều có thể để lại một tỉ lệ sai số nhất định từ 1%-5% và người xử lý thường phải sử dụng một số công cụ để cleansing và chuẩn hóa lại các dữ liệu cho các trường hợp sai lệch thường gặp.
Về bộ câu hỏi và data set kết quả thu thập dữ liệu người dùng cho chiến dịch Marketing thì bạn có thể tham khảo bộ dataset tại link này nhé:
Marketing Campaign | Kaggle
www.kaggle.com