Cách xử lý trong trường hợp tập dữ liệu là không cân bằng (imbalanced dataset)?
trí tuệ nhân tạo
Data augmentation:
- Oversampling -> Tạo thêm dữ liệu cho phần dữ liệu bị thiếu
- Down sampling -> Bỏ bớt dữ liệu cho phần dữ liệu đang dư
- Classweighting -> Tăng weight cho phần dữ liệu thiếu cao lên
- Training -> Tăng xác suất phần dữ liệu thiếu được sử dụng trong quá trình training
- Ngoài ra còn một số phương pháp khác mời các chuyên gia khác thêm vào
Nội dung liên quan
Viet Lai
Data augmentation:
- Oversampling -> Tạo thêm dữ liệu cho phần dữ liệu bị thiếu
- Down sampling -> Bỏ bớt dữ liệu cho phần dữ liệu đang dư
Optimization:Vu Xuan Tuan
Lê Văn Hùng