How to properly do feature selection in supervised learning?

  1. Trí tuệ nhân tạo

Với một bài toán supervised learning, các actions có thể làm được sau khi đo correlation giữa các features là gì? Nếu biết các biến correlate với nhau thì sẽ engineer như nào để giảm noise?

Tương tự như vậy, sau khi đo một cách tương đối feature importances sử dụng XGBoost, bạn thường có những actions gì bên cạnh việc loại bỏ các feature có feature importance = 0? Bạn đã bao giờ loại bỏ feature nhưng tăng classification accuracy chưa?

Từ khóa: 

feature selection

,

machine learning

,

sáng kiến ý tưởng 2018

,

trí tuệ nhân tạo