Phân loại các loại phương pháp học máy?

  1. Trí tuệ nhân tạo

Mọi người có thể giúp mình phân biệt các phương pháp học máy sau có những điểm giống và khác nhau thế nào ạ:

  • Học có giám sát (supervised learning)
  • Học không có giám sát (unsupervised learning)
  • Học bán giám sát (semi-supervised learning)
  • Học tăng cường (reinforcement learning)

Và phân biệt hai loại mô hình học máy:

  • Generative models
  • Discriminative Models
Từ khóa: 

trí tuệ nhân tạo

Các phương pháp học máy trên có những điểm khác biệt cơ bản sau:

  • Học có giám sát: là học dựa trên tập dữ liệu có gán nhãn, thường dùng cho bài toán phân lớp.
  • Học không giám sát: là học dựa trên tập dữ liệu không gán nhãn, thường dùng cho bài toán phân cụm.
  • Học bán giám sát: là học dưạ trên cả dữ liệu gán nhãn lẫn không gán nhãn.
  • Học tăng cường (reinforcement learning) có thể xem là môt mảng con của học máy (tùy quan điểm); đối với deep learning thì học tăng cường chủ yếu là học chuỗi các phản ứng nhằm tối đa hóa lợi ích.
Trả lời

Các phương pháp học máy trên có những điểm khác biệt cơ bản sau:

  • Học có giám sát: là học dựa trên tập dữ liệu có gán nhãn, thường dùng cho bài toán phân lớp.
  • Học không giám sát: là học dựa trên tập dữ liệu không gán nhãn, thường dùng cho bài toán phân cụm.
  • Học bán giám sát: là học dưạ trên cả dữ liệu gán nhãn lẫn không gán nhãn.
  • Học tăng cường (reinforcement learning) có thể xem là môt mảng con của học máy (tùy quan điểm); đối với deep learning thì học tăng cường chủ yếu là học chuỗi các phản ứng nhằm tối đa hóa lợi ích.
  • Supervised learning là thuật toán dự đoán đầu ra (outcome) của một dữ liệu mới (new input) dựa trên các cặp (input, outcome) đã biết từ trước. Cặp dữ liệu này còn được gọi là (data, label), tức (dữ liệu, nhãn). Supervised learning là nhóm phổ biến nhất trong các thuật toán Machine Learning.
  • Unsupervised learning chúng ta không biết được outcome hay nhãn mà chỉ có dữ liệu đầu vào. Thuật toán unsupervised learning sẽ dựa vào cấu trúc của dữ liệu để thực hiện một công việc nào đó, ví dụ như phân nhóm (clustering) hoặc giảm số chiều của dữ liệu (dimension reduction) để thuận tiện trong việc lưu trữ và tính toán.
  • Các bài toán khi chúng ta có một lượng lớn dữ liệu nhưng chỉ một phần trong chúng được gán nhãn được gọi là Semi-Supervised Learning. Những bài toán thuộc nhóm này nằm giữa hai nhóm được nêu bên trên. Một ví dụ điển hình của nhóm này là chỉ có một phần ảnh hoặc văn bản được gán nhãn (ví dụ bức ảnh về người, động vật hoặc các văn bản khoa học, chính trị) và phần lớn các bức ảnh/văn bản khác chưa được gán nhãn được thu thập từ internet. Thực tế cho thấy rất nhiều các bài toán Machine Learning thuộc vào nhóm này vì việc thu thập dữ liệu có nhãn tốn rất nhiều thời gian và có chi phí cao. Rất nhiều loại dữ liệu thậm chí cần phải có chuyên gia mới gán nhãn được (ảnh y học chẳng hạn). Ngược lại, dữ liệu chưa có nhãn có thể được thu thập với chi phí thấp từ internet.
  • Reinforcement learning là các bài toán giúp cho một hệ thống tự động xác định hành vi dựa trên hoàn cảnh để đạt được lợi ích cao nhất (maximizing the performance). Hiện tại, Reinforcement learning chủ yếu được áp dụng vào Lý Thuyết Trò Chơi (Game Theory), các thuật toán cần xác định nước đi tiếp theo để đạt được điểm số cao nhất.

Nguồn tham khảo:

https://machinelearningcoban.com/2016/12/27/categories/

Mình xin trả lời ý 2, theo những gì mình biết.

Discriminative model (mô hình phân biệt) là loại mô hình mà nó mô hình  hóa sự khác biệt (của cái A, B, C ... với nhau), ví dụ như 1 siêu phẳng chia không gian thành 2 phần (SVM).

Generative model (mô hình sinh) là loại mô hình mà mô hình chính cái A, cái B, cái C ..., ví dụ như mô hình bigram mô hình hóa xác suất của một bigram là bao nhiêu. Chính vì vậy, nó có thể dùng để sinh ra cái A, cái B, cái C.