Cách giải thích Machine Learning dễ hiểu với bạn "mù" công nghệ?
Gần đây, mình nhận được khá nhiều câu hỏi về định nghĩa Machine Learning, 1 câu hỏi tưởng như rất dễ trả lời nhưng đối với những bạn chưa có back ground về công nghệ thì hẳn không dễ dàng. Mình đã tìm hiểu, "lục lọi" và cuối cùng tìm ra được câu trả lời mà mình nghĩ khá là dễ hiểu cho tất cả mọi người.
Quay trở lại, câu hỏi được đặt ra là: "Machine Learning là gì?"
Đi mua xoài
Thử tượng tượng, một ngày nọ, mẹ bạn sai bạn đi mua xoài. Bạn chưa từng có kinh nghiệm trong chuyện này. Mẹ chỉ dạy bạn rằng: "những quả xoài vàng tươi thì ngọt hơn những quả xoài nhạt màu". Bạn đến cửa hàng, ghi nhớ điều này và chỉ chọn những quả xoài vàng tươi nhất. Bạn kiểm tra màu sắc quả xoài, chọn những quả xoài ưng ý, trả tiền và quay về nhà với tâm trạng hứng khởi. Hạnh phúc viên mãn?
Chưa đâu.
Cuộc sống phức tạp hơn nhiều
Bạn về nhà và thưởng thức xoài. Nhưng chúng có những quả không ngọt như bạn nghĩ. Rõ ràng, lời khuyên từ mẹ vẫn chưa đủ. Bạn nhận ra còn nhiều yếu tố ảnh hưởng khác nữa, hơn là chỉ màu sắc.
Sau khi cân nhắc thật kĩ (và thử rất nhiều quả khác nhau), bạn kết luận là trong những quả vàng tươi, những quả to thì luôn ngọt, nhưng chỉ nửa số xoài bé ngọt (nghĩa là nếu bạn mua 100 quả vàng tươi, trong đó 50 quả to, 50 quả bé, thì toàn bộ 50 quả to đều ngọt, trong khi chỉ có 25 trong tổng số 50 quả bé ngọt mà thôi)
Bạn hạnh phúc và háo hức áp dụng những thứ bạn vừa nhận ra để chọn xoài lần tới. Nhưng ngay sau đó bạn nhận ra, cửa hàng bạn vẫn thường mua đã di chuyển địa điểm sang nơi khác. Bạn quyết định mua từ một cửa hàng khác, người này thì nhập xoài từ một vùng khác. Và thời khắc đó bạn nhận ra rằng, những quy luật mà bạn đã học (những quả xoài to, vằng tươi luôn ngọt nhất) đã không thể áp dụng được nữa. Bạn phải học lại từ đầu. Bạn thử từng quả xoài của người bán hàng này, và thấy những quả nhỏ, nhạt màu mới thực sự là những quả ngọt nhất.
Một ngày, em gái của bạn từ 1 TP khác sang thăm. Bạn muốn gọt xoài cho em ăn, nhưng cô gái nói rằng độ ngọt không hoàn toàn quan trọng, cô ấy muốn ăn những quả vừa giòn vừa ngọt. Và thêm lần nữa, bạn thực hiện các thử nghiệm, ăn thử tất cả các loại xoài, và phát hiện ra những trái có vỏ vàng nhạt, phía cuống trái hơi ửng vàng, đều màu, da căng bóng, cứng thì em gái bạn sẽ thích.
Không lâu sau, bạn phải đi công tác tới 1 thành phố khác. Những quả xoài ở đây thật khác biệt khi ở thành phố của bạn. Những quả xoài màu nhạt lại ngọt, thơm hơn rất nhiều những quả vàng mềm.
Bạn lấy vợ, và vợ bạn k thích xoài. Cô ấy thích ăn táo. Bạn đi chợ mua táo, và giờ, tất cả những kinh nghiệm, kiến thức mua xoài của bạn trở nên vô dụng. Bạn phải học lại từ đầu. Bạn làm điều đó, bởi vì bạn yêu cô ấy.
Thế giới máy tính
Cuối cùng, với quá nhiều luật lệ, bạn quyết định viết một chương trình máy tính giúp bạn chọn xoài (hoặc táo). Bạn liệt kê các luật như:
Nếu (màu vàng tươi và to và bán từ cô bán hàng quen thuộc): quả xoài sẽ ngọt
Nếu (nhạt màu, da căng bóng): quả xoài sẽ giòn và ngọt
......
Bạn muốn sử dụng những luật lệ này để chọn xoài. Bạn thậm chí còn có thể gửi những luật này tới em gái bạn để cô ấy có thể chọn ra những quả ngon nhất.
Nhưng mỗi lần bạn thấy một hiện tượng mới từ những thử nghiệm, bạn phải tự mình thay đổi luật lệ trong chương trình đó. Bạn phải hiểu được sự phức tạp đến từng chi tiết của tất cả các yếu tố ảnh hưởng đến chất lượng của xoài. Nếu vấn đề đủ phức tạp, sẽ rất khó để bạn tạo tự tay ra luật chính xác bao hàm tất cả các trường hợp có thể. Nếu làm được điều đó, bạn thậm chí có thể kiếm được bằng PhD trong ngành nghiên cứu xoài (nếu tồn tại).
Nhưng không phải ai cũng có đủ thời gian như vậy.
Thế giới thuật toán Machine Learning (Học Máy)
Thuật toán học máy được phát triển từ các thuật toán thông thường. Chúng tạo ra những chương trình thông minh hơn, bằng cách tự động học từ dữ liệu bạn cung cấp.
Bạn lấy ngẫu nhiều xoài với nhiều loại khác nhau (training data - dữ liệu đào tạo) từ chợ, tạo một bảng tất cả các đặc trưng của xoài như màu sắc, kích cỡ, hình dáng, nguồn gốc... (features - đặc trưng), cùng với độ ngọt, giòn, chín... (output variables - kết quả thử nghiệm) của từng quả . Bạn đưa những dữ liệu này vào thuật toán học máy (classification - phân nhóm, regression - hồi quy ...), và nó học tính tương quan giữa các đặc tính vật lý và chất lượng của xoài.
Lần tiếp theo bạn ra cửa hàng, bạn đo lường các đặc tính của xoài được bán (test data - dữ liệu kiểm thử), rồi chuyển nó vào thuật toán học máy. Mô hình bạn tạo ra sẽ dự đoán quả xoài ngọt, giòn và/hoặc đã chín hay còn xanh. Thuật toán sử dụng có thể tương tự như luật bạn viết bằng tay bên trên (decision tree - cây quyết định), hoặc các thuật toán liên quan khác, nhưng bạn không cần quá quan tâm đến điều đó.
Bạn có thể mua xoài với sự tự tin, mà không cần lo lắng về cách chọn xoài tốt nhất. Hơn nữa, bạn có thể khiến thuật toán tự cải thiện theo thời gian (reinforcement learning - học củng cố), để nó có thể cải thiện độ chính xác trong khi đang học từ dữ liệu đào tạo, tự thay đổi khi tạo ra những dự đoán sai. Và điều thích thú nhất là, bạn có thể sử dụng thuật toán tương tự để đào tạo nhiều mô hình khác nhau, mỗi mô hình sẽ dự đoán chất lượng của xoài, táo, cam, chuối, dâu, dưa hấu... để chọn ra những loại quả tốt nhất, làm vui lòng tất cả những người bạn yêu thương.
Và đó, chính là Machine Learning trong cuộc sống.
Machine Learning: tự tạo ra những thuật toán thông minh, để bộ não con người có thể được nghỉ ngơi.
Còn theo bạn, bạn có cách giải thích như nào về Machine Learning dễ hiểu hơn cho người "ngoại đạo"?
Source:
ai
,machine learning
,trí tuệ nhân tạo
,học máy
,trí tuệ nhân tạo
Cảm ơn bạn, bài chia sẻ rất hữu ích cho những người mới bắt đầu với ML như mình (y)
Nguyễn Gia Tú
Cảm ơn bạn, bài chia sẻ rất hữu ích cho những người mới bắt đầu với ML như mình (y)
Người ẩn danh
Ví dụ của bạn thật dễ hiểu. Cảm ơn bạn nhiều nhé.
Mình có một thắc mắc là: mỗi một lần mua mới bạn lại thấy phương pháp cũ của mình không còn chính xác. Soài Thái Lan khác Việt Nam, Soài miền bắc khác Soài Miền Nam, soài lớn soài bé đều khác nhau. Vậy bạn sẽ tiếp tục, liên tục thay đổi thuật toán hay sẽ lựa chọn dừng lại ở một cách tương đối chính xác?
Vũ Hoàng Linh
Cảm ơn ad. Bài viết rất trực quan dễ hiểu