Trí tuệ nhân tạo là gì? (Phần 2)
Học có giám sát
Một phương pháp dùng cho việc huấn luyện AI bằng cách sử dụng một số lượng lớn các dữ liệu được đánh nhãn. Các hệ thống học máy sẽ được cung cấp một lượng khổng lồ dữ liệu, các dữ liệu này đã được ghi chú để làm nổi bật các đặc điểm được quan tâm. Đó có thể là những tấm ảnh được đánh nhãn cho chứa một chú chó hoặc một câu chú thích để biết ví dụ từ “bass” sẽ liên quan đến âm nhạc hay là một con cá. Khi đã được huấn luyện, hệ thống có thể tự đánh được nhãn đối với các dữ liệu mới, ví dụ nó có thể biết có một con chó trong những bức ảnh mới được tải lên.
Quá trình dạy này được gọi là học có giám sát và vai trò thực hiện việc đánh nhãn này thường là những người làm việc trực tuyến (online worker), thông qua các nền tảng như Amazon Mechanical Turk.
Việc huấn luyện các hệ thống này thường đòi hỏi một lượng lớn dữ liệu, với một số hệ thống cần hàng triệu ví dụ để học cách thực hiện một nhiệm vụ hiệu quả - mặc dù điều này ngày càng khả thi trong thời đại dữ liệu lớn và khai thác dữ liệu rộng rãi. Tập dữ liệu huấn luyện là rất lớn và ngày càng tăng cường về kích thước - Bộ dữ liệu hình ảnh mở của Google có khoảng 9 triệu hình ảnh, trong khi kho lưu trữ video được gắn nhãn YouTube-8M liên kết đến khoảng 7 triệu video được gắn nhãn. ImageNet, một trong những cơ sở dữ liệu ban đầu, có hơn 14 triệu hình ảnh được phân loại. Được tổng hợp trong hơn hai năm, nó đã được tập hợp bởi gần 50.000 người - hầu hết trong số họ đã được tuyển dụng thông qua Amazon Mechanical Turk – những người đã kiểm tra, sắp xếp và dán nhãn gần một tỷ hình ảnh.
Về dài hạn, có quyền truy cập vào các bộ dữ liệu được dán nhãn lớn có thể được chứng minh là ít quan trọng hơn so với năng lực tính toán.
Trong những năm gần đây, Generative Adversarial Networks ( GANs) đã chỉ ra các hệ thống học máy được cung cấp lương dữ liệu được đánh nhãn nhỏ hơn có thể tạo ra một lượng lớn dữ liệu mới để tự dạy chính nó.
Cách thức tiếp cận này có thể dẫn đến việc phát triển của công nghệ học bán giám sát (semi-supervised learning), nơi mà hệ thống có thể học và thực hiện các tác vụ sử dụng ít dữ liệu được đánh nhãn hơn rất nhiều so với công nghệ huấn luyện có giám sát hiện nay.
Học không giám sát
Ở chiều ngược lại, học không giám sát là cách thức tiếp cận khác, ở phương pháp này các giải thuật cố gắng nhận dạng mẫu trong các dữ liệu, tìm kiếm các điểm tương đồng để có thể phân loại dữ liệu.
Một ví dụ có thể là phân cụm các loại trái cây có trọng lượng tương đương hoặc những chiếc xe có kích thước động cơ tương tự nhau.
Thuật toán không được thiết lập trước để chọn ra các loại dữ liệu cụ thể, nó chỉ đơn giản là tìm kiếm dữ liệu có thể được nhóm theo các điểm tương đồng của nó, ví dụ như Google News tập hợp các câu chuyện về các chủ đề tương tự mỗi ngày.
Học củng cố (Reinforcement learning)
Có thể so sánh một cách đơn giản học củng cố với việc huấn luyện thú cưng khi chúng ta thưởng cho nó khi nó hoàn thành được một yêu cầu (nó sẽ biết khi càng làm đúng yêu cầu thì sẽ càng được thưởng nhiều).
Trong học củng cố, hệ thống cố gắng tối đa hóa phần thưởng dựa trên dữ liệu đầu vào của nó, về cơ bản trải qua quá trình thử nghiệm và lỗi cho đến khi đạt được kết quả tốt nhất có thể.
Một ví dụ về học củng cố là mạng Google DeepMind's Deep Q, nó có thể chơi tốt hơn con người rất nhiều loại game cổ điển. Hệ thống được cung cấp điểm ảnh từ mỗi trò chơi và xác định các thông tin khác nhau, chẳng hạn như khoảng cách giữa các đối tượng trên màn hình.
Bằng cách nhìn vào điểm số đạt được trong mỗi lần chơi, hệ thống sẽ xây dựng một mô hình hành động sẽ tối đa hóa điểm số trong các trường hợp khác nhau, ví dụ, trong trường hợp của trò chơi Breakout, nơi cần di chuyển tấm đỡ để chặn trái bóng.
(còn nữa)
Theo www.zdnet.com
aicoban
,trí tuệ nhân tạo
Bạn nên thêm vài hình ảnh cho bài viết sinh động, dễ đọc hơn nhé :D
Người ẩn danh
Bạn nên thêm vài hình ảnh cho bài viết sinh động, dễ đọc hơn nhé :D