Chào bạn, mình nghĩ ai cũng sẽ trả lời là "Đúng rồi".
Deep learning hiện tại đang được xài cho nhiều tác vụ khác nhau. Các công ty công nghệ lớn thường lập riêng một bộ phận trí tuệ nhân tạo. Google, Facebook còn mở những hệ thống phần mềm machine learning của mình ra cho mọi người sử dụng. Google cũng mở một khóa học kéo dài 3 tháng về machine learning và deep learning.
Một vài ví dụ về machine learning đó là công cụ Google Photos. Nó có khả năng nhận biết và phân loại hình ảnh mà bạn chụp theo từng chủ đề khác nhau, thậm chí là theo từng khuôn mặt khác nhau một cách tự động. Hay Facebook M, một trợ lý ảo cá nhân nửa người nửa máy có thể giúp bạn đặt một số món hàng mà bạn muốn. Microsoft với Cortana, Google với Google Now và Apple với Siri đều là những ví dụ rất thực của trí tuệ nhân tạo.
Đây cũng là lý do vì sao mà trong thời gian gần đây chúng ta bắt đầu nghe nói nhiều về machine learning, deep learning và trí tuệ nhân tạo. Đó là vì các hãng tiêu dùng lớn đã bắt đầu nhảy vào cuộc chơi và đưa ra những sản phẩm thực tế mà người ta có thể cầm nắm và trải nghiệm. Trước đó, deep learning và machine learning chỉ nằm trong các phòng thí nghiệm ở những viện nghiên cứu và trường đại học mà thôi.
Ngoài ra, hệ thống các ứng dụng khác nhau với deep learning như sau:
- Hệ thống gợi ý trên các nền tảng:
Các nền tảng lớn hiện nay như Facebook, Amazon, Netflix,... đều có hệ thống gợi ý (recommend) rất mạnh giúp tăng đáng kể độ tương tác của người dùng. Cụ thể là chúng dựa trên các dữ liệu người dùng phát sinh ra khi dùng để gợi ý thêm những sản phẩm họ sẽ thích (trên các nền tảng mua sắm), những bộ phim họ sẽ muốn xem (vd. như trên Netflix), gợi ý các bài quảng cáo/được tài trợ (trên Facebook) hay các khóa học người học quan tâm (trên các nền tảng học online).
- Nhận diện hình ảnh
Mục tiêu của công nghệ nhận diện ảnh là nhận biết và xác định các đối tượng trong ảnh cũng như hiểu được nội dung và ngữ cảnh trong đó. Ví dụ trên cho thấy dịch vụ nhận diện và xác định khuôn mặt của AlchemyVision có khả năng phân biệt hai khuôn mặt tương tự nhau giữa nam diễn viên Will Ferrell và tay trống của Red Hot Chili Peppers, Chad Smith. Công nghệ nhận diện hình ảnh cũng được đưa vào Facebook để gợi ý người dùng tag mặt bạn bè hay ứng dụng vào khoa học tội phạm và điều tra.
- Phát hiện các loại bệnh hiếm gặp
Gần đây, trí tuệ nhân tạo Watson của IBM đã phát hiện ra một loại bệnh mà các bác sĩ đã bó tay không thể tìm ra ở một nữ bệnh nhân. Bằng cách so sánh bộ gene của người phụ nữ này với hơn 20 triệu kết quả nghiên cứu bệnh khác, Watson đã đưa ra kết quả là một chứng leukemia cực kỳ hiếm gặp chỉ trong 10 phút.
Tuy nhiên những hạn chế của Deep Learning cũng đầy ra:
Đầu tiên, deep learning cần một lượng dữ liệu đầu vào khổng lồ để máy tính có thể học hỏi. Quy trình này mất nhiều thời gian, nhiều sức mạnh xử lý mà chỉ có các server cỡ lớn mới làm được. Nếu không có đủ dữ liệu đầu vào, hay có đủ dữ liệu nhưng không đủ sức mạnh để xử lý, thì mọi thứ không thể diễn ra đúng như ý định, kết quả do máy học sẽ không chính xác.
Thứ hai, deep learning vẫn chưa thể nhận biết được những thứ phức tạp, ví dụ như các mối liên hệ thông thường. Chúng cũng sẽ gặp khó khăn khi cần nhận biết những thứ tương tự nhau. Lý do là vì hiện chưa có kĩ thuật nào đủ tốt để trí tuệ nhân tạo có thể rút ra những kết luận đó một cách logic. Bên cạnh đó, vẫn còn nhiều thách thức trong việc tích hợp kiến thức trừu tượng vào các hệ thống machine learning, ví dụ như thông tin về vật đó là gì, nó dùng để làm gì, người ta hay xài nó làm sao... Nói cách khác, machine learning chưa có được những kiến thức thông thường như con người.
Một ví dụ rất cụ thể cho các bạn dễ hiểu: trong một dự án của Google, một mạng lưới thần kinh được sử dụng để tạo ra bức ảnh của một quả tạ mà người ta hay cầm tập trong phòng gym. Kết quả đưa ra khá ấn tượng: hai vòng tròn màu xám được kết nối bằng một cái ống ngang. Nhưng ở giữa cái ống này còn có cánh tay của con người, và đây không phải là thứ nằm trong "đề bài". Lý do thì khá là dễ đoán: hệ thống được dạy về quả tạ bằng những tấm hình chụp người ta đang cử tạ, vậy nên dính tay người vào là chuyện hiển nhiên. Hệ thống có thể biết được quả tạ ra sao, nhưng nó không biết là quả tạo sẽ không bao giờ có cánh tay cả.
Mos Dang
Phan Khắc Tài
Chào bạn, mình nghĩ ai cũng sẽ trả lời là "Đúng rồi".
Deep learning hiện tại đang được xài cho nhiều tác vụ khác nhau. Các công ty công nghệ lớn thường lập riêng một bộ phận trí tuệ nhân tạo. Google, Facebook còn mở những hệ thống phần mềm machine learning của mình ra cho mọi người sử dụng. Google cũng mở một khóa học kéo dài 3 tháng về machine learning và deep learning.
Một vài ví dụ về machine learning đó là công cụ Google Photos. Nó có khả năng nhận biết và phân loại hình ảnh mà bạn chụp theo từng chủ đề khác nhau, thậm chí là theo từng khuôn mặt khác nhau một cách tự động. Hay Facebook M, một trợ lý ảo cá nhân nửa người nửa máy có thể giúp bạn đặt một số món hàng mà bạn muốn. Microsoft với Cortana, Google với Google Now và Apple với Siri đều là những ví dụ rất thực của trí tuệ nhân tạo.
Đây cũng là lý do vì sao mà trong thời gian gần đây chúng ta bắt đầu nghe nói nhiều về machine learning, deep learning và trí tuệ nhân tạo. Đó là vì các hãng tiêu dùng lớn đã bắt đầu nhảy vào cuộc chơi và đưa ra những sản phẩm thực tế mà người ta có thể cầm nắm và trải nghiệm. Trước đó, deep learning và machine learning chỉ nằm trong các phòng thí nghiệm ở những viện nghiên cứu và trường đại học mà thôi.
Ngoài ra, hệ thống các ứng dụng khác nhau với deep learning như sau:
- Hệ thống gợi ý trên các nền tảng:
Các nền tảng lớn hiện nay như Facebook, Amazon, Netflix,... đều có hệ thống gợi ý (recommend) rất mạnh giúp tăng đáng kể độ tương tác của người dùng. Cụ thể là chúng dựa trên các dữ liệu người dùng phát sinh ra khi dùng để gợi ý thêm những sản phẩm họ sẽ thích (trên các nền tảng mua sắm), những bộ phim họ sẽ muốn xem (vd. như trên Netflix), gợi ý các bài quảng cáo/được tài trợ (trên Facebook) hay các khóa học người học quan tâm (trên các nền tảng học online).
- Nhận diện hình ảnh
Mục tiêu của công nghệ nhận diện ảnh là nhận biết và xác định các đối tượng trong ảnh cũng như hiểu được nội dung và ngữ cảnh trong đó. Ví dụ trên cho thấy dịch vụ nhận diện và xác định khuôn mặt của AlchemyVision có khả năng phân biệt hai khuôn mặt tương tự nhau giữa nam diễn viên Will Ferrell và tay trống của Red Hot Chili Peppers, Chad Smith. Công nghệ nhận diện hình ảnh cũng được đưa vào Facebook để gợi ý người dùng tag mặt bạn bè hay ứng dụng vào khoa học tội phạm và điều tra.
- Phát hiện các loại bệnh hiếm gặp
Gần đây, trí tuệ nhân tạo Watson của IBM đã phát hiện ra một loại bệnh mà các bác sĩ đã bó tay không thể tìm ra ở một nữ bệnh nhân. Bằng cách so sánh bộ gene của người phụ nữ này với hơn 20 triệu kết quả nghiên cứu bệnh khác, Watson đã đưa ra kết quả là một chứng leukemia cực kỳ hiếm gặp chỉ trong 10 phút.
Tuy nhiên những hạn chế của Deep Learning cũng đầy ra:
Đầu tiên, deep learning cần một lượng dữ liệu đầu vào khổng lồ để máy tính có thể học hỏi. Quy trình này mất nhiều thời gian, nhiều sức mạnh xử lý mà chỉ có các server cỡ lớn mới làm được. Nếu không có đủ dữ liệu đầu vào, hay có đủ dữ liệu nhưng không đủ sức mạnh để xử lý, thì mọi thứ không thể diễn ra đúng như ý định, kết quả do máy học sẽ không chính xác.
Thứ hai, deep learning vẫn chưa thể nhận biết được những thứ phức tạp, ví dụ như các mối liên hệ thông thường. Chúng cũng sẽ gặp khó khăn khi cần nhận biết những thứ tương tự nhau. Lý do là vì hiện chưa có kĩ thuật nào đủ tốt để trí tuệ nhân tạo có thể rút ra những kết luận đó một cách logic. Bên cạnh đó, vẫn còn nhiều thách thức trong việc tích hợp kiến thức trừu tượng vào các hệ thống machine learning, ví dụ như thông tin về vật đó là gì, nó dùng để làm gì, người ta hay xài nó làm sao... Nói cách khác, machine learning chưa có được những kiến thức thông thường như con người.
Một ví dụ rất cụ thể cho các bạn dễ hiểu: trong một dự án của Google, một mạng lưới thần kinh được sử dụng để tạo ra bức ảnh của một quả tạ mà người ta hay cầm tập trong phòng gym. Kết quả đưa ra khá ấn tượng: hai vòng tròn màu xám được kết nối bằng một cái ống ngang. Nhưng ở giữa cái ống này còn có cánh tay của con người, và đây không phải là thứ nằm trong "đề bài". Lý do thì khá là dễ đoán: hệ thống được dạy về quả tạ bằng những tấm hình chụp người ta đang cử tạ, vậy nên dính tay người vào là chuyện hiển nhiên. Hệ thống có thể biết được quả tạ ra sao, nhưng nó không biết là quả tạo sẽ không bao giờ có cánh tay cả.