Advantage of CNN and RNN?

  1. Trí tuệ nhân tạo

Lợi ích của việc kết hợp giữa CNN và RNN là gì ? Mình thấy trong xử lý video hay dùng kiểu kết hợp này.

Từ khóa: 

ai

,

trí tuệ nhân tạo

CNN - Biểu diễn dữ liệu dạng ảnh.

RNN - Dùng chủ yếu biểu diễn dữ liệu thời gian như giọng nói, audio.

Kết hợp RNN + CNN - Biểu diễn dữ liệu ảnh và thời gian --> Video

Cách giải thích dễ hiểu nhất có thể.

Trả lời

CNN - Biểu diễn dữ liệu dạng ảnh.

RNN - Dùng chủ yếu biểu diễn dữ liệu thời gian như giọng nói, audio.

Kết hợp RNN + CNN - Biểu diễn dữ liệu ảnh và thời gian --> Video

Cách giải thích dễ hiểu nhất có thể.

Bài viết này là một ý tưởng trong xử dụng CNN1D và RNN. CNN1D cũng giống tương tự dạng CNN2D, network được xử dụng nhiều trong xử lý ảnh. Ý tưởng CNN1D là trượt dài các đoạn trên mẫu 1D. Việc kết hợp CNN1D và RNN thường dùng trong xử lý các input có cấu trúc dài, ví dụ như dịch một câu dài. Ý tưởng, dùng để chia nhỏ các mẫu dữ liệu dài, và dùng RNN để xử lý các cấu trúc nhỏ hơn. Một nhược điểm của việc áp dụng CNN+RNN là khá nhạy cảm với mẫu có thứ tự vì chỉ trượt dài trên mẫu với một strike cố định. Một cách khác có thể hiểu về CNN giống như xử dụng n-grams trong word2vect.

Trong xử lý ngôn ngữ, CNN thường dùng để bổ sung các đặc trưng mức cao hơn mức từ, như mức cú pháp hay mức ngữ nghĩa. Do đó có thêm CNN trước RNN có thể tăng độ chính xác của các bài toán sequence labeling và classification.