Hướng xử lý câu phức (câu ghép) trong chatbot?

  1. Trí tuệ nhân tạo

Trong chatbot thì phần detect intent và extract entity là rất quan trọng của khối NLU. Mình đang gặp chút khó khăn về định hướng xử lý câu phức, câu dài trong NLU. Kính nhờ các chuyên gia trong Noron! hỗ trợ nhé.

Từ khóa: 

chatbot

,

trí tuệ nhân tạo

Nếu bạn cho một số ví dụ cụ thể thì chắc sẽ dễ hình dung về khó khăn của bạn hơn. Bạn nói "gặp chút khó khăn" nhưng người đọc chưa biết cụ thể đó là khó khăn gì. Dưới đây là mình suy đoán khó khăn của bạn để có một số bình luận.

Với bài toán entity extraction thì câu dài hay câu ngắn không ảnh hưởng lắm, vì mục đích của nó là trích ra được các entities trong câu đó.

Còn với bài toán intent detection, câu phức thường có nhiều intent, người hỏi muốn hỏi nhiều vấn đề cùng lúc. Cách thông thường để xử lí là:

  • Hoặc tìm top-k intents của câu đó (thường dựa trên một phương pháp phân loại xác suất có ranking) và xử lí intent có khả năng cao nhất hoặc hợp lí nhất với luồng hội thoại hiện tại.
  • Hoặc tìm cách cắt câu phức thành một số câu đơn và xử lí từng câu đơn.


Trả lời

Nếu bạn cho một số ví dụ cụ thể thì chắc sẽ dễ hình dung về khó khăn của bạn hơn. Bạn nói "gặp chút khó khăn" nhưng người đọc chưa biết cụ thể đó là khó khăn gì. Dưới đây là mình suy đoán khó khăn của bạn để có một số bình luận.

Với bài toán entity extraction thì câu dài hay câu ngắn không ảnh hưởng lắm, vì mục đích của nó là trích ra được các entities trong câu đó.

Còn với bài toán intent detection, câu phức thường có nhiều intent, người hỏi muốn hỏi nhiều vấn đề cùng lúc. Cách thông thường để xử lí là:

  • Hoặc tìm top-k intents của câu đó (thường dựa trên một phương pháp phân loại xác suất có ranking) và xử lí intent có khả năng cao nhất hoặc hợp lí nhất với luồng hội thoại hiện tại.
  • Hoặc tìm cách cắt câu phức thành một số câu đơn và xử lí từng câu đơn.