Bài toán tách từ tiếng Việt
Ngôn ngữ tiếng Việt là một ngôn ngữ rất phức tạp, việc tách từ tiếng Việt không phải đơn giản như ngôn ngữ tiếng Anh, tiếng Pháp, v.v. là việc dựa vào khoảng trắng giữa giữa các từ. Khoảng trắng giữa các từ trong văn bản chỉ có ý nghĩa phân tách các âm tiết với nhau. Vì vậy để xử lý tiếng Việt bài toán tách từ (word segmentation) là bài toán cơ bản và quan trong nhất.