Thể loại: Nghiên cứu

Liên quan các bài viết về các lĩnh vực nghiên cứu

0

Bài toán tách từ tiếng Việt

Ngôn ngữ tiếng Việt là một ngôn ngữ rất phức tạp, việc tách từ tiếng Việt không phải đơn giản như ngôn ngữ tiếng Anh, tiếng Pháp, v.v. là việc dựa vào khoảng trắng giữa giữa các từ. Khoảng trắng giữa các từ trong văn bản chỉ có ý nghĩa phân tách các âm tiết với nhau. Vì vậy để xử lý tiếng Việt bài toán tách từ (word segmentation) là bài toán cơ bản và quan trong nhất.

0

Những vấn đề xử lý Tiếng việt

Đây là bài viết khá hay của thầy Hồ Tú Bảo, tại Viện Khoa học và Công nghệ tiên tiến Nhật bản. Bài viết giới thiệu những khái niệm cơ bản và tình hình nghiên cứu về xử lý ngôn ngữ nói chung, cũng như những nội dung và khó khăn trong xử lý tiếng Việt (văn bản và tiếng nói).