Thể loại: Xử lý ngôn ngữ

Chứa các bài viết về lĩnh vực xử lý ngôn ngữ tự nhiên và các ứng dụng trong lĩnh vực này.

Xử lý ngôn ngữ tự nhiên 0

Bài toán tách từ tiếng Việt

Ngôn ngữ tiếng Việt là một ngôn ngữ rất phức tạp, việc tách từ tiếng Việt không phải đơn giản như ngôn ngữ tiếng Anh, tiếng Pháp, v.v. là việc dựa vào khoảng trắng giữa giữa các từ. Khoảng trắng giữa các từ trong văn bản chỉ có ý nghĩa phân tách các âm tiết với nhau. Vì vậy để xử lý tiếng Việt bài toán tách từ (word segmentation) là bài toán cơ bản và quan trong nhất.

Xử lý ngôn ngữ tự nhiên 0

Những vấn đề xử lý Tiếng việt

Đây là bài viết khá hay của thầy Hồ Tú Bảo, tại Viện Khoa học và Công nghệ tiên tiến Nhật bản. Bài viết giới thiệu những khái niệm cơ bản và tình hình nghiên cứu về xử lý ngôn ngữ nói chung, cũng như những nội dung và khó khăn trong xử lý tiếng Việt (văn bản và tiếng nói).

EnglishVietnamese