TÌM HIỂU CÔNG CỤ SRILM VÀ XÂY DỰNG ỨNG DỤNG GỢI Ý SỬA LỖI CHÍNH TẢ TIẾNG VIỆT
Mô hình ngôn ngữ là một thành phần quan trọng trong các ứng dụng như nhận dạng tiếng nói, phân đoạn từ, dịch thống kê, … Và chúng thường được mô hình hóa sử dụng các n-gram. Trên thế giới đã có rất nhiều nước công bố nghiên cứu về mô hình ngôn ngữ áp dụng cho ngôn ngữ của họ nhưng ở Việt Nam, việc nghiên cứu và xây dựng một mô hình ngôn ngữ chuẩn cho tiếng Việt vẫn còn mới mẻ và gặp nhiều khó khăn. Chính điều này đã gợi ý và thúc đẩy nhóm chúng em lựa chọn và tập trung nghiên cứu vấn đề này để có thể tạo điều kiện cho việc xử lý ngôn ngữ tiếng Việt vốn vô cùng phong phú của chúng ta.
Chương 1: Giới thiệu đề tài: trình bày giới thiệu tổng quan về toàn đề tài mục tiêu đề tài, phương pháp nguyên cứu, môi trường thực hiện.
Chương 2: Giới N-gram: khó khăn còn tồn tại các phương phương pháp làm mịn. Trình bày khái quát lý thuyết về mô hình ngôn ngữ, các pháp khắc phục, trong đó trognj tâm nghiên cứu các
Chương 3: SIRLM: trình bày giới thiệu cài đặt và sử dụng bộ công cụ mã nguồn mở SRILM.
Chương 4: Dữ liệu: trình bày Giới thiệuvà các bước xử lý dữ liệu.
Chương 5: Ứng dụng: trình bày ý tưởng, cách xây dựng mô hình và cuối cùng là xây dựng ngôn ngữ.