Mục tiêu của đề tài là nghiên cứu nắm bắt được những vấn đề cốt lõi của mô hình ngôn ngữ N-gram, đặc biệt là các kỹ thuật làm mịn các phân bố xác suất thống kê (Smoothing techniques), nhằm nâng cao chất lượng về xác suất mô hình. Ngoài ra, đề tài hướng tới việc đưa ra một ứng dụng cụ thể của mô hình này cho tiếng Việt, mà cụ thể là bài toán sửa lỗi chính tả trong tiếng Việt: Cho người dùng nhập văn bản cần kiểm tra. Kiểm tra và sửa lỗi chính tả