Từ giữa những năm 2012, các công nghệ học máy bắt đầu được sinh ra với ưu điểm vượt trội về tốc độ xử lý và độ phức tạp mang lại nhiều thành quả cho bài toán nhận diện người nói. Tuy nhiên, đến năm 2015 thực sự các bước đột phá đã xuất hiện khi công nghệ học sâu (Deep Learning) xuất hiện, bằng sự phân lớp trên các mô hình mạng neuron tích chập, trích chọn đặc trưng bằng học sâu thực sự đã đem lại nhiều thành tựu cho bài toán nhận diện người nói. Với mong muốn nghiên cứu và ứng dụng những công nghệ học sâu vào thực tiễn cuộc sống, chúng em định hướng “Nghiên cứu nhận dạng người nói (Speaker recognition) và xây dựng ứng dụng” cho khóa luận tốt nghiệp.
Ý nghĩa khoa học:
Nghiên cứu các ưu điểm của mô hình học sâu, xây dựng và huấn luyện mô hình học máy nhằm tăng độ hiệu quả, độ chính xác, giảm sai số của các mô hình mới. Tạo tiền đề căn bản để phát triển, đề xuất và tạo các mô hình riêng thuần tuý cho nhận diện người nói.
Ý nghĩa thực tiễn:
Tiềm năng rất lớn cho tất cả bài toán liên quan sinh trắc học người nói, đề tài có tiềm năng nhằm mang lại những công cụ hữu ích, tích hợp vào nhiều loại thiết bị, hạ tầng từ phức tạp đến giản đơn.