0

    Không có sản phẩm nào trong giỏ hàng.

Nghiên cứu khai thác dữ liệu và ứng dụng tìm kiếm trích chọn thông tin theo chủ đề

Nghiên cứu khai thác dữ liệu và ứng dụng tìm kiếm trích chọn thông tin theo chủ đề

Mụctiêu và nhiệm vụ nghiên cứu

Mục đích của đề tài là nghiên cứu áp dụng tìm kiếm và tríchchọn mẫu mới, hữu ích, hiểu được, tiềm ẩn trong tài liệu. Những thông tin theo chủ đề nhanh, chính xác và đầy đủ, thông tin tiềm ẩn bên trong nội dung tài liệu đó và những thông tin quan trọng hay những luồng thông tin tốt nhất tìm kiếm trả về kết quả phù hợp với yêu cầu người dùng.

Mục tiêu cụ thể

Nghiên cứu tìm kiếm

                Nghiên cứu kỹ thuật tìm kiếm .

                Hiệu quả tìm kiếm một cách nhanh chóng và chính xác.

                Thông tin tìm kiếm tài liệu đầy đủ nguyên vẹn, cô động.

Nghiên cứu về trích chọn

                Những thông tin cần khai thác còn tìm ẩn trong một câu, mộtvùng văn bản và một phân vùng của tài liệu .

                Những vấn đề khó khăn khi thực hiện về việc trích chọn thông tin chủ đề  ẩn trong tài liệu.

 

 

Ứng dụng thực tế

Sử dụng quy trình khai phá dữ liệu trongviệc tìm kiếm trích chọn thông tin theo chủ đề trên những trang Web vào thực tế để đáp ứngtheo yêu cầu người dùng.

Lấy được những thông tinquí giá tìm ẩnbên trong TÀI LIỆU đó,để đáp ứng được nhu cầutìm kiếm tối ưu cho người dùng.

Tìm kiếmtrích chọn các mẫu hoặc tri thức hấp dẫn (khôngtầm thường, ẩn, chưa biết và hữu dụng tiềm năng) từ một tập hợp lớn dữ liệu.để kết quả đạt được đáp ứng yêu cầu xã hội hiện nay.

 

Cụ thể nghiên cứu:

-Rút trích dữ liệu

- Đánh chỉ mục (Lucene Index)

- Tạo chủ đề cho văn bản (LDA)

 

 

 

 

TÀI LIỆU THAM KHẢO

    1. Nguyễn Quang Vũ. Xây dựng chương trình quản lý công văn trường Đại Học Bách Khoa Đà Nẵng. Khoa Công Nghệ Thông Tin, trường Đại Học Bách Khoa Đà Nẵng.
    2. Nguyễn Thanh Nga, Trần Thanh Quỳnh. Lucene in action.
    3. Trần Thị Hoàng Thảo. Xây dựng hệ thống truy xuất thông tin. Khoa Công Nghệ Thông Tin, trường Đại Học Bách Khoa Hà Nội.
    4. Phạm Thị Ngọc. Phát triển chương trình thử nghiệm áp dụng kỹ thuật chỉ mục và kỹ thuật tìm kiếm văn bản theo nội dung trong cơ sở dữ liệu đa phương tiên. Khoa Công Nghệ Thông Tin, viện Công Nghệ Thông Tin Hà Nội.
    5. Michael McCandless, Erik Hatcher, Otis Gospodnetic’. Lucene In Action Second Edition