0

    Không có sản phẩm nào trong giỏ hàng.

Một mô hình noron trong dự báo

1. Lý do chọn đề tài

 Trong những năm gần đây, khi công nghệ thông tin đang ngày càng phát triển mạnh mẽ thì vấn đề khai phá dữ liệu đã và đang trở thành một trong những hướng nghiên cứu chính trong lĩnh vực khoa học máy tính và công nghệ tri thức. Khai phá dữ liệu được ứng dụng thành công vào rất nhiều các lĩnh vực khác nhau như thương mại, tài chính, thị trường chứng khoán, y học, thiên văn học, sinh học, giáo dục và viễn thông..v.v.

Hình thức đào tạo tín chỉ là một phương pháp đào tạo tiên tiến trên thế giới và đang được áp dụng rộng rãi tại một số trường đại học của Việt Nam hiện nay. Ưu điểm của hình thức đào tạo này là tính liên thông giữa các hệ đào tạo, giữa các trường để tạo điều kiện cho việc hội nhập với giáo dục thế giới. Vì lý do đó mà chủ trương của nhà nước là mở rộng áp dụng hình thức đào tạo tín chỉ trong mạng lưới các trường đại học, cao đẳng trong nước giai đoạn 2001- 2010.

Trường Đại học ABC đã áp dụng hình thức học theo tín chỉ từ năm học ………. đến nay. Theo tinh thần của học chế tín chỉ sinh viên có thể tự xây dựng kế hoạch học tập cho cả quá trình học của mình suốt khóa học; Có nghĩa là tùy theo năng lực và điều kiện của bản thân sinh viên sẽ đăng ký môn học nhiều hay ít trong mỗi học kỳ nhưng vẫn đảm bảo đúng thời hạn đào tạo theo qui định của Nhà trường. Nhưng thực trạng hiện nay là hầu hết sinh viên vẫn đăng ký môn học theo kế hoạch đào tạo của chương trình khung theo học kỳ mà chưa có một sự định hình riêng con đường học tập của bản thân; Trường hợp những sinh viên giỏi có thể đăng ký để đẩy nhanh tiến độ học tập và rút ngắn thời gian đào tạo mà vẫn đảm bảo kết quả học tập tốt, phù hợp với điều kiện thời gian và năng lực; Trường hợp những sinh viên có năng lực yếu hơn có thể đăng ký dàn trải hơn sao cho kết quả học tập được giữ ở mức tốt nhưng vẫn tuân thủ thời gian đào tạo tại trường. Việc tự xây dựng một lộ trình tối ưu phù hợp với năng lực học tập của từng sinh viên theo tinh thần học chế tín chỉ hầu như vẫn chưa thể hiện được tính hiệu quả của nó.

Do đó việc xây dựng một công cụ hỗ trợ đề xuất cho sinh viên các lộ trình học tập phù hợp theo năng lực và điều kiện thời gian trong suốt khóa học là một nhu cầu cần thiết và hứa hẹn sẽ là công cụ đắc lực giúp cho sinh viên quản lý kế hoạch học tập một cách hiệu quả để chủ động hơn trong việc chuẩn bị hành trang cho tương lai của mình.

Trước những thách thức đặt ra về khai phá dữ liệu, để hỗ trợ tốt nhất cho sinh viên và tăng cường ứng dụng công nghệ thông tin trong hoạt động và quản lý đào tạo nhằm tăng hiệu quả đào tạo tại Trường Đại học ABC Vì vậy tôi quyết định chọn đề tài ứng dụng thuật toán khai phá dữ liệu để để tư vấn học tập cho sinh viên tại trường Đại học ABC làm đề tài tốt nghiệp luận văn cao học.

2. Mục tiêu và nhiệm vụ đề tài

2.1 Mục tiêu

  • Hiểu được các vấn đề liên quan đến khai phá dữ liệu.
  • Nghiên cứu lý thuyết cây quyết định và mạng nơron.
  • Áp dụng thuật toán cây quyết định và mạng nơron tư vấn chọn môn học cho sinh viên.
  • Hỗ trợ phòng Đào tạo, các Khoa chuyên ngành và các cố vấn học tập, giáo viên chủ nhiệm có thể tư vấn cho sinh viên trong việc chọn môn học.
  • Nâng cao hiệu quả hoạt động đảm bảo chất lượng giáo dục của Trường Đại học ABC.

 

2.2 Nhiệm vụ

Ø Về lý thuyết:

  • Tìm hiểu về khai phá dữ liệu.
  • Nghiên cứu các thuật toán về cây quyết định (Decision Tree) và mạng nơron nhân tạo (Neural Network).
  • Đánh giá các mô hình và dựa trên thuật toán nghiên cứu đề xuất mô hình phù hợp để giải quyết vấn đề.

Ø Về thực tiễn:

  •  Khảo sát thực tế, thu thập dữ liệu.
  • Ứng dụng thuật toán xây dựng phần mềm hỗ trợ tư vấn chọn môn học tự chọn cho sinh viên.

3. Đối tượng và phạm vi nghiên cứu

3.1. Đối tượng nghiên cứu

  • Các kỹ thuật và phương pháp khai phá dữ liệu.
  • Các thuật toán cây quyết định (Decision Tree) và mạng nơron nhân tạo (Neural Network) trong khai phá dữ liệu.

3.2. Phạm vi nghiên cứu

  • Các dữ liệu khảo sát ý kiến của sinh viên tại Trường Đại học ABC.
  • Các dữ liệu kết quả học tập của sinh viên tại Trường Đại học ABC.

4. Phương pháp nghiên cứu

Ø Về lý thuyết:

  • Nghiên cứu lý thuyết các tài liệu liên quan đến đề tài.

Ø Về thực nghiệm:

  • Thu thập, phân tích và xử lý dữ liệu.
  • Cài đặt phần mềm trên mẫu dữ liệu.

 

5. Giải pháp đề xuất

5.1. Mô tả bài toán

  • Ngày nay các chương trình đào tạo được thực hiện theo học chế tín chỉ nhằm tạo điều kiện thuận lợi cho quá trình học tập của sinh viên cũng như tăng cường khả năng tự học.
  • Trong đó việc lựa chọn môn học phù hợp với thời gian, điều kiện đối với các môn bắt buộc theo chương trình đào tạo đã tạo ra một kết quả khả quan trong thời gian quan giúp sinh viên chủ động hơn trong việc học tập.
  • Sau khi kết thúc mỗi môn học nhà trường thực hiện nhập điểm môn học vào phần mềm theo chương trình đào tạo của từng học kỳ.

 

Hình 5.1 Ví dụ chương trình đào tạo học kỳ 1

  • Tuy nhiên bên cạnh đó cũng phát sinh một số boăn khoăn trong việc đăng ký môn học tự chọn cho học kỳ tiếp theo của sinh viên trong đó có 3 vấn đề chính là:
  • Chọn môn học nào để phù hợp với năng lực?
  • Chọn môn học nào để phù hợp với nghề nghiệp tương lai?
  • Chọn môn học nào để được điểm cao?
  • Môn tự chọn trong học kỳ tiếp theo:

 

Hình 5.2 Môn tự chọn trong học kỳ 2

5.2. Mô hình đề xuất:

  • Để giải quyết vấn đề đó. Đề tài đề xuất mô hình khai thức dữ liệu điểm học tập của sinh viên với mô hình tổng quát như sau:

Hình 5.3 Mô hình đề xuất

6. Ý nghĩa khoa học và thực tiễn đề tài

Ø Vkhoa hc: Hiểu được khai phá dữ liệu và ứng dụng các thuật toán cây quyết định và mạng nơron trong khai phá dữ liệu vào ứng dụng.

Ø Vthc tin:

  • Đề tài sẽ góp phần xây dựng được ứng dụng gợi ý chọn môn học tự chọn trợ giúp trong việc chọn môn học của sinh viên và từ đó cung cấp các thông tin hiệu quả cho Ban lãnh đạo.
  • Việc xây dựng phần mềm dự đoán kết quả học tập sẽ hỗ trợ cho sinh viên trong việc lựa chọn phương pháp học và môn học để đạt kết quả tốt trong các học kỳ kế tiếp.
  • 7. Kết quả dự kiến

7.1. Lý thuyết

  •  Hiểu được các thuật toán cây quyết định và mạng nơron trong khai phá dữ liệu.

7.2. Thực tiễn

  • Áp dụng được phương pháp học theo cây quyết định và học theo mạng nơron trong khai phá dữ liệu để xây dựng phần mềm dự đoán kết quả học tập của sinh viên.
  •  Thực nghiệm với dữ liệu mẫu.

 

 

 

 

 

8. Bố cục của luận văn

Báo cáo của luận văn dự kiến tổ chức thành 3 chương chính như sau:

MỞ ĐẦU

CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU

1.1. KHAI PHÁ DỮ LIỆU VÀ QUÁ TRÌNH KHAI PHÁ DỮ LIỆU

1.1.1. Khai phá dữ liệu

1.1.2. Các kỹ thuật và phương pháp khai phá dữ liệu

1.2. KỸ THUẬT KHAI PHÁ DỮ LIỆU BẰNG CÂY QUYẾT ĐỊNH

1.2.1. Giới thiệu mô hình cây quyết định

1.2.2. Các bước chính để xây dựng cây

1.2.3. Một số ưu điểm của cây quyết định

1.2.4. Một số điểm yếu của cây quyết định

1.2.5. Thuật toán ID3

1.3. KỸ THUẬT KHAI PHÁ DỮ LIỆU BẰNG MẠNG NƠRON NHÂN TẠO

1.3.1. Giới thiệu mạng nơron nhân tạo

1.3.2. Mô hình mạng nơron nhân tạo

1.3.3. Phân loại cấu trúc mạng nơron nhân tạo

1.3.4. Các hình thức học của mạng nơron nhân tạo

1.3.5. Một số phương pháp huấn luyện mạng nơron nhân tạo

1.3.6. Phương pháp huấn luyện mạng nơron bằng thuật toán lan truyền ngược

1.3.7. Hướng tiếp cận của mạng Nơron lan truyền ngược

1.3.8. Thuật toán lan truyền ngược

1.4. TỔNG KẾT CHƯƠNG

CHƯƠNG 2: ỨNG DỤNG THUẬT TOÁN PHÂN CỤM ĐỐI VỚI Ý KIẾN PHẢN HỒI TỪ NGƯỜI HỌC

2.1. PHÂN TÍCH BÀI TOÁN

2.3. ÁP DỤNG ID3 VÀ MẠNG NƠRON NHÂN TẠO GIẢI QUYẾT VẦN ĐỀ

2.4. THIẾT KẾ MÔ HÌNH

2.5. TỔNG KẾT CHƯƠNG

CHƯƠNG 3: PHÁT TRIỂN ỨNG DỤNG

3.1. THU THẬP VÀ XỬ LÝ DỮ LIỆU

3.2. ÁP DỰNG THUẬT TOÁN XÂY DỰNG PHẦN MỀM

3.3. DEMO ỨNG DỤNG

3.4. ĐÁNH GIÁ ỨNG DỤNG

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

9. Kế hoạch dự kiến triển khai đề tài

 

 

TÀI LIỆU THAM KHẢO

Tiếng Anh

[1]. Pieter Adriaans, Dolf Zantinge, Data Mining, Addison - Wesley, 1998.

[2]. T. Bhavani, Data Mining: Technologies, Techniques, Tools and Trends. CRC Press 1999.

[3]. Robert Nisbet, John Elder, Gary Miner, Handbook of Statistical Analysis and Data Mining Applications, Elsevier Inc, 2009.

[4]. Jiawei Han and Micheline Kamber, Data Mining Concepts and Techniques, Elsevier Inc, 2006.

[5]. Elmasri, Navathe, Somayajulu, Gupta, Fundamentals of Database Systems (the 4th Edition), Pearson Education Inc, 2004.

[6]. P. N. Tan, M. Steinbach, V. Kumar, Introduction to Data Mining, Addison-Wesley, 2006.

[7]. Ian H., Eibe Frank, Data Mining: Practical Machine Learning Tools and Techniques, Morgan Kaufmann, 2005.

[8]. M.Kantardzic: Data Mining: Concepts, Models, Method, and Algorithms, John Wiley & Sons, New York, NY, (2003).

[9]. O'Reilly Media, Inc, 2009, Programming Entity Framework, 1st Edition.

[10]. Rob Cameron and Dale Michalk, 2004, Building ASP.NET Server Controls.