Vận dụng máy học và kỹ thuật phân cụm để xây dựng hệ thống thực hiện phân cụm các loại dữ liệu
Nhiệm vụ và nội dung:
Tìm hiểu lý thuyết đánh giá cảm quan rượu.
Tìm hiểu lý thuyết ann/svm.
Tìm hiểu kỹ thuật gom cụm (DB_SCAN, k-MEANs)và huấn luyện mạng nơron dùng giải thuật lan truyền ngược (backpropagation).
Hiện thực và thực nghiệm chương trình dự báo đánh giá cảm quan trên sản phẩm rượu trắng và so sánh kết quả thực nghiệm chương trình giữa huấn luyện có kết hợp kỹ thuật gom cụm và không kết hợp kỹ thuật gom cụm
Nhận xét:
Đối với kết quả kiểm thử nếu ta chọn 4 mẫu như trên thì kết quả dự đoán của ID3, C4.5 và SVM tốt hơn dùng kỹ thuật mạng nơron tuy nhiên kết quả của mạng nơron cũng là khá tốt.
Mặc dù vậy đối với các thuật toán dùng vây quyết định khi mà trong tập huấn luyện với độ phủ chưa đủ nhằm tạo ra một cây quyết định hoàn chỉnh thì không thể đưa ra lời tư vấn. Đối với phương pháp dùng mạng nơron điều đó hoàn toàn khả thi chúng thực hiện học tuyến tính cho ra kết quả là các tham số vì vậy với bất kỳ giá trị kiểm thử thì chúng hoàn toàn cho ra một lời tư vấn tương ứng với độ sai số chấp nhận.
Với kết quả như trên hoàn toàn chấp nhận được trong quá trình tư vấn điểm môn học cho sinh viên.
TÀI LIỆU THAM KHẢO
[1]. R. Agrawal and Ramakrishnan Srikant (1994), Fast
algorithms for mining association rules. In Proc. of the
20th Int’l Conf. on Very Large Databases
[2]. N. Bendakir and E. Aimeur. Using association rules
for course recommendation. In Proceedings of the
AAAI Workshop on Educational Data Mining, July
16-17 2006
[3]. F. Castro, A. Vellido, A. Nebot, F. Mugica. Applying
Data Mining Techniques to e-Learning Problems
[4]. J. Han and M. Kamber: Data Mining: Concepts
and Techniques, Morgan Kaufmann, San
Francisco, CA, (2000).
[5]. J. Hipp, U. Guntzer, and G. Nakaeizadeh. Algorithms
for Association Rule Mining - A General Survey and
Comparison. In Proc. ACM SIGKDD International
Conference on Knowledge Discovery and Data
Mining, 2000
[6]. Ho Tu Bao: Introduction to Knowledge Discovery and
Data Mining, Institute of Information Technology.
[7]. Margaret H. Dunham, Yongqiao Xiao, Le Gruenwald,
Zahid Hossain, "A Survey of Association Rules”, 2000
[8]. RYAN S.J.D. BAKER, K. YACEF. The State of
Educational Data Mining in 2009: A Review and
Future Visions
[9]. C.Vialardi, J. Bravo, L. Shafti, A. Ortigosa.
Recommendation in Higher Education Using Data
Mining Techniques
[10]. I. H. Witten and E. Frank: Data Mining: Practical
Machine Learning Tools and Techniques with
Java Implementations, Morgan Kaufmann Publishers,
New York, NY, (2000)