việc phát hiện để ngăn chặn hay giảm thiểu các cuộc tấn công DDoS là một điều hết sức cần thiết trong giai đoạn Internet phát triển như hiện nay. Do lưu lượng của các cuộc tấn công từ chối dịch vụ chủ yếu tập trung từ các mạng Botnet nên nhóm đề xuất hướng nghiên cứu và ứng dụng các thuật toán máy học được học tập thông qua bộ dữ liệu lưu lượng mạng trong thực tế (bộ dữ liệu CTU-13 [2]) để phát hiện lưu lượng Botnet nói chung cũng như lưu lượng độc hại từ các cuộc tấn công từ chối dịch vụ phân tán (DDoS) hay tấn công từ chối dịch vụ (DoS) nói riêng. Từ đó, ứng dụng vào giải quyết bài toán phát hiện lưu lượng tấn công DDoS để giúp ích cho việc quản trị cũng như bảo mật hệ thống mạng của các cá nhân hay công ty, doanh nghiệp nhỏ, lẻ khác.
Nội dung khoá luận sẽ bao gồm những chương sau:
Chương 1: Tổng quan, giới thiệu về các phương pháp và hướng tiếp cận phát hiện tấn công từ chối dịch vụ phân tán (DDoS), ưu nhược điểm của các phương pháp và hướng tiếp cận đó, khó khăn và thách thức, đưa ra hướng tiếp cận của nhóm.
Chương 2: Tấn công DDoS và mạng Botnet, trình bày các lý thuyết liên quan đến tấn công từ chối dịch vụ phân tán (DDoS) và mạng Botnet.
Chương 3: Cơ sở lý thuyết, trình bày các cơ sở lý thuyết từ đề tài bao gồm các thuật toán máy học như Decision Tree, Random Forest, Naive Bayes, Logistic Regression, K-Nearest Neighbors, XGBoost, các phương pháp xử lý trên tập dữ liệu mất cân bằng, xử lý dữ liệu rỗng, xử lý biến/ giá trị phân loại, feature selection, feature scaling,…
Chương 4: Xây dựng ứng dụng và mô hình máy học, trình bày cách xây dựng ứng dụng cho bài toán phát hiện tấn công từ chối dịch vụ (DDoS), sơ đồ xây dựng mô hình máy học.
Chương 5: Kết quả thực nghiệm và ứng dụng, trình bày kết quả thực nghiệm, kết quả ứng dụng và nêu hướng phát triển của đề tài.