Phát hiện bất thường là một bước trong khai thác dữ liệu nhằm xác định các điểm dữ liệu, sự kiện hoặc quan sát khác với hành vi bình thường của tập dữ liệu. Dữ liệu bất thường có thể chỉ ra các sự cố nghiêm trọng, chẳng hạn như trục trặc kỹ thuật, như sự thay đổi hành vi trong quá trình sử dụng của người tiêu dùng. Máy học đang dần được sử dụng để tự động hoá việc phát hiện bất thường.
Phát hiện bất thường (Anomaly Dection) đã được chứng minh là phương pháp có giá trị trong nhiều lĩnh vực khác nhau như kinh tế, y tế, xâm nhập mạng…. Trong luận văn này, xây dựng một giải pháp phát hiện, dự đoán tấn công các phần mềm ứng dụng dùng chung tại Trung tâm Tích hợp dữ liệu bằng theo phương pháp học không giám sát (sử dụng đường cơ sở hành vi bình thường – Baselines Normal Behavior), phát hiện bất thường (Detection Abnormal). Dựa trên bộ công cụ Elastic Stack (Beat, Logstash, Elastic Search, Kibana) để thu thập và xử lý dữ liệu từ log ứng dụng, tạo các véc tơ đặc trưng và sau đó áp dụng thuật toán PCA để phát hiện những điểm bất thường trong dữ liệu log.