Cùng với tốc độ phát triển bùng nổ của lĩnh vực công nghệ thông tin, lượng dữ liệu từ các hệ thống thông tin, ứng dụng ngày càng gia tăng và được lưu trữ thành các tập dữ liệu lớn. Khai phá dữ liệu đóng vai trò rất quan trọng trong việc phát hiện ra những tri thức tiềm ẩn, hữu dụng từ các tập dữ liệu lớn nói trên. Tuy nhiên, do ràng buộc pháp lý về luật riêng tư và chính sách bảo mật thông tin của các cá nhân, tổ chức nên nhiều tổ chức và cá nhân không được phép cung cấp tập dữ liệu cho quá trình khai phá (ví dụ: dữ liệu cá nhân của khách hàng trong một ngân hàng, dữ liệu bệnh lý của bệnh nhân,...). Do đó vấn đề đặt ra là làm thế nào để cho phép thực hiện quá trình khai phá dữ liệu trên các tập dữ liệu trong khi vẫn bảo vệ được các thông tin riêng tư của cá nhân và tổ chức có trong dữ liệu. Các giải pháp để giải quyết vấn đề này đã xuất hiện từ những năm 2000, được gọi chung là khai phá dữ liệu đảm bảo tính riêng tư (Privacy Preserving Data Mining-PPDM). Ví dụ như trong lĩnh vực ngân hàng, dữ liệu của khách hàng được lưu trữ tại các ngân hàng có chứa rất nhiều thông tin riêng tư như: thu nhập, các khoản nợ, số tiền gửi tiết kiệm,... Chính vì vậy việc khai phá dữ liệu trực tiếp trên tập dữ liệu khách hàng được lưu trữ tại các ngân hàng là rất khó khăn bởi các thông tin riêng tư kể trên là không được phép công bố hoặc tiết lộ. Thông qua đề tài này, nhóm muốn giảm thiểu sự rủi ro về tài khoản cá nhân của các khách hàng bị lộ tại các ngân hàng, đồng thời cũng giúp các ngân hàng giải quyết rủi ro về mặt tài chính và tăng độ tin cậy cho khách hàng khi đến giao dịch tại ngân hàng.