THUÂT TOÁN QUINLAN
I. Mô tả thuật toán
Bước 1: Đọc dữ liệu đưa vào datatable và hiển thị lên datagridview
Bước 2: Xử lý dữ liệu tách thuộc tính dẫn xuất và thuộc tính mục tiêu vào hai list theo định dạng rồi tính vector
VA(j) = ( T(j , r1), T(j , r2) , ..., T(j , rn) )
T(j, ri) = (tổng số phần tử trong phân hoạch có giá trị thuộc tính dẫn xuất A là j và có giá trị
thuộc tính mục tiêu là ri ) / ( tổng số phần tử trong phân hoạch có giá trị thuộc tính dẫn xuất A
là j )
* r1, r2, ... , rn là các giá trị của thuộc tính mục tiêu
Bước 3: Chọn thuộc tính có nhiều vector đơn vị nhất để phân hoạch.
Vector đơn vị là vector có duy nhất một thành phần có giá trị 1 và những thành phần khác có
giá trị 0.
Bước 4: Loại bỏ các thuộc tính đã được phân hoạch.
Nếu vẫn còn thuộc tính dẫn xuất quay lại bước 2 để tính vector đặc trưng cho các thuộc tính
dẫn xuất.
Ngược lại, kết thúc thuật toán.
II. Demo thuật toán
Chọn Open để mở file load dữ liệu vào và hiển thị bằng datagridview
Chọn Excute để thực hiện tính toán và hiện kết quả bằng đồ thị