PHƯƠNG PHÁP TẠO CÂY ĐỊNH DANH ID3
Bước 1: Phân loại thuộc tính dẫn xuất và thuộc tính mục tiêu
Thuộc tính mục tiêu: là thuộc tính quan tâm.
Thuộc tính dẫn xuất: là thuộc tính quan quan sát.
Bước 2: Với mỗi thuộc tính dẫn xuất A, tính độ hỗn loạn
bt là tổng số phần tử có trong phân hoạch
bj là tổng số phần tử có thuộc tính dẫn xuất A có giá trị j.
bri : tổng số phần tử có thuộc tính dẫn xuất A có giá trị j và thuộc tính mục tiêu có giá trị i.
Bước 3: Chọn thuộc tính có độ hỗn loạn thấp nhất để phân hoạch.
Bước 4: Loại bỏ các thuộc tính đã được phân hoạch.
Nếu vẫn còn thuộc tính đẫn xuất quay lại bước 2 để tính độ hỗn loạn cho các thuộc tính dẫn xuất.
Ngược lại, kết thúc thuật toán.