Trong gia đoạn nay chúng tôi tập trung vào các mục đích sau:
+ Tìm hiểu về ngôn ngữ lập trình Python.
+ Tìm hiểu bộ thư viện BigGorilla, gồm các gói: Data Acquisition, Extraction, and Cleaning; Entity Matching; Schema Matching and Mapping; Additional Data Preparation Tools.
+ Demo minh họa việc khai thác, thu thập và tổng hợp dữ liệu văn bản trên web (dữ liệu hồ sơ ứng viên tìm việc, hoặc dữ liệu khác…) bằng việc dùng các thư viện trên.