Crawler, Spider, Scraper
Crawl dữ liệu (hay web crawling, web scraping) là quá trình thu thập hoặc trích xuất dữ liệu thô (raw data) từ các nguồn, đặc biệt là từ các trang web trên Internet, một cách tự động. Data này rất cần cho việc khai thác sức mạnh của AI.