????:做數(shù)據(jù)采集用Python最佳,PHP不太推薦。推薦幾個庫吧:Python:1.requests 很好用的http庫,中文文檔:Requests: 讓 HTTP 服務人類2.BeautifulSoup 很好用很強大的html解析庫,中文文檔:Beautiful Soup 4.4.0 文檔3.Scrapy 知名爬蟲框架,中文文檔:Scrapy 0.25 文檔PHP:1.Guzzle 很好用PHP HT
做數(shù)據(jù)采集用Python最佳,PHP不太推薦。推薦幾個庫吧:
Python:
1.requests 很好用的http庫,中文文檔:Requests: 讓 HTTP 服務人類
2.BeautifulSoup 很好用很強大的html解析庫,中文文檔:Beautiful Soup 4.4.0 文檔
3.Scrapy 知名爬蟲框架,中文文檔:Scrapy 0.25 文檔
PHP:
1.Guzzle 很好用PHP HTTP庫,再也不用寫原生的curl了。中文文檔:快速入門 — Guzzle中文文檔
2.html-parser HTML解析庫,項目地址:GitHub - bupt1987/html-parser: php html parser,類似與PHP Simple HTML DOM Parser,但是比它快好幾倍
3.php-html-parser 老外的html解析庫,和上面那個用起來差不多,項目地址:GitHub - paquettg/php-html-parser: An HTML DOM parser. It allows you to manipulate HTML. Find tags on an HTML page with selectors just like jQuery.
4.phpspider 知乎上某人寫的php爬蟲庫,暫時沒用過,可以看看,項目地址:https://github.com/owner888/phpspider
至于數(shù)據(jù)庫,mongoDB、MySQL都可以。