QueryList3更新日志
經(jīng)過不斷的迭代,PHP采集利器QueryList迎來了QueryList3!
下面來看看QueryList3有何改變吧:
1.調(diào)整參數(shù),不再兼容以前版本
2.使用psr-4
3.使用composer
4.更改屬性名jsonArr為data
5.廢棄getJson方法
6.加入getData、getHtml、getInstance以及run方法
7.加入擴展功能,通過擴展可以實現(xiàn)多線程批量采集,模擬登陸采集等功能,讓QueryList變得無限可能。
8.改進還有諸如:進一步降低了亂碼出現(xiàn)的幾率、增強了內(nèi)置的源碼抓取方法、實現(xiàn)無限級別嵌套采集等。
現(xiàn)介紹已有的示例擴展:
1.Request擴展,可以實現(xiàn)如攜帶cookie、偽造來路等任意復(fù)雜的網(wǎng)絡(luò)請求,再也不用擔心QueryList內(nèi)置的抓取功能太弱了。
2.Login擴展,可以實現(xiàn)模擬登陸然后采集。
3.Multi擴展,多線程(多進程)采集擴展。
擴展通過QueryList::run 方法運行。
使用Composer安裝(當然也可以不使用這種方式):
QueryList以及其依賴:composer require jaeger/querylist
QueryList擴展需要選擇性的單獨安裝:
Request網(wǎng)絡(luò)操作擴展:composer require jaeger/querylist-ext-request
Multi多線程擴展:composer require jaeger/querylist-ext-multi
Login模擬登陸擴展:composer require jaeger/querylist-ext-login
包含QueyListy以及擴展的完整配置如下:
{ "require": { "jaeger/querylist": "^3.1", "jaeger/querylist-ext-request":"^1.0", "jaeger/querylist-ext-multi":"^1.0", "jaeger/querylist-ext-login":"^1.0" } }
以下類庫是上面擴展的依賴,安裝擴展的時候會自動安裝,也可以選擇單獨引入使用:
Http類:composer require jaeger/http
CurlMulti多線程類:composer require jaeger/curlmulti