QueryList3更新日志
經過不斷的迭代,PHP采集利器QueryList迎來了QueryList3!
下面來看看QueryList3有何改變吧:
1.調整參數,不再兼容以前版本
2.使用psr-4
3.使用composer
4.更改屬性名jsonArr為data
5.廢棄getJson方法
6.加入getData、getHtml、getInstance以及run方法
7.加入擴展功能,通過擴展可以實現多線程批量采集,模擬登陸采集等功能,讓QueryList變得無限可能。
8.改進還有諸如:進一步降低了亂碼出現的幾率、增強了內置的源碼抓取方法、實現無限級別嵌套采集等。
現介紹已有的示例擴展:
1.Request擴展,可以實現如攜帶cookie、偽造來路等任意復雜的網絡請求,再也不用擔心QueryList內置的抓取功能太弱了。
2.Login擴展,可以實現模擬登陸然后采集。
3.Multi擴展,多線程(多進程)采集擴展。
擴展通過QueryList::run 方法運行。
使用Composer安裝(當然也可以不使用這種方式):
QueryList以及其依賴:composer require jaeger/querylist
QueryList擴展需要選擇性的單獨安裝:
Request網絡操作擴展:composer require jaeger/querylist-ext-request
Multi多線程擴展:composer require jaeger/querylist-ext-multi
Login模擬登陸擴展:composer require jaeger/querylist-ext-login
包含QueyListy以及擴展的完整配置如下:
{ "require": { "jaeger/querylist": "^3.1", "jaeger/querylist-ext-request":"^1.0", "jaeger/querylist-ext-multi":"^1.0", "jaeger/querylist-ext-login":"^1.0" } }
以下類庫是上面擴展的依賴,安裝擴展的時候會自動安裝,也可以選擇單獨引入使用:
Http類:composer require jaeger/http
CurlMulti多線程類:composer require jaeger/curlmulti