QueryList3更新日志
經(jīng)過(guò)不斷的迭代,PHP采集利器QueryList迎來(lái)了QueryList3!
下面來(lái)看看QueryList3有何改變吧:
1.調(diào)整參數(shù),不再兼容以前版本
2.使用psr-4
3.使用composer
4.更改屬性名jsonArr為data
5.廢棄getJson方法
6.加入getData、getHtml、getInstance以及run方法
7.加入擴(kuò)展功能,通過(guò)擴(kuò)展可以實(shí)現(xiàn)多線程批量采集,模擬登陸采集等功能,讓QueryList變得無(wú)限可能。
8.改進(jìn)還有諸如:進(jìn)一步降低了亂碼出現(xiàn)的幾率、增強(qiáng)了內(nèi)置的源碼抓取方法、實(shí)現(xiàn)無(wú)限級(jí)別嵌套采集等。
現(xiàn)介紹已有的示例擴(kuò)展:
1.Request擴(kuò)展,可以實(shí)現(xiàn)如攜帶cookie、偽造來(lái)路等任意復(fù)雜的網(wǎng)絡(luò)請(qǐng)求,再也不用擔(dān)心QueryList內(nèi)置的抓取功能太弱了。
2.Login擴(kuò)展,可以實(shí)現(xiàn)模擬登陸然后采集。
3.Multi擴(kuò)展,多線程(多進(jìn)程)采集擴(kuò)展。
擴(kuò)展通過(guò)QueryList::run 方法運(yùn)行。
使用Composer安裝(當(dāng)然也可以不使用這種方式):
QueryList以及其依賴:composer require jaeger/querylist
QueryList擴(kuò)展需要選擇性的單獨(dú)安裝:
Request網(wǎng)絡(luò)操作擴(kuò)展:composer require jaeger/querylist-ext-request
Multi多線程擴(kuò)展:composer require jaeger/querylist-ext-multi
Login模擬登陸擴(kuò)展:composer require jaeger/querylist-ext-login
包含QueyListy以及擴(kuò)展的完整配置如下:
{ "require": { "jaeger/querylist": "^3.1", "jaeger/querylist-ext-request":"^1.0", "jaeger/querylist-ext-multi":"^1.0", "jaeger/querylist-ext-login":"^1.0" } }
以下類庫(kù)是上面擴(kuò)展的依賴,安裝擴(kuò)展的時(shí)候會(huì)自動(dòng)安裝,也可以選擇單獨(dú)引入使用:
Http類:composer require jaeger/http
CurlMulti多線程類:composer require jaeger/curlmulti