一: 需求背景
作為一個開發(fā)人員,在日常開發(fā)中或多或少多會遇到采集的需求,需要采集某個網(wǎng)站的數(shù)據(jù)、文章等等,同時在還需要對采集到內容進行解析,分類等操作。在解析分類的過程中,大多數(shù)PHPer使用正則的方式來分析爬到的數(shù)據(jù),增加了難度的同時效率也沒有得到提升,用QueryList則可以很簡單的結果問題。
二:什么是QueryList?
QueryList是一個基于phpQuery的開源項目,可以讓PHPer在采集信息時對內容進行一個類似JQuery的DOM操作,十分簡潔方便,貼合平常開發(fā)的習慣。
三:下載安裝
(1) 環(huán)境要求,安裝方式有兩種,選中以下任意一種都可以。
PHP >= 5.3
(2) 安裝方式-使用composer安裝
composer require jaeger/querylist:V3.2.1
或者在項目的composer.json文件中加入以下配置,之后composer update
"require" : { "jaeger/querylist": "^3.2" }
安裝完成之后在項目中,直接引入vendor/autoload.php文件,即可直接開始使用
(3) 測試
$html = <<<STR <div id="one"> <div class="two"> <a href="http://querylist.cc">QueryList官網(wǎng)</a> <img src="http://querylist.com/1.jpg" alt="這是圖片"> <img src="http://querylist.com/2.jpg" alt="這是圖片2"> </div> <span>其它的<b>一些</b>文本</span> </div> STR; $rules = array( //采集id為one這個元素里面的純文本內容 'text' => array('#one','text'), //采集class為two下面的超鏈接的鏈接 'link' => array('.two>a','href'), //采集class為two下面的第二張圖片的鏈接 'img' => array('.two>img:eq(1)','src'), //采集span標簽中的HTML內容 'other' => array('span','html') ); $data = QueryList::Query($html, $rules)->data; var_dump($data);
(4) 安裝方式-手動安裝
前往Github下載代碼https://github.com/jae-jae/QueryL,獲取其中的QueryList.php和phpQuery.php這兩個文件放到項目中即可
(5) 測試
<?php require 'phpQuery.php'; require 'QueryList.php'; use QL\QueryList; $hj = QueryList::Query('https://php.cn/',array("url"=>array('.unit h1 a','href'))); $data = $hj->getData(function($x){ return $x['url']; }); print_r($data);
總結,這個插件下載安裝還是很簡單的,下期為大家介紹簡單的采集文章內容,適合初學者學習,歡迎大家關注,及時收到新課程提醒。
以上是PHP采集插件QueryList實踐教學(一)的詳細內容。更多信息請關注PHP中文網(wǎng)其他相關文章!

熱AI工具

Undress AI Tool
免費脫衣服圖片

Undresser.AI Undress
人工智能驅動的應用程序,用于創(chuàng)建逼真的裸體照片

AI Clothes Remover
用于從照片中去除衣服的在線人工智能工具。

Clothoff.io
AI脫衣機

Video Face Swap
使用我們完全免費的人工智能換臉工具輕松在任何視頻中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的代碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
功能強大的PHP集成開發(fā)環(huán)境

Dreamweaver CS6
視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版
神級代碼編輯軟件(SublimeText3)