PHP XML Expat 解析器
PHP XML Expat 解析器
內(nèi)建的 Expat 解析器使在 PHP 中處理 XML 文檔成為可能。
XML 是什么?
XML即可擴(kuò)展標(biāo)記語(yǔ)言(eXtensible Markup Language)。標(biāo)記是指計(jì)算機(jī)所能理解的信息符號(hào),通過(guò)此種標(biāo)記,計(jì)算機(jī)之間可以處理包含各種信息的文章等。如何定義這些標(biāo)記,既可以選擇國(guó)際通用的標(biāo)記語(yǔ)言,比如HTML,也可以使用象XML這樣由相關(guān)人士自由決定的標(biāo)記語(yǔ)言,這就是語(yǔ)言的可擴(kuò)展性。XML是從SGML中簡(jiǎn)化修改出來(lái)的。它主要用到的有XML、XSL和XPath等。
上面這段是對(duì)XML的一個(gè)基本定義,一個(gè)被廣泛接受的說(shuō)明。簡(jiǎn)單說(shuō),XML就是一種數(shù)據(jù)的描述語(yǔ)言,雖然它是語(yǔ)言,但是通常情況下,它并不具備常見(jiàn)語(yǔ)言的基本功能——被計(jì)算機(jī)識(shí)別并運(yùn)行。只有依靠另一種語(yǔ)言,來(lái)解釋它,使它達(dá)到你想要的效果或被計(jì)算機(jī)所接受。
假如你是剛接觸XML的新手,那么可能并無(wú)法從定義上是了解XML是什么。也許,你可以換個(gè)角度來(lái)認(rèn)識(shí)XML是什么;從應(yīng)用面來(lái)認(rèn)識(shí)XML,從XML可以做些什么來(lái)認(rèn)識(shí)它,這應(yīng)該能比那更空洞的定義對(duì)你更有幫助。
XML應(yīng)用面主要分為兩種類(lèi)型,文檔型和數(shù)據(jù)型。下面介紹一下幾種常見(jiàn)的XML應(yīng)用:
1、自定義XML+XSLT=>HTML,最常見(jiàn)的文檔型應(yīng)用之一。XML存放整個(gè)文檔的XML數(shù)據(jù),然后XSLT將XML轉(zhuǎn)換、解析,結(jié)合XSLT中的HTML標(biāo)簽,最終成為HTML,顯示在瀏覽器上。典型的例子就是CSDN上的帖子。
2、XML作為微型數(shù)據(jù)庫(kù),這是最常見(jiàn)的數(shù)據(jù)型應(yīng)用之一。我們利用相關(guān)的XML API(MSXML DOM、JAVA DOM等)對(duì)XML進(jìn)行存取和查詢(xún)。留言板的實(shí)現(xiàn)中,就經(jīng)??梢钥吹接肵ML作為數(shù)據(jù)庫(kù)。
3、作為通信數(shù)據(jù)。最典型的就是WEB SERVICE,利用XML來(lái)傳遞數(shù)據(jù)。
4、作為一些應(yīng)用程序的配置信息數(shù)據(jù)。常見(jiàn)的如J2EE配置WEB服務(wù)器時(shí)用的web.XML。
5、其他一些文檔的XML格式。如WORD、EXCEL等。
6、保存數(shù)據(jù)間的映射關(guān)系。如Hibernate。
這里介紹的6種應(yīng)用,基本涵蓋了XML的主要用途??傊?,XML是一種抽象的語(yǔ)言,它不如傳統(tǒng)的程序語(yǔ)言那么具體。要深入的認(rèn)識(shí)它,應(yīng)該先從它的應(yīng)用入手,選擇一種你需要的用途,然后再學(xué)習(xí)如何使用。
XML 用于描述數(shù)據(jù),其焦點(diǎn)是數(shù)據(jù)是什么。XML 文件描述了數(shù)據(jù)的結(jié)構(gòu)。
在 XML 中,沒(méi)有預(yù)定義的標(biāo)簽。您必須定義自己的標(biāo)簽。
如需學(xué)習(xí)更多關(guān)于 XML 的知識(shí),請(qǐng)?jiān)L問(wèn)我們的 XML 教程。
Expat 是什么?
Expat是一個(gè)面向流的解析器。您注冊(cè)的解析器回調(diào)(或handler)功能,然后開(kāi)始搜索它的文檔。當(dāng)解析器識(shí)別該文件的指定的位置,它會(huì)調(diào)用該部分相應(yīng)的處理程序(如果您已經(jīng)注冊(cè)的一個(gè))。該文件被輸送到解析器,會(huì)被分割成多個(gè)片斷,并分段裝到內(nèi)存中。因此expat可以解析那些巨大的文件。
如需讀取和更新 - 創(chuàng)建和處理 - 一個(gè) XML 文檔,您需要 XML 解析器。
有兩種基本的 XML 解析器類(lèi)型:
· 基于樹(shù)的解析器:這種解析器把 XML 文檔轉(zhuǎn)換為樹(shù)型結(jié)構(gòu)。它分析整篇文檔,并提供了對(duì)樹(shù)中元素的訪(fǎng)問(wèn),例如文檔對(duì)象模型 (DOM)。
· 基于事件的解析器:將 XML 文檔視為一系列的事件。當(dāng)某個(gè)具體的事件發(fā)生時(shí),解析器會(huì)調(diào)用函數(shù)來(lái)處理。
Expat 解析器是基于事件的解析器。
基于事件的解析器集中在 XML 文檔的內(nèi)容,而不是它們的結(jié)構(gòu)。正因?yàn)槿绱耍谑录慕馕銎髂軌虮然跇?shù)的解析器更快地訪(fǎng)問(wèn)數(shù)據(jù)。
請(qǐng)看下面的 XML 片段:
<from>Jani</from>
基于事件的解析器把上面的 XML 報(bào)告為一連串的三個(gè)事件:
· 開(kāi)始元素:from
· 開(kāi)始 CDATA 部分,值:Jani
· 關(guān)閉元素:from
上面的 XML 實(shí)例包含了形式良好的 XML。不過(guò)這個(gè)實(shí)例是無(wú)效的 XML,因?yàn)闆](méi)有與它關(guān)聯(lián)的文檔類(lèi)型聲明 (DTD)。
然而,在使用 Expat 解析器時(shí),這沒(méi)有區(qū)別。Expat 是不檢查有效性的解析器,忽略任何 DTD。
作為一款基于事件、非驗(yàn)證的 XML 解析器,Expat 快速且輕巧,十分適合 PHP 的 Web 應(yīng)用程序。
注釋?zhuān)篨ML 文檔必須形式良好,否則 Expat 會(huì)生成錯(cuò)誤。
安裝
XML Expat 解析器函數(shù)是 PHP 核心的組成部分。無(wú)需安裝就可以使用這些函數(shù)。
XML 文件
下面的 XML 文件將應(yīng)用在我們的實(shí)例中:
<?xml version="1.0" encoding="ISO-8859-1"?>
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
初始化 XML 解析器
我們要在 PHP 中初始化 XML 解析器,為不同的 XML 事件定義處理器,然后解析這個(gè) XML 文件。
實(shí)例
<?php //Initialize the XML parser $parser=xml_parser_create(); //Function to use at the start of an element function start($parser,$element_name,$element_attrs) { switch($element_name) { case "NOTE": echo "-- Note --<br>"; break; case "TO": echo "To: "; break; case "FROM": echo "From: "; break; case "HEADING": echo "Heading: "; break; case "BODY": echo "Message: "; } } //Function to use at the end of an element function stop($parser,$element_name) { echo "<br>"; } //Function to use when finding character data function char($parser,$data) { echo $data; } //Specify element handler xml_set_element_handler($parser,"start","stop"); //Specify data handler xml_set_character_data_handler($parser,"char"); //Open XML file $fp=fopen("test.xml","r"); //Read data while ($data=fread($fp,4096)) { xml_parse($parser,$data,feof($fp)) or die (sprintf("XML Error: %s at line %d", xml_error_string(xml_get_error_code($parser)), xml_get_current_line_number($parser))); } //Free the XML parser xml_parser_free($parser); ?>
以上代碼將輸出:
-- Note --
To: Tove
From: Jani
Heading: Reminder
Message: Don't forget me this weekend!
工作原理:
1. 通過(guò) xml_parser_create() 函數(shù)初始化 XML 解析器
2. 創(chuàng)建配合不同事件處理程序的的函數(shù)
3. 添加 xml_set_element_handler() 函數(shù)來(lái)定義,當(dāng)解析器遇到開(kāi)始和結(jié)束標(biāo)簽時(shí)執(zhí)行哪個(gè)函數(shù)
4. 添加 xml_set_character_data_handler() 函數(shù)來(lái)定義,當(dāng)解析器遇到字符數(shù)據(jù)時(shí)執(zhí)行哪個(gè)函數(shù)
5. 通過(guò) xml_parse() 函數(shù)來(lái)解析文件 "test.xml"
6. 萬(wàn)一有錯(cuò)誤的話(huà),添加 xml_error_string() 函數(shù)把 XML 錯(cuò)誤轉(zhuǎn)換為文本說(shuō)明
7. 調(diào)用 xml_parser_free() 函數(shù)來(lái)釋放分配給 xml_parser_create() 函數(shù)的內(nèi)存
更多 PHP Expat 解析器的信息
如需了解更多關(guān)于 PHP Expat 函數(shù)的信息,請(qǐng)?jiān)L問(wèn)我們的 PHP XML Parser 參考手冊(cè)。