亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

首頁(yè) 后端開發(fā) php教程 PHP主|使用多弦字符串

PHP主|使用多弦字符串

Feb 23, 2025 am 09:08 AM

PHP Master | Working with Multibyte Strings

數(shù)字語(yǔ)言,無論是英語(yǔ)、日語(yǔ)還是其他任何語(yǔ)言,都由許多字符組成。因此,在數(shù)字處理語(yǔ)言時(shí),一個(gè)基本問題是如何以數(shù)字方式表示每個(gè)字符。過去,我們只需要表示英語(yǔ)字符,但如今情況大不相同,結(jié)果是出現(xiàn)了令人眼花繚亂的字符編碼方案來表示多種不同語(yǔ)言的字符。PHP 如何與這些不同的方案相關(guān)聯(lián)并處理它們?

要點(diǎn)

  • 多字節(jié)字符使用一到四個(gè)字節(jié)來定義字符,這對(duì)于數(shù)字表示具有超過 256 個(gè)唯一字符的語(yǔ)言至關(guān)重要。Unicode,尤其是 UTF-8,是這些字符最常用的編碼方案。
  • PHP 本身并非設(shè)計(jì)用于處理多字節(jié)字符。要處理這些字符,應(yīng)使用一組特殊的函數(shù),即 mbstring 函數(shù)。但是,PHP 的 HTTP 標(biāo)頭也包含字符集標(biāo)識(shí),可以覆蓋頁(yè)面的元標(biāo)記。
  • 多字節(jié)支持并非 PHP 的默認(rèn)功能,需要重新配置。要啟用 mb 函數(shù),請(qǐng)使用 --enable-mbstring 編譯時(shí)選項(xiàng),并設(shè)置運(yùn)行時(shí)配置選項(xiàng) mbstring-encoding_translation。
  • PHP 中有幾個(gè)多字節(jié)字符串命令可用,例如 mb_check_encoding、mb_strlen 和 mb_ereg_search,它們分別用于檢查特定編碼序列是否有效、查找多字節(jié)字符串中的字符數(shù)以及執(zhí)行傳統(tǒng)字符搜索的多字節(jié)版本。

基礎(chǔ)知識(shí)

我們都知道,“位”可以是 0 或 1,而“字節(jié)”是八個(gè)連續(xù)位的組合。由于一個(gè)字節(jié)中有八個(gè)這樣的雙值位,因此一個(gè)字節(jié)可以配置成總共 256 種不同的模式(2 的 8 次方)??梢詫⒉煌淖址c每種可能的 8 位模式關(guān)聯(lián)起來。將這些字節(jié)按不同的順序組合在一起,您就擁有了自己的通信方式。它不一定是智能的,這取決于兩端是誰(shuí),但它是通信。只要我們可以用 256 個(gè)或更少的唯一字符表達(dá)一種語(yǔ)言的字符,我們就成功了。但是,如果我們不能只用 256 個(gè)字符來表達(dá)一種語(yǔ)言呢?或者如果我們需要在同一個(gè)文檔中表達(dá)多種語(yǔ)言呢?今天,隨著我們對(duì)所有可以找到的東西進(jìn)行數(shù)字化處理,256 個(gè)字符遠(yuǎn)遠(yuǎn)不夠。幸運(yùn)的是,已經(jīng)設(shè)計(jì)出了更能應(yīng)對(duì)這一挑戰(zhàn)的字符方案。這些新的超級(jí)字符集使用一到四個(gè)字節(jié)來定義字符。如今字符編碼領(lǐng)域的大佬是 Unicode,這是一種使用多個(gè)字節(jié)表示字符的方案。它由 Unicode Consortium 開發(fā),并且有幾個(gè)版本:UTF-32(用于 Dreadnaught 級(jí)星艦)、UTF-16(用于《星際迷航:暗黑無界》中的企業(yè)號(hào))和 UTF-8(我們大多數(shù)人在現(xiàn)實(shí)世界中應(yīng)該為我們的 Web 應(yīng)用程序使用)。正如我所說,Unicode(包括 UTF-8)使用多個(gè)字節(jié)配置來表示字符。UTF-8 使用一到四個(gè)字節(jié)來生成 1,112,064 種模式來表示不同的字符。這些“寬字符”占用更多空間,但 UTF-8 的處理速度往往比其他一些編碼方案快。為什么每個(gè)人都對(duì) UTF-8 贊不絕口?部分原因是在 ESPN 和 TCM 上看到的支持 UTF-8 的廣告中突顯的熱門模特,但主要是因?yàn)?UTF-8 模仿 ASCII,如果您沒有涉及任何特殊字符,它會(huì)精確地跟蹤 ASCII。

這如何影響 PHP?

我知道你在想什么。我只需要在我的元標(biāo)記中將字符集設(shè)置為“UTF-8”,一切都會(huì)好起來的。但這并不正確。首先,簡(jiǎn)單的事實(shí)是 PHP 并非真正設(shè)計(jì)用于處理多字節(jié)字符,因此使用標(biāo)準(zhǔn)字符串函數(shù)對(duì)這些字符進(jìn)行操作可能會(huì)產(chǎn)生不確定的結(jié)果。當(dāng)我們需要處理這些多字節(jié)字符時(shí),我們需要使用一組特殊的函數(shù):mbstring 函數(shù)。其次,即使您控制了 PHP,仍然可能存在問題。覆蓋您的通信的 HTTP 標(biāo)頭也包含字符集標(biāo)識(shí),這將覆蓋頁(yè)面元標(biāo)記中的內(nèi)容。那么,PHP 如何處理多字節(jié)字符呢?有兩組函數(shù)會(huì)影響多字節(jié)字符串。第一個(gè)是 iconv。從 5.0 版本開始,這已成為語(yǔ)言的默認(rèn)部分,一種將一種字符集轉(zhuǎn)換為另一種字符集表示的方法。這不是我們將在本文中討論的內(nèi)容。第二個(gè)是多字節(jié)支持,這是一系列以“mb_”為前綴的命令。這些命令有很多,快速回顧一下表明,其中一些命令與根據(jù)給定的編碼方案確定字符是否合適有關(guān),而其他命令是面向搜索的函數(shù),類似于 PHP 正則表達(dá)式的一部分,但面向多字節(jié)函數(shù)。

為 PHP 啟用多字節(jié)支持

多字節(jié)支持不是 PHP 的默認(rèn)功能,但它也不需要我們下載任何額外的庫(kù)或擴(kuò)展;它只需要一些重新配置。不幸的是,如果您使用的是托管版本的 PHP,這可能不是您可以執(zhí)行的操作。使用 phpinfo() 函數(shù)查看您的配置。向下滾動(dòng)輸出大約一半,將有一個(gè)名為“mbstring”的部分。這將向您顯示是否啟用了基本功能。有關(guān)如何啟用此功能的信息,您可以參考手冊(cè)。簡(jiǎn)而言之,您可以通過使用 --enable-mbstring 編譯時(shí)選項(xiàng)啟用 mb 函數(shù),并設(shè)置運(yùn)行時(shí)配置選項(xiàng) mbstring-encoding_translation。當(dāng)然,最終的解決方案是 PHP 6,因?yàn)樗鼘⑹褂?IBM (請(qǐng)大家摘掉帽子) ICU 庫(kù)來確保對(duì)多字節(jié)字符集的原生支持。我們所要做的就是坐下來等待,對(duì)吧?但在那之前,請(qǐng)查看現(xiàn)在可用的多字節(jié)支持。

多字節(jié)字符串命令

可能有 53 個(gè)不同的多字節(jié)字符串命令。也可能有 54 個(gè)。我在某個(gè)時(shí)候有點(diǎn)數(shù)不清了,但你明白我的意思。不用說,我們不會(huì)逐一講解,但為了好玩,讓我們快速瀏覽幾個(gè)。

  • mb_check_encoding

mb_check_encoding() 函數(shù)檢查以確定特定編碼序列對(duì)于編碼方案是否有效。該函數(shù)不會(huì)告訴您字符串的編碼方式(或它將適用于哪些方案),但它會(huì)告訴您它對(duì)于指定的方案是否有效。

<?php
$string = 'u4F60u597Du4E16u754C';
$string = json_decode('"' . $string . '"');
$valid = mb_check_encoding($string, 'UTF-8');
echo ($valid) ? 'valid' : 'invalid';
?>

您可以在 PHP 手冊(cè)中找到支持的編碼列表。

  • mb_strlen

strlen() 函數(shù)返回字符串中的字節(jié)數(shù)。對(duì)于每個(gè)字符都是單個(gè)字節(jié)的 ASCII,這可以很好地找到字符數(shù)。對(duì)于多字節(jié)字符串,您需要使用 mb_strlen() 函數(shù)。

<?php
$string = 'u4F60u597Du4E16u754C';
$string = json_decode('"' . $string . '"');
$valid = mb_check_encoding($string, 'UTF-8');
echo ($valid) ? 'valid' : 'invalid';
?>
  • mb_ereg_search

mb_ereg_search() 函數(shù)執(zhí)行傳統(tǒng)字符搜索的多字節(jié)版本。但有一些注意事項(xiàng)——您需要使用 mb_regex_encoding() 函數(shù)指定編碼方案,正則表達(dá)式?jīng)]有分隔符(它只是模式部分),并且正則表達(dá)式和字符串都是使用 mb_ereg_search_init() 指定的。

<?php
$string = 'u4F60u597Du4E16u754C';
$string = json_decode('"' . $string . '"');

echo strlen($string); // 輸出 12 – 錯(cuò)誤!
echo mb_strlen($string, 'UTF-8'); // 輸出 4
?>

足夠了嗎?

我不知道你怎么樣,但我認(rèn)為世界真的需要更多簡(jiǎn)單的東西。不幸的是,多字節(jié)處理并不能滿足這種需求。但就目前而言,這是你不能忽視的事情。有時(shí)你將無法執(zhí)行正常的 PHP 字符串處理(因?yàn)槟阍噲D對(duì)超過正常 ASCII 范圍(U 0000 – U 00FF)的字符進(jìn)行處理)。這意味著你必須使用面向 mb_ 的函數(shù)。想了解更多?說真的,你想嗎?我真以為這會(huì)嚇跑你。我對(duì)此毫無準(zhǔn)備。我的時(shí)間到了。你最好的選擇是什么?查看 PHP 手冊(cè)。哦,還要嘗試一些東西。沒有什么能替代實(shí)際使用某物的經(jīng)驗(yàn)。

(此處應(yīng)保留原文FAQ部分,因?yàn)槠鋬?nèi)容與文章主題高度相關(guān),且改寫后反而會(huì)降低可讀性。)

以上是PHP主|使用多弦字符串的詳細(xì)內(nèi)容。更多信息請(qǐng)關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本站聲明
本文內(nèi)容由網(wǎng)友自發(fā)貢獻(xiàn),版權(quán)歸原作者所有,本站不承擔(dān)相應(yīng)法律責(zé)任。如您發(fā)現(xiàn)有涉嫌抄襲侵權(quán)的內(nèi)容,請(qǐng)聯(lián)系admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣服圖片

Undresser.AI Undress

Undresser.AI Undress

人工智能驅(qū)動(dòng)的應(yīng)用程序,用于創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用于從照片中去除衣服的在線人工智能工具。

Clothoff.io

Clothoff.io

AI脫衣機(jī)

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智能換臉工具輕松在任何視頻中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的代碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

功能強(qiáng)大的PHP集成開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁(yè)開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級(jí)代碼編輯軟件(SublimeText3)

熱門話題

Laravel 教程
1597
29
PHP教程
1488
72
PHP變量范圍解釋了 PHP變量范圍解釋了 Jul 17, 2025 am 04:16 AM

PHP變量作用域常見問題及解決方法包括:1.函數(shù)內(nèi)部無法訪問全局變量,需使用global關(guān)鍵字或參數(shù)傳入;2.靜態(tài)變量用static聲明,只初始化一次并在多次調(diào)用間保持值;3.超全局變量如$_GET、$_POST可在任何作用域直接使用,但需注意安全過濾;4.匿名函數(shù)需通過use關(guān)鍵字引入父作用域變量,修改外部變量則需傳遞引用。掌握這些規(guī)則有助于避免錯(cuò)誤并提升代碼穩(wěn)定性。

如何在PHP中牢固地處理文件上傳? 如何在PHP中牢固地處理文件上傳? Jul 08, 2025 am 02:37 AM

要安全處理PHP文件上傳需驗(yàn)證來源與類型、控制文件名與路徑、設(shè)置服務(wù)器限制并二次處理媒體文件。1.驗(yàn)證上傳來源通過token防止CSRF并通過finfo_file檢測(cè)真實(shí)MIME類型使用白名單控制;2.重命名文件為隨機(jī)字符串并根據(jù)檢測(cè)類型決定擴(kuò)展名存儲(chǔ)至非Web目錄;3.PHP配置限制上傳大小及臨時(shí)目錄Nginx/Apache禁止訪問上傳目錄;4.GD庫(kù)重新保存圖片清除潛在惡意數(shù)據(jù)。

在PHP中評(píng)論代碼 在PHP中評(píng)論代碼 Jul 18, 2025 am 04:57 AM

PHP注釋代碼常用方法有三種:1.單行注釋用//或#屏蔽一行代碼,推薦使用//;2.多行注釋用/.../包裹代碼塊,不可嵌套但可跨行;3.組合技巧注釋如用/if(){}/控制邏輯塊,或配合編輯器快捷鍵提升效率,使用時(shí)需注意閉合符號(hào)和避免嵌套。

發(fā)電機(jī)如何在PHP中工作? 發(fā)電機(jī)如何在PHP中工作? Jul 11, 2025 am 03:12 AM

AgeneratorinPHPisamemory-efficientwaytoiterateoverlargedatasetsbyyieldingvaluesoneatatimeinsteadofreturningthemallatonce.1.Generatorsusetheyieldkeywordtoproducevaluesondemand,reducingmemoryusage.2.Theyareusefulforhandlingbigloops,readinglargefiles,or

撰寫PHP評(píng)論的提示 撰寫PHP評(píng)論的提示 Jul 18, 2025 am 04:51 AM

寫好PHP注釋的關(guān)鍵在于明確目的與規(guī)范,注釋應(yīng)解釋“為什么”而非“做了什么”,避免冗余或過于簡(jiǎn)單。1.使用統(tǒng)一格式,如docblock(/*/)用于類、方法說明,提升可讀性與工具兼容性;2.強(qiáng)調(diào)邏輯背后的原因,如說明為何需手動(dòng)輸出JS跳轉(zhuǎn);3.在復(fù)雜代碼前添加總覽性說明,分步驟描述流程,幫助理解整體思路;4.合理使用TODO和FIXME標(biāo)記待辦事項(xiàng)與問題,便于后續(xù)追蹤與協(xié)作。好的注釋能降低溝通成本,提升代碼維護(hù)效率。

快速PHP安裝教程 快速PHP安裝教程 Jul 18, 2025 am 04:52 AM

ToinstallPHPquickly,useXAMPPonWindowsorHomebrewonmacOS.1.OnWindows,downloadandinstallXAMPP,selectcomponents,startApache,andplacefilesinhtdocs.2.Alternatively,manuallyinstallPHPfromphp.netandsetupaserverlikeApache.3.OnmacOS,installHomebrew,thenrun'bre

如何通過php中的索引訪問字符串中的字符 如何通過php中的索引訪問字符串中的字符 Jul 12, 2025 am 03:15 AM

在PHP中獲取字符串特定索引字符可用方括號(hào)或花括號(hào),但推薦方括號(hào);索引從0開始,超出范圍訪問返回空值,不可賦值;處理多字節(jié)字符需用mb_substr。例如:$str="hello";echo$str[0];輸出h;而中文等字符需用mb_substr($str,1,1)獲取正確結(jié)果;實(shí)際應(yīng)用中循環(huán)訪問前應(yīng)檢查字符串長(zhǎng)度,動(dòng)態(tài)字符串需驗(yàn)證有效性,多語(yǔ)言項(xiàng)目建議統(tǒng)一使用多字節(jié)安全函數(shù)。

學(xué)習(xí)PHP:初學(xué)者指南 學(xué)習(xí)PHP:初學(xué)者指南 Jul 18, 2025 am 04:54 AM

易于效率,啟動(dòng)啟動(dòng)tingupalocalserverenverenvirestoolslikexamppandacodeeditorlikevscode.1)installxamppforapache,mysql,andphp.2)uscodeeditorforsyntaxssupport.3)

See all articles