?
This document uses PHP Chinese website manual Release
在頭文件<stdlib.h>中定義 | ||
---|---|---|
int mblen(const char * s,size_t n); |
確定第一個字節(jié)由s指向的多字節(jié)字符的大?。ㄒ宰止?jié)為單位)。
如果s
是空指針,則重置全局轉(zhuǎn)換狀態(tài)并確定是否使用移位序列。
除了mbtowc的轉(zhuǎn)換狀態(tài)不受影響之外,該函數(shù)等同于調(diào)用mbtowc((wchar_t *)0,s,n)。
每次調(diào)用mblen都會更新內(nèi)部全局轉(zhuǎn)換狀態(tài)(類型為mbstate_t的靜態(tài)對象,只有此函數(shù)已知)。 如果多字節(jié)編碼使用移位狀態(tài),則必須小心避免回溯或多次掃描。 無論如何,多線程不應(yīng)該在沒有同步的情況下調(diào)用mblen:但可以使用mbrlen。
s | - | 指向多字節(jié)字符的指針 |
---|---|---|
n | - | 限制可以檢查的s中的字節(jié)數(shù) |
如果s不是空指針,則返回多字節(jié)字符中包含的字節(jié)數(shù),如果s指向的第一個字節(jié)沒有形成有效的多字節(jié)字符,則返回-1;如果s指向空字符,則返回0'\ 0'。
如果s是空指針,則重置其內(nèi)部轉(zhuǎn)換狀態(tài)以表示初始移位狀態(tài),如果當(dāng)前多字節(jié)編碼不是狀態(tài)相關(guān)的(不使用移位序列),則返回0,如果當(dāng)前多字節(jié)為非零值 編碼是依賴于狀態(tài)的(使用移位序列)。
#include <string.h>#include <stdlib.h>#include <locale.h>#include <stdio.h> // the number of characters in a multibyte string is the sum of mblen()'s// note: the simpler approach is mbstowcs(NULL, str, sz)size_t strlen_mb(const char* ptr){ size_t result = 0; const char* end = ptr + strlen(ptr); mblen(NULL, 0); // reset the conversion state while(ptr < end) { int next = mblen(ptr, end - ptr); if(next == -1) { perror("strlen_mb"); break; } ptr += next; ++result; } return result;} int main(void){ setlocale(LC_ALL, "en_US.utf8"); const char* str = "z\u00df\u6c34\U0001f34c"; printf("The string %s consists of %zu bytes, but only %zu characters\n", str, strlen(str), strlen_mb(str));}
可能的輸出:
The string z?水? consists of 10 bytes, but only 4 characters
C11標(biāo)準(zhǔn)(ISO / IEC 9899:2011):
7.22.7.1 mblen函數(shù)(p:357)
C99標(biāo)準(zhǔn)(ISO / IEC 9899:1999):
7.20.7.1 mblen函數(shù)(p:321)
C89 / C90標(biāo)準(zhǔn)(ISO / IEC 9899:1990):
4.10.7.1 mblen函數(shù)
mbtowc | 將下一個多字節(jié)字符轉(zhuǎn)換為寬字符(函數(shù)) |
---|---|
mbrlen(C95) | 返回下一個多字節(jié)字符中的字節(jié)數(shù),給定狀態(tài)(函數(shù)) |
| mblen的C ++文檔 |
本文檔系騰訊云云+社區(qū)成員共同維護(hù),如有問題請聯(lián)系 yunjia_community@tencent.com
在頭文件<wctype.h>中定義 | ||
---|---|---|
int iswdigit(wint_t ch); | (自C95以來) |
檢查給定的寬字符是否對應(yīng)(如果縮?。┦畟€十進(jìn)制數(shù)字字符0123456789中的一個。
CH | - | 寬字符 |
---|
如果寬字符是數(shù)字字符,則為非零值,否則為零。
iswdigit
與iswxdigit
是唯一不受當(dāng)前安裝的C語言環(huán)境影響的標(biāo)準(zhǔn)寬字符分類函數(shù)。
一些語言環(huán)境提供了檢測非ASCII數(shù)字的附加字符類。
#include <stdio.h>#include <wctype.h>#include <wchar.h>#include <locale.h> void test(wchar_t a3, wchar_t u3, wchar_t j3){ printf(" '%lc' '%lc' '%lc'\n", a3, u3, j3); printf("iswdigit %d %d %d\n", !!iswdigit(a3), !!iswdigit(u3), !!iswdigit(j3)); printf("jdigit: %d %d %d\n", !!iswctype(a3, wctype("jdigit")), !!iswctype(u3, wctype("jdigit")), !!iswctype(j3, wctype("jdigit")));} int main(void){ wchar_t a3 = L'3'; // the ASCII digit 3 wchar_t u3 = L'三'; // the CJK numeral 3 wchar_t j3 = L'3'; // the fullwidth digit 3 setlocale(LC_ALL, "en_US.utf8"); puts("In American locale:"); test(a3, u3, j3); setlocale(LC_ALL, "ja_JP.utf8"); puts("\nIn Japanese locale:"); test(a3, u3, j3);}
輸出:
In American locale: '3' '三' '3'iswdigit 1 0 0jdigit: 0 0 0 In Japanese locale: '3' '三' '3'iswdigit 1 0 0jdigit: 0 0 1
C11標(biāo)準(zhǔn)(ISO / IEC 9899:2011):
7.30.2.1.5 iswdigit函數(shù)(p:449)
C99標(biāo)準(zhǔn)(ISO / IEC 9899:1999):
7.25.2.1.5 iswdigit函數(shù)(p:395)
isdigit | 檢查一個字符是否是一個數(shù)字(功能) |
---|
| 用于iswdigit的C ++文檔 |
ASCII 值 (十六進(jìn)制) | 字符 | iscntrl iswcntrl. | isprint iswprint. | isspace iswspace. | isblank iswblank. | isgraph iswgraph. | ispunct iswpunct. | isalnum iswalnum. | isalpha iswalpha. | isupper iswupper. | islower iswlower. | isdigit iswdigit. | isxdigit iswxdigit. | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 - 8 | 0x00-0x08 | 控制碼 (NUL, etc.) | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
9 | 0x09 | tab (\t) | ≠0 | 0 | ≠0 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
10 - 13 | 0x0A-0x0D | 空格 (\n,\v,\f,\r) | ≠0 | 0 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
14 - 31 | 0x0E-0x1F | 控制碼 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
32 | 0x20 | space | 0 | ≠0 | ≠0 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
33 - 47 | 0x21-0x2F | !"#$%&'()*+,-./ | 0 | ≠0 | 0 | 0 | ≠0 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 |
48 - 57 | 0x30-0x39 | 0123456789 | 0 | ≠0 | 0 | 0 | ≠0 | 0 | ≠0 | 0 | 0 | 0 | ≠0 | ≠0 |
58 - 64 | 0x3a-0x40 | :;<=>?@ | 0 | ≠0 | 0 | 0 | ≠0 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 |
65 - 70 | 0x41-0x46 | ABCDEF | 0 | ≠0 | 0 | 0 | ≠0 | 0 | ≠0 | ≠0 | ≠0 | 0 | 0 | ≠0 |
71 - 90 | 0x47-0x5A | GHIJKLMNOPQRSTUVWXYZ | 0 | ≠0 | 0 | 0 | ≠0 | 0 | ≠0 | ≠0 | ≠0 | 0 | 0 | 0 |
91 - 96 | 0x5B-0x60 | []^_` | 0 | ≠0 | 0 | 0 | ≠0 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 | | ||||||||||||
97 -102 | 0x61-0x66 | abcdef | 0 | ≠0 | 0 | 0 | ≠0 | 0 | ≠0 | ≠0 | 0 | ≠0 | 0 | ≠0 |
103-122 | 0x67-0x7A | ghijklmnopqrstuvwxyz | 0 | ≠0 | 0 | 0 | ≠0 | 0 | ≠0 | ≠0 | 0 | ≠0 | 0 | 0 |
123-126 | 0x7B-0x7E | {|}~ | 0 | ≠0 | 0 | 0 | ≠0 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 |
127 | 0x7F | 退格 (DEL) | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |