?
This document uses PHP Chinese website manual Release
在頭文件<uchar.h>中定義 | ||
---|---|---|
size_t mbrtoc16(char16_t * pc16,const char * s,size_t n,mbstate_t * ps); | (自C11以來) |
將單個代碼點從其窄多字節(jié)字符表示轉(zhuǎn)換為其可變長度的16位寬字符表示(通常為UTF-16)。
如果s不是空指針,則檢查多字節(jié)字符串的至多n個字節(jié),從s指向的字節(jié)開始,以確定完成下一個多字節(jié)字符(包括任何移位序列)所需的字節(jié)數(shù)。 如果函數(shù)確定s中的下一個多字節(jié)字符是完整且有效的,則將其轉(zhuǎn)換為相應(yīng)的16位寬字符并將其存儲在* pc16中(如果pc16不為null)。
如果* s中的多字節(jié)字符對應(yīng)于多char16_t序列(例如UTF-16中的代理對),那么在第一次調(diào)用此函數(shù)后,將更新* ps,以便下次調(diào)用mbrtoc16時將寫入 額外的char16_t,而不考慮* s。
如果s是一個空指針,n和pc16的值將被忽略,并且調(diào)用相當(dāng)于mbrtoc16(NULL,“”,1,ps)。
如果生成的寬字符為空字符,則轉(zhuǎn)換狀態(tài)* ps表示初始轉(zhuǎn)換狀態(tài)。
如果定義了宏__STDC_UTF_16__,則該函數(shù)使用的16位編碼為UTF-16; 否則,它是實現(xiàn)定義的。 在任何情況下,此函數(shù)使用的多字節(jié)字符編碼均由當(dāng)前活動的C語言環(huán)境指定。
PC16 | - | 指向結(jié)果16位寬字符將被寫入的位置的指針 |
---|---|---|
s | - | 指向用作輸入的多字節(jié)字符串的指針 |
n | - | 限制可以檢查的s中的字節(jié)數(shù) |
ps | - | 指向解釋多字節(jié)字符串時使用的轉(zhuǎn)換狀態(tài)對象的指針 |
以下第一項適用:
如果從s轉(zhuǎn)換的字符(并且存儲在* pc16中,如果非null)是空字符,則返回0
返回從s成功轉(zhuǎn)換的多字節(jié)字符的字節(jié)數(shù)[1 ... n]
如果來自多char16_t字符(例如代理對)的下一個char16_t現(xiàn)在已被寫入* pc16,則返回(size_t)-3。在這種情況下,輸入中沒有處理字節(jié)。
如果接下來的n個字節(jié)構(gòu)成一個不完整的,但到目前為止有效的多字節(jié)字符, 沒有任何信息寫入* pc16。則返回(size_t)-2
如果發(fā)生編碼錯誤。 沒有任何內(nèi)容寫入* pc16,值EILSEQ存儲在errno中,并且如果* ps未指定,則返回(size_t)-1
#include <stdio.h>#include <locale.h>#include <uchar.h> mbstate_t state;int main(void){ setlocale(LC_ALL, "en_US.utf8"); char in[] = u8"z?水?"; // or "z\u00df\u6c34\U0001F34C" size_t in_sz = sizeof in / sizeof *in; printf("Processing %zu UTF-8 code units: [ ", in_sz); for(size_t n = 0; n < in_sz; ++n) printf("%#x ", (unsigned char)in[n]); puts("]"); char16_t out[in_sz]; char *p_in = in, *end = in + in_sz; char16_t *p_out = out; int rc; while((rc = mbrtoc16(p_out, p_in, end - p_in, &state))) { if(rc == -3) // surrogate pairs in UTF-16 p_out += 1; else if(rc > 0) { p_in += rc; p_out += 1; } else break; } size_t out_sz = p_out - out + 1; printf("into %zu UTF-16 code units: [ ", out_sz); for(size_t x = 0; x < out_sz; ++x) printf("%#x ", out[x]); puts("]");}
輸出:
Processing 11 UTF-8 code units: [ 0x7a 0xc3 0x9f 0xe6 0xb0 0xb4 0xf0 0x9f 0x8d 0x8c 0 ]into 6 UTF-16 code units: [ 0x7a 0xdf 0x6c34 0xd83c 0xdf4c 0 ]
C11標(biāo)準(zhǔn)(ISO / IEC 9899:2011):
7.28.1.1 mbrtoc16函數(shù)(p:398-399)
c16rtomb(C11) | 將16位寬字符轉(zhuǎn)換為窄多字節(jié)字符串(函數(shù)) |
---|
| mbrtoc16的C ++文檔 |
本文檔系騰訊云云+社區(qū)成員共同維護(hù),如有問題請聯(lián)系 yunjia_community@tencent.com
在頭文件<wctype.h>中定義 | ||
---|---|---|
int iswdigit(wint_t ch); | (自C95以來) |
檢查給定的寬字符是否對應(yīng)(如果縮小)十個十進(jìn)制數(shù)字字符0123456789中的一個。
CH | - | 寬字符 |
---|
如果寬字符是數(shù)字字符,則為非零值,否則為零。
iswdigit
與iswxdigit
是唯一不受當(dāng)前安裝的C語言環(huán)境影響的標(biāo)準(zhǔn)寬字符分類函數(shù)。
一些語言環(huán)境提供了檢測非ASCII數(shù)字的附加字符類。
#include <stdio.h>#include <wctype.h>#include <wchar.h>#include <locale.h> void test(wchar_t a3, wchar_t u3, wchar_t j3){ printf(" '%lc' '%lc' '%lc'\n", a3, u3, j3); printf("iswdigit %d %d %d\n", !!iswdigit(a3), !!iswdigit(u3), !!iswdigit(j3)); printf("jdigit: %d %d %d\n", !!iswctype(a3, wctype("jdigit")), !!iswctype(u3, wctype("jdigit")), !!iswctype(j3, wctype("jdigit")));} int main(void){ wchar_t a3 = L'3'; // the ASCII digit 3 wchar_t u3 = L'三'; // the CJK numeral 3 wchar_t j3 = L'3'; // the fullwidth digit 3 setlocale(LC_ALL, "en_US.utf8"); puts("In American locale:"); test(a3, u3, j3); setlocale(LC_ALL, "ja_JP.utf8"); puts("\nIn Japanese locale:"); test(a3, u3, j3);}
輸出:
In American locale: '3' '三' '3'iswdigit 1 0 0jdigit: 0 0 0 In Japanese locale: '3' '三' '3'iswdigit 1 0 0jdigit: 0 0 1
C11標(biāo)準(zhǔn)(ISO / IEC 9899:2011):
7.30.2.1.5 iswdigit函數(shù)(p:449)
C99標(biāo)準(zhǔn)(ISO / IEC 9899:1999):
7.25.2.1.5 iswdigit函數(shù)(p:395)
isdigit | 檢查一個字符是否是一個數(shù)字(功能) |
---|
| 用于iswdigit的C ++文檔 |
ASCII 值 (十六進(jìn)制) | 字符 | iscntrl iswcntrl. | isprint iswprint. | isspace iswspace. | isblank iswblank. | isgraph iswgraph. | ispunct iswpunct. | isalnum iswalnum. | isalpha iswalpha. | isupper iswupper. | islower iswlower. | isdigit iswdigit. | isxdigit iswxdigit. | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 - 8 | 0x00-0x08 | 控制碼 (NUL, etc.) | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
9 | 0x09 | tab (\t) | ≠0 | 0 | ≠0 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
10 - 13 | 0x0A-0x0D | 空格 (\n,\v,\f,\r) | ≠0 | 0 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
14 - 31 | 0x0E-0x1F | 控制碼 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
32 | 0x20 | space | 0 | ≠0 | ≠0 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
33 - 47 | 0x21-0x2F | !"#$%&'()*+,-./ | 0 | ≠0 | 0 | 0 | ≠0 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 |
48 - 57 | 0x30-0x39 | 0123456789 | 0 | ≠0 | 0 | 0 | ≠0 | 0 | ≠0 | 0 | 0 | 0 | ≠0 | ≠0 |
58 - 64 | 0x3a-0x40 | :;<=>?@ | 0 | ≠0 | 0 | 0 | ≠0 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 |
65 - 70 | 0x41-0x46 | ABCDEF | 0 | ≠0 | 0 | 0 | ≠0 | 0 | ≠0 | ≠0 | ≠0 | 0 | 0 | ≠0 |
71 - 90 | 0x47-0x5A | GHIJKLMNOPQRSTUVWXYZ | 0 | ≠0 | 0 | 0 | ≠0 | 0 | ≠0 | ≠0 | ≠0 | 0 | 0 | 0 |
91 - 96 | 0x5B-0x60 | []^_` | 0 | ≠0 | 0 | 0 | ≠0 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 | | ||||||||||||
97 -102 | 0x61-0x66 | abcdef | 0 | ≠0 | 0 | 0 | ≠0 | 0 | ≠0 | ≠0 | 0 | ≠0 | 0 | ≠0 |
103-122 | 0x67-0x7A | ghijklmnopqrstuvwxyz | 0 | ≠0 | 0 | 0 | ≠0 | 0 | ≠0 | ≠0 | 0 | ≠0 | 0 | 0 |
123-126 | 0x7B-0x7E | {|}~ | 0 | ≠0 | 0 | 0 | ≠0 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 |
127 | 0x7F | 退格 (DEL) | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |