?
This document uses PHP Chinese website manual Release
import "unicode/utf8"
概觀
索引
示例
打包 utf8 實現(xiàn)函數(shù)和常量以支持以 UTF-8 編碼的文本。它包含在符文和 UTF-8 字節(jié)序列之間轉(zhuǎn)換的函數(shù)。
常量
func DecodeLastRune(p []byte) (r rune, size int)
func DecodeLastRuneInString(s string) (r rune, size int)
func DecodeRune(p []byte) (r rune, size int)
func DecodeRuneInString(s string) (r rune, size int)
func EncodeRune(p []byte, r rune) int
func FullRune(p []byte) bool
func FullRuneInString(s string) bool
func RuneCount(p []byte) int
func RuneCountInString(s string) (n int)
func RuneLen(r rune) int
func RuneStart(b byte) bool
func Valid(p []byte) bool
func ValidRune(r rune) bool
func ValidString(s string) bool
DecodeLastRune DecodeLastRuneInString DecodeRune DecodeRuneInString EncodeRune FullRune FullRuneInString RuneCount RuneCountInString RuneLen RuneStart Valid ValidRune ValidString
utf8.go
編碼的基本數(shù)字。
const ( RuneError = '\uFFFD' // the "error" Rune or "Unicode replacement character" RuneSelf = 0x80 // characters below Runeself are represented as themselves in a single byte. MaxRune = '\U0010FFFF' // Maximum valid Unicode code point. UTFMax = 4 // maximum number of bytes of a UTF-8 encoded Unicode character.)
func DecodeLastRune(p []byte) (r rune, size int)
DecodeLastRune 解壓 p 中的最后一個 UTF-8 編碼,并以字節(jié)為單位返回符文及其寬度。如果p為空,則返回(RuneError, 0)。否則,如果編碼無效,則返回(RuneError, 1)。對于正確的非空 UTF-8,兩者都是不可能的結(jié)果。
如果編碼不正確,則編碼無效 UTF-8,對超出范圍的符文進行編碼,或者該值不是最短的 UTF-8 編碼。不執(zhí)行其他驗證。
package mainimport ("fmt""unicode/utf8")func main() { b := []byte("Hello, 世界")for len(b) > 0 { r, size := utf8.DecodeLastRune(b) fmt.Printf("%c %v\n", r, size) b = b[:len(b)-size]}}
func DecodeLastRuneInString(s string) (r rune, size int)
DecodeLastRuneInString 與 DecodeLastRune 類似,但其輸入是一個字符串。如果 s 為空,則返回(RuneError, 0)。否則,如果編碼無效,則返回(RuneError, 1)。對于正確的非空 UTF-8,兩者都是不可能的結(jié)果。
如果編碼不正確,則編碼無效 UTF-8,對超出范圍的符文進行編碼,或者該值不是最短的UTF-8 編碼。不執(zhí)行其他驗證。
package mainimport ("fmt""unicode/utf8")func main() { str := "Hello, 世界"for len(str) > 0 { r, size := utf8.DecodeLastRuneInString(str) fmt.Printf("%c %v\n", r, size) str = str[:len(str)-size]}}
func DecodeRune(p []byte) (r rune, size int)
DecodeRune 解壓 p 中的第一個 UTF-8 編碼,并以字節(jié)為單位返回符文及其寬度。如果 p 為空,則返回(RuneError, 0)。否則,如果編碼無效,則返回(RuneError, 1)。對于正確的非空 UTF-8 ,兩者都是不可能的結(jié)果。
如果編碼不正確,則編碼無效 UTF-8 ,對超出范圍的符文進行編碼,或者該值不是最短的 UTF-8 編碼。不執(zhí)行其他驗證。
package mainimport ("fmt""unicode/utf8")func main() { b := []byte("Hello, 世界")for len(b) > 0 { r, size := utf8.DecodeRune(b) fmt.Printf("%c %v\n", r, size) b = b[size:]}}
func DecodeRuneInString(s string) (r rune, size int)
DecodeRuneInString 與 DecodeRune類似,但其輸入是一個字符串。如果 s 為空,則返回(RuneError, 0)。否則,如果編碼無效,則返回 (RuneError, 1)。對于正確的非空 UTF-8 ,兩者都是不可能的結(jié)果。
如果編碼不正確,則編碼無效 UTF-8,對超出范圍的符文進行編碼,或者該值不是最短的 UTF-8 編碼。不執(zhí)行其他驗證。
package mainimport ("fmt""unicode/utf8")func main() { str := "Hello, 世界"for len(str) > 0 { r, size := utf8.DecodeRuneInString(str) fmt.Printf("%c %v\n", r, size) str = str[size:]}}
func EncodeRune(p []byte, r rune) int
EncodeRune 寫入 p (必須足夠大)符文的 UTF-8 編碼。它返回寫入的字節(jié)數(shù)。
package mainimport ("fmt""unicode/utf8")func main() { r := '世' buf := make([]byte, 3) n := utf8.EncodeRune(buf, r) fmt.Println(buf) fmt.Println(n)}
func FullRune(p []byte) bool
FullRune 報告 p 中的字節(jié)是否以完整的符文 UTF-8 編碼開始。一個無效的編碼被認為是一個完整的符文,因為它將轉(zhuǎn)換為一個寬度為1的錯誤符文。
package mainimport ("fmt""unicode/utf8")func main() { buf := []byte{228, 184, 150} // 世 fmt.Println(utf8.FullRune(buf)) fmt.Println(utf8.FullRune(buf[:2]))}
func FullRuneInString(s string) bool
FullRuneInString 與 FullRune 類似,但其輸入是一個字符串。
package mainimport ("fmt""unicode/utf8")func main() { str := "世" fmt.Println(utf8.FullRuneInString(str)) fmt.Println(utf8.FullRuneInString(str[:2]))}
func RuneCount(p []byte) int
RuneCount 返回 p 中的符文數(shù)。錯誤和短的編碼被視為寬度為1個字節(jié)的單個符文。
package mainimport ("fmt""unicode/utf8")func main() { buf := []byte("Hello, 世界") fmt.Println("bytes =", len(buf)) fmt.Println("runes =", utf8.RuneCount(buf))}
func RuneCountInString(s string) (n int)
RuneCountInString 就像 RuneCount ,但它的輸入是一個字符串。
package mainimport ("fmt""unicode/utf8")func main() { str := "Hello, 世界" fmt.Println("bytes =", len(str)) fmt.Println("runes =", utf8.RuneCountInString(str))}
func RuneLen(r rune) int
RuneLen 返回對符文進行編碼所需的字節(jié)數(shù)。如果符文不是以 UTF-8 編碼的有效值,則它返回-1。
package mainimport ("fmt""unicode/utf8")func main() { fmt.Println(utf8.RuneLen('a')) fmt.Println(utf8.RuneLen('界'))}
func RuneStart(b byte) bool
RuneStart 報告該字節(jié)是否可能是編碼的,可能無效的符文的第一個字節(jié)。第二個和后續(xù)字節(jié)總是將前兩位設(shè)置為10。
package mainimport ("fmt""unicode/utf8")func main() { buf := []byte("a界") fmt.Println(utf8.RuneStart(buf[0])) fmt.Println(utf8.RuneStart(buf[1])) fmt.Println(utf8.RuneStart(buf[2]))}
func Valid(p []byte) bool
有效報告 p 是否完全由有效的 UTF-8 編碼符文組成。
package mainimport ("fmt""unicode/utf8")func main() { valid := []byte("Hello, 世界") invalid := []byte{0xff, 0xfe, 0xfd} fmt.Println(utf8.Valid(valid)) fmt.Println(utf8.Valid(invalid))}
func ValidRune(r rune) bool
ValidRune 報告 r 是否可以合法編碼為 UTF-8 。超出范圍或代理一半的代碼點是非法的。
package mainimport ("fmt""unicode/utf8")func main() { valid := 'a' invalid := rune(0xfffffff) fmt.Println(utf8.ValidRune(valid)) fmt.Println(utf8.ValidRune(invalid))}
func ValidString(s string) bool
ValidString 報告 s 是否完全由有效的 UTF-8 編碼符文組成。
package mainimport ("fmt""unicode/utf8")func main() { valid := "Hello, 世界" invalid := string([]byte{0xff, 0xfe, 0xfd}) fmt.Println(utf8.ValidString(valid)) fmt.Println(utf8.ValidString(invalid))}