abstract:本文實(shí)例講述了Python簡(jiǎn)單檢測(cè)文本類型的方法。分享給大家供大家參考,具體如下:1、根據(jù)文件頭。#是否為帶BOM頭的UTF8文件 def IsUtf8BomFile(pathfile): if b'\xef\xbb\xbf' == open(pathfile, mode='rb').read
本文實(shí)例講述了Python簡(jiǎn)單檢測(cè)文本類型的方法。分享給大家供大家參考,具體如下:
1、根據(jù)文件頭。
#是否為帶BOM頭的UTF8文件 def IsUtf8BomFile(pathfile): if b'\xef\xbb\xbf' == open(pathfile, mode='rb').read(3)): return True return False
2、用cchardet庫。
>>> import cchardet >>> cchardet.detect(open(pathfile, 'rb').read()) {'encoding': 'UTF-8', 'confidence': 0.9900000095367432}
更多關(guān)于Python簡(jiǎn)單檢測(cè)文本類型的2種方法請(qǐng)關(guān)注PHP中文網(wǎng)(ipnx.cn)其他文章!