文本到多字节不是火山PC默认的编码 MBCS(Multi-Byte Chactacter System(Set))
需要几个字节我给你放几个字节,比如英文 ,数字我给你放一个字节,比如"中“,我就给你放两个字节
多字节字基于ANSI编码的原理上,对一个字符的表示实际上无法确定他需要占用几个字节的,只能从编码本身来区分和解释。因此计算机在存储的时候,就是采用多字节存储的形式。也就是你需要几个字节我给你放几个字节,比如A我给你放一个字节,比如"中“,我就给你放两个字节,这样的字符表示形式就是MBCS。在基于GBK的windows中,不会超过2个字节,所以windows这种表示形式有叫做DBCS(Double-Byte Chactacter System),其实算是MBCS的一个特例。C语言默认存放字符串就是用的MBCS格式。从原理上来说,这样是非常经济的一种方式。
多字节指针重新转换为文本
文本到字节集用的是默认编码 Unicode(Universal Code)
跟多字节不一样的是 不管你是中文字还是英文或数字 统统给两个字节
Unicode又称为统一码、万国码、单一码,是国际组织制定的旨在容纳全球所有字符的编码方案,包括字符集、编码方案等,它为每种语言中的每个字符设定了统一且唯一的二进制编码,以满足跨语言、跨平台的要求。更详细的请自行百度。
字节集指针转回文本
通过以上对比 区别就是编码格式不一样 按参数要求给相应编码格
式的字节集即可
欢迎光临 递归火山软件开发平台 (https://bbs.voldp.com/) | Powered by Discuz! X3.4 |