1105110683 发表于 2024-7-31 10:31:00

请问读取文件编码类型问题?

文件里有英文和中文,文件可能会是UTF-8 或者是ANSI编码, 但是我读入文件后英文能正常显示,中文就乱码了,我想不管文件是UTF-8还是ANSI编码都能读取到中文内容该怎么写?

Xelloss0618 发表于 2024-7-31 10:40:59

ANSI、UTF-8、UTF-16这几种编码还是很好判断的,难判断的是ANSI里各种国家和语言的编码,如果将ANSI统一视为GBK,那还是挺简单。
第三方模块有现成的命令,比如PIV模块的「simdUTF.自动检测编码」,火山模块的「编码判断类_」

Xelloss0618 发表于 2024-7-31 19:00:46

1105110683 发表于 2024-7-31 18:03
UTF8-BOM怎么转到Ascii_ 啊?

我用 编码转换类_.转Utf8到Ascii_() 转换后头部会有个?问号 ...

只能自己判断前三个字节是否BOM,然后删掉,再转码

1105110683 发表于 2024-7-31 18:03:08

Xelloss0618 发表于 2024-7-31 10:40
ANSI、UTF-8、UTF-16这几种编码还是很好判断的,难判断的是ANSI里各种国家和语言的编码,如果将ANSI统一视 ...

UTF8-BOM怎么转到Ascii_ 啊?

我用 编码转换类_.转Utf8到Ascii_() 转换后头部会有个?问号

1105110683 发表于 2024-8-1 19:18:35

Xelloss0618 发表于 2024-7-31 19:00
只能自己判断前三个字节是否BOM,然后删掉,再转码

请问 字节集删除() 怎么用??


调试输出 (字节集删除 (读入文件 (文件路径, ), 0, 3))


错误: 无法将数据类型"空"转换到"通用型"

Xelloss0618 发表于 2024-8-1 23:21:05

1105110683 发表于 2024-8-1 19:18
请问 字节集删除() 怎么用??




字节集删除 没有返回值,直接修改第一个参数的字节集变量,你读入文件到一个字节集变量,再删除

1105110683 发表于 2024-8-1 23:32:04

Xelloss0618 发表于 2024-8-1 23:21
字节集删除 没有返回值,直接修改第一个参数的字节集变量,你读入文件到一个字节集变量,再删除 ...

谢谢大佬回答,我也是刚刚才想到的
页: [1]
查看完整版本: 请问读取文件编码类型问题?