递归火山软件开发平台

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 火山 源码 类库
查看: 1964|回复: 6
打印 上一主题 下一主题

[视窗] 请问读取文件编码类型问题?

[复制链接]

7

主题

20

帖子

81

积分

注册会员

Rank: 2

积分
81
跳转到指定楼层
楼主
发表于 2024-7-31 10:31:00 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
文件里有英文和中文,文件可能会是UTF-8 或者是ANSI编码, 但是我读入文件后英文能正常显示,中文就乱码了,我想不管文件是UTF-8还是ANSI编码都能读取到中文内容该怎么写?
回复

使用道具 举报

26

主题

1900

帖子

6926

积分

核心用户

Rank: 9Rank: 9Rank: 9

积分
6926
来自 2#
发表于 2024-7-31 10:40:59 | 只看该作者
ANSI、UTF-8、UTF-16这几种编码还是很好判断的,难判断的是ANSI里各种国家和语言的编码,如果将ANSI统一视为GBK,那还是挺简单。
第三方模块有现成的命令,比如PIV模块的「simdUTF.自动检测编码」,火山模块的「编码判断类_」
回复

使用道具 举报

26

主题

1900

帖子

6926

积分

核心用户

Rank: 9Rank: 9Rank: 9

积分
6926
来自 4#
发表于 2024-7-31 19:00:46 | 只看该作者
1105110683 发表于 2024-7-31 18:03
UTF8-BOM怎么转到Ascii_ 啊?

我用 编码转换类_.转Utf8到Ascii_() 转换后头部会有个?问号 ...

只能自己判断前三个字节是否BOM,然后删掉,再转码
回复

使用道具 举报

7

主题

20

帖子

81

积分

注册会员

Rank: 2

积分
81
板凳
 楼主| 发表于 2024-7-31 18:03:08 | 只看该作者
Xelloss0618 发表于 2024-7-31 10:40
ANSI、UTF-8、UTF-16这几种编码还是很好判断的,难判断的是ANSI里各种国家和语言的编码,如果将ANSI统一视 ...

UTF8-BOM怎么转到Ascii_ 啊?

我用 编码转换类_.转Utf8到Ascii_() 转换后头部会有个?问号
回复

使用道具 举报

7

主题

20

帖子

81

积分

注册会员

Rank: 2

积分
81
5#
 楼主| 发表于 2024-8-1 19:18:35 | 只看该作者
Xelloss0618 发表于 2024-7-31 19:00
只能自己判断前三个字节是否BOM,然后删掉,再转码

请问 字节集删除() 怎么用??


调试输出 (字节集删除 (读入文件 (文件路径, ), 0, 3))


错误: 无法将数据类型"空"转换到"通用型"
回复

使用道具 举报

26

主题

1900

帖子

6926

积分

核心用户

Rank: 9Rank: 9Rank: 9

积分
6926
6#
发表于 2024-8-1 23:21:05 | 只看该作者
1105110683 发表于 2024-8-1 19:18
请问 字节集删除() 怎么用??

字节集删除 没有返回值,直接修改第一个参数的字节集变量,你读入文件到一个字节集变量,再删除
回复

使用道具 举报

7

主题

20

帖子

81

积分

注册会员

Rank: 2

积分
81
7#
 楼主| 发表于 2024-8-1 23:32:04 | 只看该作者
Xelloss0618 发表于 2024-8-1 23:21
字节集删除 没有返回值,直接修改第一个参数的字节集变量,你读入文件到一个字节集变量,再删除 ...

谢谢大佬回答,我也是刚刚才想到的
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|递归火山软件开发平台 ( 鄂ICP备18029190号 )

GMT+8, 2024-11-24 09:02 , Processed in 0.092591 second(s), 20 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表