创世魂 发表于 2022-8-28 16:52 个别网页服务器,比较恶心,就拿抖音快手来讲,你直接访问得到的就是个gzip网页数据包。除非你加上正确协议头。才能得到明文网页数据。 |
server 发表于 2022-8-28 19:38 明白了!!! 感谢大哥指点迷津,受益匪浅,感激不尽!!! |
|
敢不敢把你获取的数据 事先保存到文件,自己用眼先看看是什么个东西。 看清楚了,是否因为你访问协议头的问题,导致了,你获取的原始网页数据,就是几个GZIP 包呢???? |
| 参与人数 1 | 金钱 +15 | 收起 理由 |
|---|---|---|
|
| + 15 | 赞一个! |
创世魂 发表于 2022-8-28 16:52 我第三张图里用的是多字节到文本的,但是有时候就是请求不出来,但用浏览器和抓包软件就能每次都请求出来 |
|
网页编码是gbk的需要用 多字节到文本 方法 网页编码是utf8的使用 utf8到文本 方法。。 你发的这两个网站都是gbk的网页用 多字节到文本 |
这是我的代码,有没有有经验的朋友帮忙看一下是什么出了问题,指点一下,谢谢了!
网页访问.zip
(58.22 KB, 下载次数: 0)
|
|Archiver|手机版|小黑屋|递归火山软件开发平台
( 鄂ICP备18029190号 )
GMT+8, 2025-10-25 00:07 , Processed in 0.090829 second(s), 23 queries .
Powered by Discuz! X3.4
© 2001-2017 Comsenz Inc.