递归火山软件开发平台

标题: 关于取网络源码内容 [打印本页]

作者: luyk    时间: 2022-9-22 15:49
标题: 关于取网络源码内容
最近在学习取网络源码,但是发现例程里面有一些是用HTML取网络源码内的元素数据,通过JSON解析获取到相关的表单数据,有的又是通过正则匹配的方式取得子文本数据,请问这是两种方法都能实现,还是说需要看网页的源码结构,根据结构选择究竟用什么样的方法。

作者: fan15500    时间: 2022-9-22 17:58
要看你获取的是什么,获取到json格式的 数据,自然用json解析,获取到其他格式的,用其他方法解析。
需要看网页的源码结构,根据结构选择究竟用什么样的方法。
作者: edu    时间: 2022-9-22 18:27
数据结构不同就用不同的解析工具。HTML和JSON是两种不同的结构
作者: shuimiao    时间: 2022-9-22 20:06
其实你说的就是答案。肯定要根据网页内容来灵活获得数据啊。json,html,正则,取文本中间,这几种
作者: luyk    时间: 2022-9-24 14:43
fan15500 发表于 2022-9-22 17:58
要看你获取的是什么,获取到json格式的 数据,自然用json解析,获取到其他格式的,用其他方法解析。
需要看 ...

好的,感谢指点,也就是首要要弄清楚获取到的网页源码是什么格式的,然后再按照相对应的方法进行解析。
作者: luyk    时间: 2022-9-24 14:44
edu 发表于 2022-9-22 18:27
数据结构不同就用不同的解析工具。HTML和JSON是两种不同的结构

嗯,感谢指点
作者: luyk    时间: 2022-9-24 14:47
shuimiao 发表于 2022-9-22 20:06
其实你说的就是答案。肯定要根据网页内容来灵活获得数据啊。json,html,正则,取文本中间,这几种 ...

好的,感谢,首先还是要看是什么样的结构才能确定对应什么工具解析,看来还是要学习学习HTml的知识




欢迎光临 递归火山软件开发平台 (https://bbs.voldp.com/) Powered by Discuz! X3.4