luyk 发表于 2022-9-22 15:49:44

关于取网络源码内容

最近在学习取网络源码,但是发现例程里面有一些是用HTML取网络源码内的元素数据,通过JSON解析获取到相关的表单数据,有的又是通过正则匹配的方式取得子文本数据,请问这是两种方法都能实现,还是说需要看网页的源码结构,根据结构选择究竟用什么样的方法。

fan15500 发表于 2022-9-22 17:58:41

要看你获取的是什么,获取到json格式的 数据,自然用json解析,获取到其他格式的,用其他方法解析。
需要看网页的源码结构,根据结构选择究竟用什么样的方法。

edu 发表于 2022-9-22 18:27:26

数据结构不同就用不同的解析工具。HTML和JSON是两种不同的结构

shuimiao 发表于 2022-9-22 20:06:33

其实你说的就是答案。肯定要根据网页内容来灵活获得数据啊。json,html,正则,取文本中间,这几种

luyk 发表于 2022-9-24 14:43:08

fan15500 发表于 2022-9-22 17:58
要看你获取的是什么,获取到json格式的 数据,自然用json解析,获取到其他格式的,用其他方法解析。
需要看 ...

好的,感谢指点,也就是首要要弄清楚获取到的网页源码是什么格式的,然后再按照相对应的方法进行解析。

luyk 发表于 2022-9-24 14:44:48

edu 发表于 2022-9-22 18:27
数据结构不同就用不同的解析工具。HTML和JSON是两种不同的结构

嗯,感谢指点

luyk 发表于 2022-9-24 14:47:23

shuimiao 发表于 2022-9-22 20:06
其实你说的就是答案。肯定要根据网页内容来灵活获得数据啊。json,html,正则,取文本中间,这几种 ...

好的,感谢,首先还是要看是什么样的结构才能确定对应什么工具解析,看来还是要学习学习HTml的知识
页: [1]
查看完整版本: 关于取网络源码内容