1185907650 发表于 2021-6-17 16:32:13

火山视窗CEF浏览器解析网页取**热搜词

本源码转载自利快云https://www.lkuaiy.com/

火山视窗CEF浏览器解析网页取**热搜词 通过本例程可以学习到cef浏览器取网页源码,html解析获取网页关键词。一、准备工作1、简单的设计一个界面。https://www.lkuaiy.com/image/editor/16238942615709.png 2、教程这里使用火狐浏览器,用火狐浏览器打开**,打开火狐浏览器的开发者工具,也就是网页右键选择“检查”。 https://www.lkuaiy.com/image/editor/16238942678862.png 3、选择“查看器”,比如你想取**的热搜榜。光标定位选中。 https://www.lkuaiy.com/image/editor/16238942797906.gif

https://www.lkuaiy.com/image/editor/16238942951974.png 3、右键复制,选择CSS选择器。 https://www.lkuaiy.com/image/editor/16238943086426.png 4、同样的操作在,选中另外一条热搜,并复制CSS选择器。https://www.lkuaiy.com/image/editor/16238943153570.png 5、最后复制出来后会出现以下两条数据,会看到基本一样,只是前面的一个序号不同,如果直接用这个路径地址只能取出特定的热搜词。li.hotsearch-item:nth-child(1) > a:nth-child(1) > span:nth-child(2)li.hotsearch-item:nth-child(3) > a:nth-child(1) > span:nth-child(2) 如果想要循环取出所有的热搜词,需要改成下面的格式,将第一项的li标签保留,其余内容全部删除,因为在这里第一项相当于数组,如果想要取出这个数组所有成员,就需要将成员索引信息删掉。li> a:nth-child(1) > span:nth-child(2) 6、添加html解析工具类模块。 https://www.lkuaiy.com/image/editor/16238943358406.png 7、首先调用取框架方法,取出框架后才能取源代码。8、定义“高级网页解析器”变量,根据网页源码创建解析器。9、创建后调用“cha询元素”就可以根据CSS路径进行网页元素cha询。10、cha询结束后利用计次循环,循环所有节点。11、最后取出节点文本。https://www.lkuaiy.com/image/editor/16238943424532.png 12、点击按钮就可以解析出所有的热搜词。https://www.lkuaiy.com/image/editor/16238943511768.png **** Hidden Message *****







大强 发表于 2021-6-17 16:51:35

学习……

网络注册会员 发表于 2021-6-17 20:15:22


学习……

1185907650 发表于 2021-6-26 14:22:21

每日一顶:)

xshn 发表于 2021-6-26 14:32:41

感谢大佬,跟着楼主学了不少的东西了

mudou 发表于 2021-7-19 13:26:22

:)谢谢楼主分享,好好学习一下

zhqyong 发表于 2022-8-12 10:29:49

非常好的教材

麦克斯韦 发表于 7 天前

请教,能不能取出节点的html源码
页: [1]
查看完整版本: 火山视窗CEF浏览器解析网页取**热搜词