递归火山软件开发平台

标题: 求助HTML解析定位不到标签 [打印本页]

作者: qsw296062081    时间: 2022-12-27 11:00
标题: 求助HTML解析定位不到标签
网址:https://share.weiyun.com/EPtuw30g (, 下载次数: 47) (, 下载次数: 45)


解析不到内容,大佬们给看看。

作者: 创世魂    时间: 2022-12-27 12:23
浏览器里面f12 看到的内容 和 取网页源码看到的内容是不一样的。
所以你这个无法解析是正常的。。

作者: edu    时间: 2022-12-27 14:16
右键查看网页源代码你就会发现
作者: BYWMnn9QFz59L6    时间: 2022-12-28 10:05
按CTRL+U看一眼,像有些VUE制作的网页都是用JS动态渲染的,所以普通的HTML取网页源代码就抓不出来浏览器F12看到的内容,可以尝试使用playwright或者selenium这些工具来获取渲染后的源代码
作者: qsw296062081    时间: 2022-12-28 17:06
BYWMnn9QFz59L6 发表于 2022-12-28 10:05
按CTRL+U看一眼,像有些VUE制作的网页都是用JS动态渲染的,所以普通的HTML取网页源代码就抓不出来浏览器F12 ...

工具没用过 我是新手
作者: qsw296062081    时间: 2022-12-28 17:07
edu 发表于 2022-12-27 14:16
右键查看网页源代码你就会发现

看到了是js代码,但是也在p标签里面
作者: qsw296062081    时间: 2022-12-28 17:09
创世魂 发表于 2022-12-27 12:23
浏览器里面f12 看到的内容 和 取网页源码看到的内容是不一样的。
所以你这个无法解析是正常的。。
...

东西不一样那要html工具干嘛   直接解析js不就行,

搞了半天,才发现网页和安卓的类名不一样,改类名就好了
作者: 1325901607    时间: 2022-12-29 22:31
.ql-editor-inner > p:nth-child(1)这个是第一行字
.ql-editor-inner > p:nth-child(2)这个是第二行字
用这个解析,大哥下面的
.ql-editor-inner > p

作者: qsw296062081    时间: 2022-12-30 15:12
1325901607 发表于 2022-12-29 22:31
.ql-editor-inner > p:nth-child(1)这个是第一行字
.ql-editor-inner > p:nth-child(2)这个是第二行字
用 ...

非常感谢答复已经找到 了
写法div.ql-editor.ql-blank > p
还有协议头得大写User-Agent




欢迎光临 递归火山软件开发平台 (https://bbs.voldp.com/) Powered by Discuz! X3.4