首页 编程设计易语言正文

易语言爬取网页内容方法

云水 易语言 2020-05-09 10:25:55 2323 0 易语言

写个辅助工具的时候需要提取网页里面的某些内容,我这里便把方法告诉大家,希望对大家有所帮助,记得投票给我哦!

image.png

1、在新建的windos窗口程序中画:

两个编辑框、一个按钮

再添加模块如图中三步!

我们来实现,在一个编辑框中输入网址后,点击按钮,然后取到指定内容到编辑框2中。

image.png

2、比如我们来取百度某贴吧一个帖子内的内容!如下图中的“跑遍数码城,XXXXX”。

我们在该页面上右键---->查看网页源码(或查看源文件)。

image.png

3、在打开的源文件内容中按CTRL+F组合键查找“跑遍数码城”,我们只要一个开文中一部分就行了!找到对应的文字后,我们找到和网页中完全对应的那部分代码。

PS:可能会出现几个被找到的内容,但是只要找到你需要取的那段全部对应部分就行。

image.png

4、复制正文中的前面的部分代码,不要复制太多的内容,待会我们用正文前的内容找到中间的内容。

然后在易语言中新建一个文本常量,把复制到的内容粘贴到“常量值”里面去。

image.png

image.png

5、然后我们去复制正文后面的一小段代码,同样新建一个文本常量,然后粘贴到常量值里面去。

image.png

6、此时我们回到编程程序中,点击按钮,在生成的“_按钮1_被单击”子程序下面新建一个文本型变量“得到的内容”,然后输入以下代码:

得到的内容 = 网页_访问s (编辑框1.内容)

编辑框2.内容 = 文本_取出中间文本 (得到的内容, #常量1, #常量2)

PS:第一行是把把编辑框中的网址打开后得到的网页源码赋值给“得到的内容”这个文本变量。

第二行则是对“得到的文本”进行取中间文本操作,文本_取出中间文本()是一个程序!它能取出中间内容的程序!

image.png

7、最后我们把程序调试运行一下,点击按钮“取内容”,是不是成功了呢?打开其他帖子取也是有效的,只要你取前后代码是正确的!

如果你是需要网页的源码,只要使用程序“ 网页_访问s()”,就然后把它赋值输出就OK了。当然!括号里面要有网页地址!

image.png


版权声明

1.本站大部分下载资源收集于网络,不保证其完整性以及安全性,请下载后自行测试。
2.本站资源仅供学习和交流使用,版权归资源原作者所有,请在下载后24小时之内自觉删除。
3.若作商业用途,请购买正版,由于未及时购买和付费发生的侵权行为,与本站无关。
4.若内容涉及侵权或违法信息,请联系本站管理员进行下架处理,邮箱ganice520@163.com(本站不支持其他投诉反馈渠道,谢谢合作)

本文链接:http://apod.cc/index.php/post/386.html

发表评论

评论列表(0人评论 , 2323人围观)
☹还没有评论,来说两句吧...