|
我们了解学习网页操作后接下来我们就开始慢慢分析网页,下面我们将实现取出大彩官网网页的几个文字内容。
准备工具:电脑浏览器,记事本
1、让我们用电脑浏览器访问网址www.gz-dc.com
2、按下电脑键盘的Ctrl+U按键以切换到网页源码页面。
- <!DOCTYPE html>
- <html lang="en">
- <head>
- <meta charset="UTF-8">
- <meta name="viewport" content="width=device-width, initial-scale=1.0">
- <meta http-equiv="X-UA-Compatible" content="ie=edge">
- <title>广州大彩专注组态串口屏,国内首创《虚拟串口屏》,大彩屏无需购买硬件!主营串口屏,串口显示屏,86面板,串口彩屏,触摸屏,HMI人机界面</title>
- <meta name="keywords" content="串口屏,工业串口屏,组态屏,大彩屏,串口显示屏,86面板,串口彩屏,触摸屏,HMI人机界面" />
- <meta name="description" content="广州大彩始终专注组态串口屏,工业串口屏,串口显示屏,86面板,串口彩屏,触摸屏,大彩屏是人机界面的技术创新,大彩不断优化串口屏硬件和上位机功能,咨询电话(020)82186683-601" />
- <link rel="stylesheet" href="/Public/css/bootstrap.min.css">
复制代码
3、在网页源码中有很多的html代码,我们此课程主要是实现取出部分文字,所以就要用到分割字符串或取文本中间的功能。
例如我们需要取出网页用的是什么编码,就需要先进行源码分析,现在找出来的是
此处UTF-8即是当前页面所用的编码文件,取出文件编码亦简单,使用取文本中间方式即可。取文本中间需要知道且不会改变的文字左边和文字右边,这样才能取出中间的文字,那么我们在这段代码中即是 <meta charset=" | 文字左边 | "> | 文字右边 |
当然提取字符的方式有很多,后续代码部分这边统一使用e_module.lua模块文件所包含的函数进行操作。
下面我们需要分析大彩官网网页的标题title,所以找到了这段代码
- <title>广州大彩专注组态串口屏,国内首创《虚拟串口屏》,大彩屏无需购买硬件!主营串口屏,串口显示屏,86面板,串口彩屏,触摸屏,HMI人机界面</title>
复制代码 <title> | 文字左边 | </title> | 文字右边
| 我们在寻找文字左右标记的时候,也需要注意看看是否Html代码中是否有相同的标志,例如在上述第二步html展示的片段中<meta name=标志有重复的,所以在提取时需要注意先后顺序,也可以采用多次提取标志的方式进行缩小范围。
举个例子:
在这个代码中我们需要提取出<b>ddd</b>的内容ddd,但是
有多个,这个时候我们就需要进一步缩小范围了,例如第一步获取
<div class="c"> | 文字左边 | </div> | 文字右边
| 将得到
第二步获取
将得到需要的ddd
下一节主要讲如何在大彩开发工具VisualTFT中如何操作。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|