用易语言写个简单的小爬虫其中的关键点
一.请求头
ctrl+L快捷键创建变量
变量名 | 类型 |
---|---|
协议参数 | 类_POST数据类 |
请求头数据 | 文本型 |
协议参数.添加 (“v”, “4.52.0”)
请求头数据 = 协议参数.获取协议头数据 ()
二.请求参数比如post
变量名 | 类型 |
---|---|
请求data参数 | 类_POST数据类 |
请求data提交内容 | 文本型 |
请求data参数.添加 (“type”, “0”)
请求data提交内容 = 请求data参数.获取JSON文本 ()
三.进行请求
调用网页_访问S
方法
.子程序 网页_访问S, 文本型, , 源码由[洫蜘蛛]提供,使用WinHttp的 API方式访问网页,如果返回是“?”请查询返回协议头是否有“Content-Encoding: gzip“表示gzip压缩过网页,可用 网页_GZIP解压()命令解压,如果返回是乱码,则返回原始文本,请自行转换编码,失败返回空文本,请取出状态文本。
.参数 网址, 文本型, , 完整的网页地址,必须包含http://或者https://
.参数 访问方式, 整数型, 可空 , 0=GET 1=POST 2=HEAD 3=PUT 4=OPTIONS 5=DELETE 6=TRACE 7=CONNECT
.参数 提交信息, 文本型, 可空 , POST专用
.参数 提交Cookies, 文本型, 参考 可空 , 设置提交时的cookie
.参数 返回Cookies, 文本型, 参考 可空 , 返回的Cookie
.参数 附加协议头, 文本型, 可空 , 一行一个请用换行符隔开,建议填写常量值或文本值,防止因传参引发错误
.参数 返回协议头, 文本型, 参考 可空 , 返回的协议头
.参数 禁止重定向, 逻辑型, 可空 , 默认不禁止网页重定向
.参数 网站登录用户名, 文本型, 可空 , 自动登录网页用户名 如路由器
.参数 网站登录密码, 文本型, 可空 ,
.参数 代理地址, 文本型, 可空 , 代理地址,格式为 8.8.8.8:88
.参数 代理帐号, 文本型, 可空 ,
.参数 代理密码, 文本型, 可空 ,
.参数 超时时间, 整数型, 可空 , 可以被省略,单位:秒,默认30秒,如果提供大于0的数值,则修改操作超时时间。
.参数 返回重定向, 文本型, 参考 可空 , 可以被省略,提供参数时只能提供文本型变量,用于当发生重定向时取回页面重定向的地址。
.参数 返回状态文本, 文本型, 参考 可空 ,
.参数 返回原始数据, 字节集, 参考 可空 , 可以被省略,返回原始网页编码
.参数 是否自动合并更新Cookie, 逻辑型, 可空 , 默认为真,自动合并更新
.参数 是否补全必要协议头, 逻辑型, 可空 , 当附件协议头为空时自动添加必要的UA协议头 默认为真,假将不再添加非传入协议头
.参数 字节集提交, 字节集, 可空 , 提交字节集数据
.参数 是否处理协议头大小写, 逻辑型, 可空 , 将协议头中的键名首字母处理为大写 默认为真
四.返回内容改成utf8编码
编码_utf8到gb2312(返回值)