用易语言写个简单的小爬虫其中的关键点

用易语言写个简单的小爬虫其中的关键点[Python常见问题]

一.请求头

ctrl+L快捷键创建变量

变量名 类型
协议参数 类_POST数据类
请求头数据 文本型

协议参数.添加 (“v”, “4.52.0”)

请求头数据 = 协议参数.获取协议头数据 ()

二.请求参数比如post

变量名 类型
请求data参数 类_POST数据类
请求data提交内容 文本型

请求data参数.添加 (“type”, “0”)

请求data提交内容 = 请求data参数.获取JSON文本 ()

三.进行请求

调用网页_访问S方法

.子程序 网页_访问S, 文本型, , 源码由[洫蜘蛛]提供,使用WinHttp的 API方式访问网页,如果返回是“?”请查询返回协议头是否有“Content-Encoding: gzip“表示gzip压缩过网页,可用 网页_GZIP解压()命令解压,如果返回是乱码,则返回原始文本,请自行转换编码,失败返回空文本,请取出状态文本。
.参数 网址, 文本型, , 完整的网页地址,必须包含http://或者https://
.参数 访问方式, 整数型, 可空 , 0=GET 1=POST 2=HEAD  3=PUT  4=OPTIONS  5=DELETE  6=TRACE  7=CONNECT
.参数 提交信息, 文本型, 可空 , POST专用
.参数 提交Cookies, 文本型, 参考 可空 , 设置提交时的cookie
.参数 返回Cookies, 文本型, 参考 可空 , 返回的Cookie
.参数 附加协议头, 文本型, 可空 , 一行一个请用换行符隔开,建议填写常量值或文本值,防止因传参引发错误
.参数 返回协议头, 文本型, 参考 可空 , 返回的协议头
.参数 禁止重定向, 逻辑型, 可空 , 默认不禁止网页重定向
.参数 网站登录用户名, 文本型, 可空 , 自动登录网页用户名 如路由器
.参数 网站登录密码, 文本型, 可空 , 
.参数 代理地址, 文本型, 可空 , 代理地址,格式为 8.8.8.8:88
.参数 代理帐号, 文本型, 可空 , 
.参数 代理密码, 文本型, 可空 , 
.参数 超时时间, 整数型, 可空 , 可以被省略,单位:秒,默认30秒,如果提供大于0的数值,则修改操作超时时间。
.参数 返回重定向, 文本型, 参考 可空 , 可以被省略,提供参数时只能提供文本型变量,用于当发生重定向时取回页面重定向的地址。
.参数 返回状态文本, 文本型, 参考 可空 , 
.参数 返回原始数据, 字节集, 参考 可空 , 可以被省略,返回原始网页编码
.参数 是否自动合并更新Cookie, 逻辑型, 可空 , 默认为真,自动合并更新
.参数 是否补全必要协议头, 逻辑型, 可空 , 当附件协议头为空时自动添加必要的UA协议头 默认为真,假将不再添加非传入协议头
.参数 字节集提交, 字节集, 可空 , 提交字节集数据
.参数 是否处理协议头大小写, 逻辑型, 可空 , 将协议头中的键名首字母处理为大写  默认为真

四.返回内容改成utf8编码

编码_utf8到gb2312(返回值)

五.展示效果图(涉及一些加密打码请谅解)


hmoban主题是根据ripro二开的主题,极致后台体验,无插件,集成会员系统
自学咖网 » 用易语言写个简单的小爬虫其中的关键点