python爬虫中lxml如何测试?
做编程的一个重要环节,就是学会做测试。不然光写代码也是不行的,毕竟代码需要落实到实处才能产生价值。lxml获取网页的知识我们暂且不讲。喜欢实践的小伙伴一定不要错过今天的内容,测试还是非常有意思的。接下来小编带着大家一起l学习xml在python中的测试吧~
代码:
from lxml import etree html = etree.parse('hello.html') print type(html) result = html.xpath('//li') print result print len(result) print type(result) print type(result[0])
运行结果
<type 'lxml.etree._ElementTree'> [<Element li at 0x1014e0e18>, <Element li at 0x1014e0ef0>, <Element li at 0x1014e0f38>, <Element li at 0x1014e0f80>, <Element li at 0x1014e0fc8>] 5 <type 'list'> <type 'lxml.etree._Element'>
可见,etree.parse 的类型是 ElementTree,通过调用 xpath 以后,得到了一个列表,包含了 5 个
-
元素,每个元素都是 Element 类型 (2)获取
-
标签的所有 class
result = html.xpath('//li/@class') print result
运行结果
['item-0', 'item-1', 'item-inactive', 'item-1', 'item-0']
以上就是python爬虫中lxml测试的一些实例。更多Python学习推荐:云海天Python教程网。
来源:PY学习网:原文地址:https://www.py.cn/article.html