当前位置：自学咖网 > 技术教程 > 编程最新 > jsoup教程

wen 编程最新 2024-01-31

jsoup教程

jsoup是一款Java的HTML解析器，主要用来对HTML解析。官网

在爬虫的时候，当我们用HttpClient之类的框架，获取到网页源码之后，需要从网页源码中取出我们想要的内容，

就可以使用jsoup这类HTML解析器了。可以非常轻松的实现。

虽然jsoup也支持从某个地址直接去爬取网页源码，但是只支持HTTP，HTTPS协议，支持不够丰富。

所以，主要还是用来对HTML进行解析。

其中，要被解析的HTML可以是一个HTML的字符串，可以是一个URL，可以是一个文件。

org.jsoup.Jsoup把输入的HTML转换成一个org.jsoup.nodes.Document对象，然后从Document对象中取出想要的元素。

org.jsoup.nodes.Document继承了org.jsoup.nodes.Element，Element又继承了org.jsoup.nodes.Node类。里面提供了丰富的方法来获取HTML的元素。

从URL获取HTML来解析

Document doc = Jsoup.connect("http://www.baidu.com/").get();
String title = doc.title();

hmoban主题是根据ripro二开的主题，极致后台体验，无插件，集成会员系统
自学咖网 » jsoup教程

wen 普通

分享到：

相关推荐

php怎么用for循环求数组最大值

步骤：1、用array_values()将数组转为索引数组；2、定义了1个变量来存放最大值，语法“$m=$arr[0];”；3、利用for语句遍历数组，语法“for($i=0;$i<数组长度;$i++){̷...

编程最新 2024-01-31
39

Go 语言高性能编程

目录序言关于本书第一章性能分析 benchmark 基准测试 pprof 性能分析第二章常用数据结构字符串拼接性能及原理切片(slice)性能及陷阱 for 和 range 的性能比较反射(reflec...

编程最新 2024-01-31
41

面试官：手写一个必然死锁的例子？一顿操作猛如虎。。

来源：blog.csdn.net/xiewenfeng520/article/details/107230996 前言只对死锁代码感兴趣的可以直接跳到第三小节必然死锁示例，如果对死锁还不太了解的，我们可以一起来讨论以...

编程最新 2024-01-31
39

php可以直接输出字符串吗

php可以直接输出字符串。PHP提供了多种字符串输出函数：1、echo()，可直接输出一个或多个字符串；2、print()，可直接输出一个或多个字符串；3、die()或exit()，可以输出一个消息并退出当前脚本；4、p...

编程最新 2024-01-26
41

MyBatis（五）：配置之属性优化

一、什么是配置之属性优化在解答这个问题之前我们应该先明白MyBatis的配置有哪些？官方文档中文网：配置_MyBatis中文网。我们还是直接看官方文档中给出的内容： MyBatis 的配置文件包含了会深深影响 My...

编程最新 2024-01-31
39

负载均衡 LVS vs Nginx 对比，还傻傻分不清？

作者：等不到的口琴链接：www.cnblogs.com/Courage129/p/14383897.html 今天总结一下负载均衡中LVS与Nginx的区别,好几篇博文一开始就说LVS是单向的,Nginx是双向的,我个...

编程最新 2024-01-31
40

自学咖网