Java 获取Word中的标题大纲(目录) – E
概述
Word中的标题可通过“样式”中的选项来快速设置(如图1),
图1
在添加目录时,可将“有效样式”设置为“目录级别”显示(如图2),一定程度上来说,标题大纲也可以作为目录来参考。
图2
本文,将通过后端Java程序代码介绍如何来获取Word中的标题内容。
注:如果在Word中进行了如图2中的设置,此方法也可以作为获取目录的方法;若没有对应设置,则想要通过此方法来获取的目录内容可能不完整。
本次测试的Word文档如下图所示,【标题样式】和【目录级别】经过相应设置,在获取标题大纲时等同于获取目录:
图3
代码测试环境
- Word测试文档:.docx 2013版
- 编译环境:IntelliJ IDEA 2018
- Jdk版本:1.8.0
- Word jar包:free spire.doc.jar 3.9.0
Java 程序代码
import com.spire.doc.*; import com.spire.doc.documents.Paragraph; import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; public class GetTitle { public static void main(String[] args)throws IOException { //加载Word测试文档 Document doc = new Document(); doc.loadFromFile("sample.docx"); //保存标题内容到.txt文档 File file = new File("GetTitle.txt"); if (file.exists()) { file.delete(); } file.createNewFile(); FileWriter fw = new FileWriter(file, true); BufferedWriter bw = new BufferedWriter(fw); //遍历section for (int i = 0; i < doc.getSections().getCount(); i++) { Section section = doc.getSections().get(i); //遍历Paragraph for (int j = 0; j < section.getParagraphs().getCount(); j++) { Paragraph paragraph = section.getParagraphs().get(j); //获取标题 if ( paragraph.getStyleName().matches("1"))//段落为“标题1”的内容 { //获取段落标题内容 String text = paragraph.getText(); //写入文本到txt文档 bw.write("标题1: "+ text + ""); } //获取标题 if ( paragraph.getStyleName().matches("2"))//段落为“标题2”的内容 { //获取段落标题内容 String text = paragraph.getText(); //写入文本到txt文档 bw.write("标题2: " + text + ""); } //获取标题 if ( paragraph.getStyleName().matches("3"))//段落为“标题3”的内容 { //获取段落标题内容 String text = paragraph.getText(); //写入文本到txt文档 bw.write("标题3: " + text+""); } //获取标题 if ( paragraph.getStyleName().matches("4"))//段落为“标题4”的内容 { //获取段落标题内容 String text = paragraph.getText(); //写入文本到txt文档 bw.write("标题4: " + text+""); } bw.write(" "); } } bw.flush(); bw.close(); fw.close(); } }