从 HTML 文档文件中提取数据

Jsoup 可用于操作或从包含 HTML 的本地文件中提取数据。filePath 是磁盘上文件的路径。ENCODING 是理想的 Charset Name,例如“Windows-31J”。这是可选的。

 // load file
    File inputFile = new File(filePath);
    // parse file as HTML document
    Document doc = Jsoup.parse(filePath, ENCODING);
    // select element by <a> 
    Elements elements = doc.select("a");