接上篇必知开源项目 - Apache Tika 1,本文通过Tika API版、桌面版和服务器版演示Tika的使用。
public String detectDocTypeUsingFacade(InputStream stream) throws IOException {
Tika tika = new Tika();
String mediaType = tika.detect(stream);
return mediaType;
}
public Metadata parseMetadataUsingFacade(InputStream stream) throws IOException, TikaException {
Tika tika = new Tika();
Metadata metadata = new Metadata();
tika.parse(stream, metadata);
return metadata;
}
public static void parsePng(InputStream stream) throws TikaException, IOException, SAXException {
BodyContentHandler handler = new BodyContentHandler();
Metadata metadata = new Metadata();
metadata.set("Content-Type", "image/png");
ParseContext context = new ParseContext();
ImageParser parser = new ImageParser();
parser.parse(stream, handler, metadata, context);
System.out.println("Metadata:");
String[] metadataNames = metadata.names();
for (String name : metadataNames) {
System.out.println(name + ": " + metadata.get(name));
}
}
以上代码片段应用场景简单,但也可以反映出Tika API的简约和直接,学习曲线平缓。
┃桌面版
![](https://oss-emcsprod-public.modb.pro/wechatSpider/modb_20211206_39262d7e-5697-11ec-82c5-fa163eb4f6be.png)
┃服务器版
![](https://oss-emcsprod-public.modb.pro/wechatSpider/modb_20211206_399069fa-5697-11ec-82c5-fa163eb4f6be.png)
![](https://oss-emcsprod-public.modb.pro/wechatSpider/modb_20211206_39d595c0-5697-11ec-82c5-fa163eb4f6be.png)
如果喜欢,就亲自动手试一下吧!
文章转载自整码阁,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。