绑定完请刷新页面
取消
刷新

分享好友

×
取消 复制
爬虫提取非结构化数据
2020-01-10 17:51:18

    pdf:pdfBox解析pdf文档

word:poi

rtf:rtfconverter4j

excel:jxl,poi,数据库访问jsqlparser

powerpoint:poi

图片:javax.imageio.Imageio

        二值化:

 

架构师日常笔记

分享好友

分享这个小栈给你的朋友们,一起进步吧。

运维部落
创建时间:2019-09-15 22:54:27
关于运维,你想知道的,这里都有
展开
订阅须知

• 所有用户可根据关注领域订阅专区或所有专区

• 付费订阅:虚拟交易,一经交易不退款;若特殊情况,可3日内客服咨询

• 专区发布评论属默认订阅所评论专区(除付费小栈外)

栈主、嘉宾

查看更多
  • stanleylst
    栈主

小栈成员

查看更多
  • 小尾巴鱼
  • Cyj_me
  • lpysky
  • 栈栈
戳我,来吐槽~