《R语言数据高…" /> 《R语言数据高…" />
绑定完请刷新页面
取消
刷新

分享好友

×
取消 复制
R语言处理PDF软件包精选
2020-06-21 10:01:26

作者:黄天元,复旦大学博士在读,热爱数据科学与开源工具(R),致力于利用数据科学迅速积累行业经验优势和科学知识发现,涉猎内容包括但不限于信息计量、机器学习、数据可视化、应用统计建模、知识图谱等,著有《R语言高效数据处理指南》(《R语言数据高效处理指南》(黄天元)【摘要 书评 试读】- 京东图书)。知乎专栏:R语言数据挖掘邮箱:huang.tian-yuan@qq.com.欢迎合作交流。

R中可以对PDF做很多操作,如关键词提取、页数统计、多PDF拆分与合并等。这里精选相关R包,以便于后续取用。

CRAN - Package pdfsearch:可以找到关键字在PDF文件中的所在行,以及上下的行的文本。如果要对PDF文件做文本分析,是一个很好的工具。

CRAN - Package staplr:对PDF文件进行合并、拆分、删除、旋转、重命名等操作。

CRAN - Package qpdf:对PDF文件进行拆分、合并和压缩。

CRAN - Package pdftools:可以对PDF中的数据进行提取,同时可以高效转格式(如JPG等图片格式)。

分享好友

分享这个小栈给你的朋友们,一起进步吧。

R语言
创建时间:2020-06-15 11:46:51
R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的工具。
展开
订阅须知

• 所有用户可根据关注领域订阅专区或所有专区

• 付费订阅:虚拟交易,一经交易不退款;若特殊情况,可3日内客服咨询

• 专区发布评论属默认订阅所评论专区(除付费小栈外)

技术专家

查看更多
  • 小雨滴
    专家
戳我,来吐槽~