绑定完请刷新页面
取消
刷新

分享好友

×
取消 复制
[python]请问tf-idf的实现方法
2019-11-12 11:35:20

python中有TfidfVectorizer可以实现tf-idf值的计算,

我想要获取的特征词已经整理好了,例如下面这样

This_is_bookThis_is_apple

我想要计算的是This_is_book和This_is_apple的tf-idf值,

可是用TfidfVectorizer的话,它就自动帮我把词汇拆分成This,is,book,apple这4个词了。

用TfidfVectorizer后的输出结果:

This This的tf-idf值isis的tf-idf值book book的tf-idf值apple apple的tf-idf值

想要的输出结果:

This_is_bookThis_is_book的tf-idf值This_is_apple This_is_apple的tf-idf值

请问TfidfVectorizer中设置什么参数可以让它不要自动拆分词汇呢?

或者如何自己写tf-idf的计算程序?

分享好友

分享这个小栈给你的朋友们,一起进步吧。

IT知识联盟
创建时间:2019-07-05 15:30:45
分享收集到的大小知识点
展开
订阅须知

• 所有用户可根据关注领域订阅专区或所有专区

• 付费订阅:虚拟交易,一经交易不退款;若特殊情况,可3日内客服咨询

• 专区发布评论属默认订阅所评论专区(除付费小栈外)

栈主、嘉宾

查看更多
  • 王超
    栈主

小栈成员

查看更多
  • ?
  • youou
  • gamebus
  • chinacc
戳我,来吐槽~