运维开发网
广告位招商联系QQ:123077622
 
广告位招商联系QQ:123077622

CountVectorizer与TfidfVectorizer的区别

运维开发网 https://www.qedev.com 2021-05-09 20:02 出处:51CTO 作者:wx60962e30e0986
CountVectorizer与TfidfVectorizer的区别,wx60962e30e0986的博客原创的其他文章。

CountVectorizer+TfidfTransformer组合使用

CountVectorizer会将文本中的词语转换为词频矩阵,它通过fit_transform函数计算各个词语出现的次数,通过get_feature_names()可获得所有文本的关键词,通过toarray()可看到词频矩阵的结果。

TfidfTransformer用于统计vectorizer中每个词语的TFIDF值。

TfidfVectorizer

将原始文档的集合转化为tf-idf特性的矩阵,相当于CountVectorizer配合TfidfTransformer使用的效果。

即TfidfVectorizer类将CountVectorizer和TfidfTransformer类封装在一起。

导入包:

from skleran.feature_extraction.text import CountVectorizer, TfidfTransformer
from sklearn.feature_extraction.text import TfidfVectorizer

扫码领视频副本.gif

0

精彩评论

暂无评论...
验证码 换一张
取 消