词频分析工具(Excel版)及使用说明_Excel达人网-EXCEL学习-Excel图表-EXCEL教程学习的网站! 

当前位置:office办公软件学习-Excel教程-PPT教程-Word教程 > EXCEL达人 > Excel应用 > 词频分析工具(Excel版)及使用说明

词频分析工具(Excel版)及使用说明

时间:2018-03-13 15:09来源:office办公达人网 作者:office办公达人整理 阅读:
【导读】:Excel词频分析工具是利用SCWS分词引擎所开发的一个Excel版的轻量级的在线词频统计分析工具,可以对文本文档中的中英文文字内容进行快速语义分词,统计词汇出现频次,显示词语词性。


 

中文分词 (Chinese Word Segmentation)是文本挖掘的基础,对于输入的一段中文,成功的进行中文分词,可以达到电脑自动识别语句含义的效果。在分词的基础上,词频分析(Word Frequency Analysis)是对文献正文中重要词汇出现的次数进行统计、分析,是文本挖掘的重要手段。

SCWS是Hightman开发的一套基于词频词典的机械中文分词引擎,它能将一整段的汉字基本正确的切分成词。采用的是采集的词频词典,并辅以一定的专有名称,人名,地名,数字年代等规则识别来达到基本分词,经小范围测试大概准确率在 90% ~ 95% 之间,已能基本满足一些小型搜索引擎、关键字提取等场合运用。

现在这个【Excel词频分析工具】是利用SCWS分词引擎所开发的一个Excel版的轻量级的在线词频统计分析工具,可以对文本文档中的中英文文字内容进行快速语义分词,统计词汇的出现频次,进行TF-IDF排名,并可显示词语的词性。

工具使用方法很简单,打开Excel工作簿,在启用宏并且在线联网的情况下,第一步点击【开始使用】按钮

第二步,在出现的【选项】对话框中设定选项,选项内部包含两部分。
第一部分是可以指定仅针对某一部分词性的词语进行统计,例如勾选“名词”和“动词”,就将只对这两类词语进行词频排名统计,而忽略其他词语。如果8个复选框全部留空不勾选,则默认会对所有类型的词语(包含这八种词性以外的词语)进行统计。
第二部分是可以设定排名显示的数量,范围在1~100之间,最多可以显示排名前100名的词语。
这里的排名指的是TF-IDF排名,而并非单纯是词语出现次数的排名。


 

第三步,需要在电脑中指定需要进行分析的目标文档,这个文档的类型必须是文本文档,可以事先将需要分析的文字内容放置在文本文档中。


 

上述步骤完成之后,就会立即在Excel当中显示结果。结果包括一份排名表格,其中显示TF-IDF排名、词语、词性以及词频(词语出现次数)。还会有一份条形图显示排名前10位的词语。


 

这个工具跟专业的分析工具相比还是有些差距,但还是适合一些轻量级的小应用,比如分析一下博客、论文或聊天记录,分析某个著名演讲或工作报告等等,娱乐性和实用性兼备。

如果服务器功能改变或因访问量太大而停止响应,此工具的功能将受影响。欢迎有志者提供长期稳定的分词引擎资源。

工具下载:http://www.officedoyen.com/a/excelgongju/2018/0313/16557.html

分享到
更多
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
文章点击榜
推荐内容
最新文章
关于我们 | 联系我们 | 友情链接 | 版权声明 | 网站地图 | 帮助
网站为公益性网站,部分内容来源网络,如无意中侵犯了您的版权,请来信告知,我们会在第一时间处理
CopyRight© 2013-2018,www.officedoyen.com 版权所有   闽ICP备14010062号