AntConc小白教程（4）| 词丛 Clusters

一者科技 作者：一者君 2018-06-27 投诉

阅读数：19922

AntConc教程（3）推出已经是3个月之前的事情了，很多小伙伴一度以为一者君弃更了……

忙完了全国高校翻译技术科普的巡回，一者君还是那个写教程的少年~So，谁的小眼睛，还没看教程？

词丛 Clusters

通过Clusters这一功能，可以把检索词及其临近的词生成一个列表，并且可以根据自身的需求进行排序分析。

1. 加载语料库后，单击“Clusters/N-Grams”进入词丛选项卡。在检索框中输入检索词，本文以“report”为例，可以检索到report右边的第一个词（区分大小写、正则表达式以及高级检索，在之前的文章中已经介绍过，这里便不过多赘述了哦）。

2. 若要查看report左边的第一个词，只需要将“Search Term Position”中的“On Left”改成“On Right”即可。

3. 我们还可以在“Cluster Size”中设置词丛的最小长度与最大长度，并且可以设置词丛的最小频率（Min. Freq.）和该词在几篇语篇中的最少分布情况（Min. Range.）。

4. 我们还可以根据词丛的频率（Sort by Freq）、在语篇中的分布（Sort by Range）、第一个单词出现的概率（Sort by Prob），词头（Sort by Word）或词尾（Sort by Word End）进行排序。通过“Invert Order”改变升序或降序。选择完成后，单击“Sort”即可。

当选中“Sort by Prob”时，系统会提示错误，这是因为我们没有在显示区列出概率这一字段。需要在偏好设置中设置。

在“Tool Preferences-Clusters/N-Grams”中，选中“Transitional probability between first and other words”即可。在“Other Options”中还可以对大小写排序等进一步设置哦。

5. 单击“Clone Results”可以生成多个窗口进行对比分析。

6. 若想查看检索到词丛的详细信息，单击该词丛，则会自动跳转到索引界面中了哦。

下期我们将介绍N-Grams的用法，敬请期待哦。

关注Tmxmall官方微信，获取更多精彩资讯

一者科技

上海一者信息科技有限公司由来自百度和华为的核心技术人员于2014年9月创建，成员大多毕业于复旦、上外、天大、东南、西工大等全国“双一流” 知名院校。公司目前已获得30余项软件著作权、7项商标、授权及受理专利10余项，同时获得1项上海市高新技术成果转化认证、ISO27001信息安全管理体系认证和ISO9001质量管理体系认证。

+关注

快速开通微博你可以查看更多内容，还可以评论、转发微博。