AntConc小白教程(4)| 词丛 Clusters
AntConc教程(3)推出已经是3个月之前的事情了,很多小伙伴一度以为一者君弃更了……
忙完了全国高校翻译技术科普的巡回,一者君还是那个写教程的少年~So,谁的小眼睛,还没看教程?
词丛 Clusters
通过Clusters这一功能,可以把检索词及其临近的词生成一个列表,并且可以根据自身的需求进行排序分析。
1. 加载语料库后,单击“Clusters/N-Grams”进入词丛选项卡。在检索框中输入检索词,本文以“report”为例,可以检索到report右边的第一个词(区分大小写、正则表达式以及高级检索,在之前的文章中已经介绍过,这里便不过多赘述了哦)。
2. 若要查看report左边的第一个词,只需要将“Search Term Position”中的“On Left”改成“On Right”即可。
3. 我们还可以在“Cluster Size”中设置词丛的最小长度与最大长度,并且可以设置词丛的最小频率(Min. Freq.)和该词在几篇语篇中的最少分布情况(Min. Range.)。
4. 我们还可以根据词丛的频率(Sort by Freq)、在语篇中的分布(Sort by Range)、第一个单词出现的概率(Sort by Prob),词头(Sort by Word)或词尾(Sort by Word End)进行排序。通过“Invert Order”改变升序或降序。选择完成后,单击“Sort”即可。
当选中“Sort by Prob”时,系统会提示错误,这是因为我们没有在显示区列出概率这一字段。需要在偏好设置中设置。
在“Tool Preferences-Clusters/N-Grams”中,选中“Transitional probability between first and other words”即可。在“Other Options”中还可以对大小写排序等进一步设置哦。
5. 单击“Clone Results”可以生成多个窗口进行对比分析。
6. 若想查看检索到词丛的详细信息,单击该词丛,则会自动跳转到索引界面中了哦。
下期我们将介绍N-Grams的用法,敬请期待哦。
关注Tmxmall官方微信,获取更多精彩资讯