炎炎夏日,童鞋们又开始在家吹空调的暑假生活。随着近日《延禧攻略》的热播,除了那复古的色调、考究的造型和精彩的剧情外,大家还津津乐道地组CP:傅恒和璎珞CP、皇后和皇帝CP甚至是皇后和璎珞CP……其实在Antconc中,也可以为我们要检索的词“组CP”,今天一者君就为大家介绍AntConc的另一项重要功能——搭配。
搭 配
Collocates
搭配功能,简单来说,可以生成检索词的有序的单词列表,用来查看搭配词与检索词相关性。
1. 打开AntConc,加载语料库文件后,单击“Collocates”选项卡。在检索框中输入待查询的单词后,对待检索词的左右范围做设置,之后单击“Start”。
注:1)若只看一个单词跨度,查看哪些单词直接出现在检索词右边,选中右边Window Span(窗口跨度)的Same(相同)选项,使得单词跨度的最大值和最小值相同即可。
2)还可设置显示搭配的最小频率(Min. Collocate Frequency),对结果进行过滤。
2. 由于搭配功能需在生成词单的基础上才可使用,因此会自动弹出生成词单的对话框,我们单击确定即可(关于词单的功能,下一期教程一者君会为大家详细介绍哦)。
3. 显示搭配检索后,即可对数据进行分析查看。
- 可以对搭配的类符(Types)和形符(Tokens)的总数进行查看。
- 可看到搭配词的频次。例如underestimation出现了1次,在work的右侧出现的。
- 还可以查看统计量(Stat)是10.32829。
什么是统计量(Statistical Measures)呢?
统计量测的是检索词与搭配度之间的相关程度。有两种计算方法,一种是MI值,另一种是T值。
MI值( Mutual Information Score,交互信息值)表示的是互相共现的两个词中,一个词对另一个词的影响程度或者说一个词在语料库中出现的频数所能提供的关于另一个词出现的概率信息。T值(T-Score)是根据假设检验中的t检验计算得来的。MI值测量的是搭配强度,它有助于识别科技术语和固定词组,而T值反映的是对显著搭配词的把握性,能使研究者有把握地确定与节点词共现频数较高的显著搭配词。在实际的词语搭配研究活动中,我们可以将MI值和T值结合使用,如果一个搭配词的两种统计量都达到显著性水平的话,那么它肯定就是节点词的显著搭配词。
(邓耀臣.词语搭配研究中的统计方法[J].大连海事大学学报(社会科学版),2003,2(4):74-77)
如何在AntConc中切换MI值和T值的统计方法呢?
在“Tool Preferences”中的“Collocates”条目下,可以在其他选项“Other Options”中对统计量的计算方法进行切换。切换完成后,重新单击“Start”即可。
4. 搭配还可以按照词频、检索词左边或者右边的搭配频率、统计量、词头或词尾进行排序。均支持反向排序哦。
今天AntConc的搭配功能就为大家介绍到这里,你学会了吗?
往期精彩
AntConc小白教程(1)| AntConc介绍及索引工具
AntConc小白教程(2)| AntConc索引检索及索引定位
AntConc小白教程(3)| 文件查看 FileView
AntConc小白教程(4)| 词丛 Clusters
AntConc小白教程(5)| N元模式 N-Grams
关注Tmxmall官方微信,获取更多精彩资讯~
赏
评论op
还没有人评论,赶快抢个沙发