语料库语言学与网络:从传统到革新
1. 语料库语言学基础概念
语料库语言学在研究语言使用模式时,不仅依赖定量分析,还需深入的定性分析以超越表面现象。除了搭配研究,语料库语言学还关注组配和语义关联。
组配指的是语法类别或结构模式与其他模式、单词或短语的共现情况。例如,从英国国家语料库(BNC)中关于“culture”的搭配词列表(按对数似然比排序)可以看出:
| logDice | 搭配词 |
| ---- | ---- |
| | culture |
| | popular |
| | language |
| | Western |
| | youth |
| | dominant |
| | Education |
| | Ministry |
| | tissue |
| | society |
| | history |
| | religion |
| | political |
| | cells |
| | Enterprise |
组配关系较难观察,尤其是面对大量数据时,不能仅通过观察搭配词列表来识别,而需要对索引行进行深入研究。比如,“ENMESH”这个词明显倾向于以被动形式出现,这从BNC中该词的索引行可以清晰看出。
索引行不仅能揭示单词与其他词形及同一词类单词的习惯共现模式(即搭配和组配),还能提供单词的语义关联证据。一个单词与特定语义领域的单词共现的倾向被称为“语义偏好”。例如,“stricken”通常与“grief”“panic”“terror”等词搭配;“with/
超级会员免费看
订阅专栏 解锁全文
421

被折叠的 条评论
为什么被折叠?



