语料库助力教学系列(二)

   日期:2024-11-07    作者:caijiyuan 移动:http://mip.riyuangf.com/mobile/quote/2670.html

语料库助力教学系列(二)

前言
近年来,英语语言教学学术领域对语料库的研究产生了越来越浓厚的兴趣,语料库强调容量大、语料真实、检索快捷,这些优势在语言研究和语言教育中发挥着日益重要的作用,正被越来越广泛地应用于语言研究与语言教学的许多领域。比如很多教材,很多词典都会使用到语料库这种强悍、有力的语言资料和分析工具,更有一些与时俱进的教材系列是基于语料库研发而成。

周在介绍检索方式灵活组合,无所不能的COCA时(点我查看),已经强调了语料库的作用,特别是对于应试项目,只要掌握足够的、权威的应试资源,使用比较常规的搜索方法,对信息的检索确认,就可以建立相关课程,相关项目的资料库,做到课程的标准切片,高水平实现标准化程度。
但是真正对于语料库的使用,不仅要求我们熟练的使用类似于Antconc这些语料库相关小工具,还需要我们有相当的教学经验,以及一些语言学的基础。
AntConc 开始是作为相对简单的索引程序,不过慢慢地进步成一个相对有用的文本分析工具。它是在ActiveState 供应商的优良Komodo 跨平台支持多种程序软件的开发环境下用Perl5.8 程序语言写成的。这个程序只要双击可执行文件就可以打开,这个文件可以从Laurence Anthony 实验室网站下载。这个程序可以在任何窗口环境下运行,包括Win 98/Me/2000/NT and XP, and also Macintosh OSX and Linux 的电脑。

作为一个全能文本分析工具,Antconc主要包括以下的具体工具:

索引 Concordance
索引定位 Concordance Plot
文件查看 File View
词丛 Clusters N
元模式(部分词丛) N-Grams (part of Clusters)
搭配 Collocates
词单 Word List
关键词单 Keyword List

索引(Concordance)

索引工具生成用户选择的一个或多个目标文件的索引行(concordance lines 或上下文关键词: key word incontext)行。

使用步骤:

1、打开Antconc软件,从file 菜单的open file(打开文件 )或open dir(打开目录)选择一个或多个要处理的文件,选出来的文件按顺序在主窗户的左边框里显示出来。

2、在左边的按钮条的输入框里输入一个检索词,如there,可以使用右边“Search Window Size”(检索窗口大小)的按钮条的增加和减少按钮来选择在检索词两边显示的字符数。

3、按“Start”(开始)键开始产生索引行的检索结果。检索过程中可按“stop”(停止)键随时停止检索。

4、将指针移到其中一行索引行的突出的检索词之上,系统默认为蓝色。指针会转变成一个手形的图标。点击突出的检索词,可以使用户看到检索词在原文中出现的情况。选定主窗口上的File View 按钮,再按开始(Start),则得到检索词在原文出现的情况。
搭配(Collocates)

搭配工具是用来生成目标文件的一组有序的搭配列单的。搭配既可以按词频,也可以按照检索词左边或右边的搭配频率,或者词头或词尾排列。也可以按照检索词和搭配间的统计量的值来排列。统计量的值测的是检索词与搭配度之间的相关程度。

AntConc 目前可行的统计量列在下面。所有的列单顺序可以反向。同样的,用户也可以选择检索词左右两边的单词跨度(单词数),显示的搭配的最小频率。比如:如果只要求一个单词跨度,要看哪些单词直接出现在检索词右边,选中右边Window Span(窗口跨度)的Same(相同)选项,使得单词跨度的最大值和最小值相同。
词单(Word List)

词单是用来生成目标文件的有序的词单(单词表)的。词单既可以按词频,也可以按词头词尾的顺序排列,还可以反向。词单可以在大小写不敏感(case-insensitive)模式下生成,即不区分大小写,大小写同等对待;也可以在大小写敏感case-sensitive 模式下生成,即区分大小写,大小写分别处理。要列一个单词表,用户需要进行以下操作:

1、选择合适的排列选项

2、按开始键。任何时候都可以中止。

3、点击单词会产生一组上下文关键词行 除了生成普通词单,AntConc 可以比较目标文件中的单词和参照语料库(Reference Corpus)中的单词来生成一个关键词单,关键词单列出的往往是目标文件中频率很高或频率很低的词。

N元模式(部分词丛)
N元模式工具是用来生成目标文件有序的N元列单的。N元模式是单词的N元,因此,大的文件将会产生大量的N元,比如,一个句子This is a pen.中的二元是“this is”, “is a”和“a pen。N元模式工具既可以按词频也可以按词头或词尾排列。也可以按词丛首单词的出现概率排列。所有的列单顺序都可以反向。同样,用户也可以选择每个N 元的最大或最小尺寸(单词数),显示N 元的最小词频。 想要列一个N 元模式的单子,用户需进行以下操作:
1、选择Clusters 窗口模式下Search Term 右边的N-Grams 选项
2、选择合适的排列选项
3、按开始键。任何时候都可以中止。
4、点击词汇束会产生一组上下文关键词行。

资源获取
如何获取ANTCONC工具?
请回复蚂蚁”至公众号,获取ANTCONC工具,了解更多使用方法,进行文本分析尝试,也欢迎各位老师分享使用心得。

如果您喜欢本文,欢迎您转发

如果您喜欢本公众号,欢迎您推荐

本文为微信公众号【新东方师训讲堂】所有

如需转发请与公众号联系

【征稿】如果您对教学有任何好的想法,欢迎您发送至jtjspxzx@xdf.cn,形式不限,一经采用即有稿费!

更多精彩内容可向公众号回复关键字:

回复辞典获取TKT视频大辞典

回复私房课获取私房课独家学习资源

回复回顾查看第三季师训讲堂讲师回顾

回复TKT查看更多TKT相关资源

回复EVP查看词汇教学神器

回复Corpus查看语料库资源


特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


举报收藏 0评论 0
0相关评论
相关最新动态
推荐最新动态
点击排行
{
网站首页  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号