中国英语学习者书面语中连接词的语料库研究
摘要:连接词是构建连贯英语语篇的重要手段。本文运用语料库方法探究中国英语学习者书面语中连接词的使用状况。结果表明:一是学习者使用的连接词显著多于本族语者;二是学习者和本族语者在选词倾向上有较大相似性;三是在连接词使用上学习者存在语义概念模糊、句法知识欠缺以及语体意识薄弱等问题。中介语发展的特征以及母语负迁移是形成以上问题的主要成因。
关键词:语料库;英语书面语;连接词
中图分类号:H31 文献标识码:A 文章编号:1006-723X(2011)02-0125-03
衔接是实现篇章顺畅、逻辑清晰的重要途径。作为衔接成分之一,连接词语的主要功能是在篇章中表示显性的逻辑关系。通过连接词语人们可以了解句子之间的语义联系,甚至可以经前句从逻辑上预见后句的语义。[1](P92)学者们普遍认为,正确合理地使用连接词能显著增强文章的连贯性和清晰度,易于读者把握作者的写作思路,提高读者理解篇章的效率,从而达到有效交流的目的。然而,英语连接词由于数量大、用法多、意义复杂而成为学习者的一大难点。本文采用中介语对比的语料库研究方法,调查中国英语学习者书面语中连接词的使用状况,分析其中存在的问题,期望能够为英语教学改进提供可参考的数据。
一、研究背景
自20世纪80年代以来,计算机语料库的飞速发展为更好地理解和描述语言提供了巨大的潜力和可能性。国内有关衔接的研究为数不少,但运用语料库方法对连接词语进行专项对比、定量研究的并不多见,主要研究者有罗一、[2](P59-62)赵蔚彬、[3](P72-76)潘璠[4](P157-162)和莫俊华。[5](P45-50)综观以上研究,可以发现:第一,以相近或相同群体为研究对象,研究结果并不完全一致。多数学者认为,相对于母语作者而言,中国学习者总体上存在过多使用英语连接词语的倾向;也有研究发现中国学习者在大多数连接词语使用上呈现过少使用趋势;第二,对比语料库的匹配性有待进一步提高。正如罗一在谈到其研究的局限性时所言“应增强语料的匹配性,对比性分析语料的匹配性越高,结果就越说明问题。[2]语料库专家Granger曾指出,用做调查的平行语料库必须在学习者的学习阶段、任务类型、语篇体裁等方面具有可比性,具有可比性的语料库是对比分析研究的基础,否则会直接影响结论的说服力。[6](P17-20)
二、研究设计
1.语料收集
用于调查的语料库有3个,分别由英国一所大学应用语言学硕士课程论文组成,课程包括Language Planning, Language Testing,Second Language Acquisition,Language Teaching Theory and Practice。课程结束时,所有学生按照教师统一要求(论文题目、字数等)完成每一门课程论文。收集者按照学习者国籍将论文归类,集合成中国学习者语料库(98178词)、本族语者语料库(94231词)和国际学习者语料库(97183词)。国际学习者指来自日本、韩国、巴基斯坦、挪威、丹麦、希腊、意大利等国家的学习者。应该说,以上语料库在学习者的学习阶段、写作任务、语篇体裁、文章长度方面都具有较高的匹配性。
2.研究问题
本研究试图回答的问题是:①中国学习者在使用连接词语的总体倾向上是否显著区别于本族语者;②中国学习者最频繁使用的连接词有哪些;③较本族语者,学习者倾向于过多、过少使用哪些连接词;④中国学习者在连接词使用方面存在的主要问题有哪些。
3.连接词量表
Halliday和Hasan对连接词语的分类一直被认作具有较高权威性。Celce-Murcia 和Larsen-Freeman对Halliday和Hasan的分类进行了简化。本次研究采用Celce-Murcia 和Larsen-Freeman的分类标准[7],在此基础上略作调整,形成调查的连接词量表。
4.研究步骤
使用语料库文本分析软件Wordsmith Tools 4.0和社会科学统计软件SPSS进行语料的处理和数据的分析。具体步骤如下:①运行Wordsmith Tools 4.0的Wordlist功能,统计3个语料库的相关信息;②运行Wordsmith Tools 4.0的Concord功能, 检索出各个语料库中连接词语出现的频率及其语境信息,然后逐例检查,剔除不相关的例证。以then为例,它包含有多种意义,遂采用人工的办法加以辨别、筛选;③计算连接词的标准频率,即每10万词中出现的频数,以方便统计、对比;④运行SPSS的Chi-Square检验连接词在不同语料库中出现频率的差异性。
三、结果与分析
1.研究结果
(1)总体倾向
在调查的各类连接词语中,与本族语者相同,中国学习者最多使用的是表示增补关系的连接词,使用比例近占全部连接词语的一半;经Chi-Square检验,x?2=19.9709, p=0.000<0.05,说明学习者与本族语者在连接词使用频率上存在明显差异,学习者连接词使用数量显著多于本族语者。
(2)最频繁使用的连接词
中国学习者和本族语者两个语料库中使用连接词的排列顺序略有不同,但学习者最频繁使用的前10个词语中有8个出现在本族语者使用的前10个词中,表明学习者和本族语者在连接词语的选择上有很大的相似性,都倾向于使用also, for example/instance, however, then, therefore, in addition, first(ly)/first of all, thus 这8个连接词语;本文调查的连接词共计68个,使用频率排在前10位的词语约为调查总数的七分之一,然而,它们的实际使用频率却高达调查词语总量的三分之二或以上(65.6% 和73.3%),这说明无论是本族语者,还是中国学习者,他们在写作中都十分依赖使用小部分的连接词语向读者提示前后语句、内容之间的逻辑联系,从而引导读者解读文章的信息内容和写作意图。与罗一调查结果不同的是,本次研究数据显示,本族语者比学习者更倾向于使用少数的几个连接词,其中排在第一位的also一词的相对使用频率竟高达26.7%,其中原因后文将略做探讨。
(3)高频和低频连接词
借鉴文秋芳的做法[8](P150-156),以10万词为计算单位,进而比较每个连接词语在两个语料库中出现的标准频率。如果频率差异为10次以内,则忽略不计。经统计,first(ly),second(ly),third(ly),fourth(ly),that is,in addition,moreover等10个词语在中国学习者语料库中出现的频率高于本族语者;also,however,similarly及 in turn 4个词语使用频率低于后者。无论是从词的数量,还是从使用频率上来看,学习者使用连接词语偏多的倾向比使用不足的倾向更为明显。
2.分析与讨论
语料检索及数据解读表明中国学习者书面语中使用的连接词语显著多于本族语者。较多使用连接词究竟是中国学习者特有的个性问题,还是二语学习者中介语发展过程中存在的共性问题?为此,笔者加入国际学习者语料库予以对照,期望能够帮助说明问题。如前文所述,该语料库的样本由来自不同国家学习者的硕士课程论文组成,从一定意义上来说,他们是众多二语学习者的代表。检索发现,国际学习者使用连接词的标准频率非常接近中国学习者(1370与 1400);中国学习者倾向于较多使用的前10个连接词语中,有9个与国际学习者一致,且二者在较多与较少使用词的平均标准频率上也十分相近(62与67)。鉴于此,从整体情况来看,可以说过多使用连接词的倾向是二语学习者中介语发展过程普遍存在的、难以避免的非母语特征,这一发展过程中表现出来的共性并不因为学习者的母语背景而出现很大的差异。同时,虽然二者过多使用的连接词几乎相同,但就某些具体的词语来说,它们的差异仍十分明显,如中国学习者运用that is,then,on the contrary,first(ly),second(ly),third(ly),fourth(ly)等词的频率远远高于本族语者及国际学习者,说明汉语负迁移对学习者运用连接词语的确产生着深远的影响。