本研究主张基于语料库的中国英语学习者英语特征研究应该将相关理论、方法论、解释维度和应用探讨整合在同一框架内彼此关联。旨在构建词汇语法整体观、对比中介语分析方法、学习者特征解释维度以及研究应用价值探讨“四位一体”的研究框架,如图2所示,并以中国英语学习者动词“-ed非限定小句”特征研究为案例,阐述在这一理论框架下如何借助技术手段分析学习者使用特征、从多维视角解释特征背后的原因并探讨研究发现的应用价值。
图2 语料库分析的“四位一体”研究框架
这一研究框架有以下内涵:
其一,整个研究过程自上而下,故以实线单向箭头表示。四个层级分别对应理论层面和方法论层面、学习者语言特征探讨、特征解释维度和应用价值讨论,环环相扣,四位一体。
其二,整个框架以“学习者语言特征”研究为中心,故以底纹凸显。理论层面的“词汇语法整体观”和方法论层面的“中介语对比分析”分别为这个中心问题的研究提供了理论和方法论指导;而后续的“特征解释维度”和“应用价值讨论”是这一中心问题的深入和延展。
其三,第三、四层级的“特征解释维度”和“应用价值讨论”的广度和外延由上一级总结的“学习者语言特征”而定,但其理论深度和内涵源自于第一层级的理论和方法论,图中以虚线单向箭头表示,虚线表示解释和应用讨论的自由度应受制于具体的使用特征。
最后,图中各层面有其子框架,规划各自的研究开展,这将在下文结合具体的研究问题来介绍。
2.研究问题——以学习者动词“-ed非限定小句”为例
在上述“四位一体”的研究框架下研究学习者动词“-ed非限定小句”的使用特征,具体包括以下研究问题:
第一,中国英语学习者和英语母语者在“-ed非限定小句”的使用上有无差异?呈现什么特征?
第二,不同水平的中国英语学习者之间在“-ed非限定小句”的使用上无差异?呈现什么特征?
第三,中国英语学习者在“-ed非限定小句”的使用特征背后的原因有哪些?
第四,中国英语学习者“-ed非限定小句”的特征研究和原因解释能够给英语教学等领域带来哪些启示?
3.理论基础——词汇语法整体观
语言是为了创造意义,而意义并非由一个个独立的词语创造,而是由关联的词语组合创造。因此对于意义的研究必须逾越词的界限,要将词汇和结构(语法)结合起来,从词汇语法的整体性视角去研究词的用法和意义。持这一理念的主要理论包括:Firth的语境论、Sinclair的词汇语法理论、Hunston和Francis的形式语法理论、Hoey的词汇触发理论。
4.方法论框架——中介语对比分析
在词汇语法整体观的理论基础之下,为了对以上问题展开研究,必须开展中介语对比分析(CIA),以往的对比分析(CA)是对比两种不同的语言,而CIA包括两种比较,即NS/NNS母语者与非母语者比较、NNS/NNS非母语者之间的比较(Granger,1996;2002;2004),其比较框架如图3所示。
图3 中介语对比分析框架(Granger,2002:12)
NS/NNS比较强调非母语者语言的“非母语性特征”,或称特定母语相关特征,可以尝试从语际差异或母语迁移去解释;而后者有助于区分中介语特征的定性,如果是不同母语背景的L2学习者共有的特征,可认为是中介语发展特征,是共性,应从中介语发展模式去解释。根据上述研究问题并结合当前我国主要的语料库资源,研究将中国英语学习者分为中学生、大学非英语专业学生、大学英语专业低年级和大学英语专业高年级学生四个水平层次,语料选自于CLEC、SWECCL2.0和CEM;从国际学习者英语语料库ICLE(Granger,1998)中选取法国大学生英语语料作为参照,以界定中国英语学习者的使用特征是母语相关特征还是中介语发展特征;对比分析的英语母语库鲁汶英语本族语者作文语料库LOCNESS(Granger,1998)。
5.语料库分析的技术路线
基于上述方法论指导,结合具体研究问题,首先应选取语料并依靠词性符码开展表层CIA分析,总结学习者“-ed非限定小句”的宏观特征;随后选取高频动词,抽取其“-ed非限定小句”并设计语用语法属性标注框架,再做深层CIA分析,总结微观特征、挖掘原因并讨论应用启示。整个流程包括语料抽取、词性附码、表层CIA分析、高频动词确定、非限定用法抽取、语法语用标注、深层CIA分析和研究应用探讨八大环节,其中需要使用多种语料库及统计分析软件和工具,整个流程的技术路线如图4所示。(www.zuozong.com)
图4 语料库分析的技术路线
以下以中国英语学习者动词“-ed非限定小句”特征研究为例,演示这一技术路线如何指引研究的层层推进。
第一步,利用子库生成及随机抽样技术抽取语料,保障语料容量大致对等和随机性。利用“Sub-corpus Generator”(文秋芳、梁茂成、晏小琴,2008)抽取SWECCL 2.0中的所有英语专业低年级和非英语专业语料,并利用“当前文件夹的文件随机删除器”(该软件由广东外语外贸大学李亮博士开发,可在http://ishare.iask.sina.com.cn/检索下载)从中随机抽取一定数量的文本文档,语料标识为CN和CL;从CLEC和CEM中分别选取中学生和英语专业高年级学生语料,标识为CM和CH。至此,四个水平层次的中国英语学习者语料抽取完毕,依次放入子库文件夹CM、CN、CL和CH。使用同样的技术可获得一定数量的法国大学生语料FC和英语母语者语料NC。子库信息如表1所示。
表1 各类学习者与母语者语料信息
第二步,利用CLAWS和TreeTagger(梁茂成等2010)软件对所选语料进行词性符码。
第三步,利用AntConc软件中的正则表达式检索六类子库中“-ed非限定小句”的非限定用法,并利用Chi-square caculator(梁茂成等2010)对频数差异进行卡方检验,总结表层CIA分析结果。检索步骤如下:根据CLAWs和TreeTagger符码集,“-ed非限定小句”总频数可通过表达式“_V[BDHV]N”检索,假设频数为F总频,其限定用法用于完成体和被动语态,完成体可用表达式“\S+_VH\S+\s(\S+_[RXNP]\S+\s)*\S+_V[BDHV]N”检索,假设频数为F完成体;被动语态可用表达式“\S+_VB\S+\s(\S+_[RXNP]\S+\s)*\S+_V[BDHV]N”检索,假设频数为F被动语态;完成体的被动语态可用表达式“\S+_VH\S+\s(\S+_[RXNP]\S+\s)*\S+_VB\S+\s(\S+_[RXNP]\S+\s)*\S+_V[BDHV]N”检索,假设频数为F完成体被动语态,因为其形式既可视为完成体,也可视为被动语态,上述完成体和被动语态的表达式均能检索到,会对这类限定用法重复计算,因此,“-ed非限定小句”的非限定用法频数通过以下公式计算:
F非限定=F总频F完成体F被动语态+F完成体被动语态
根据以上步骤检索的原始频数、标准频数及卡方检验结果如表2所示。注:卡方检验显著性水平关键值为0.05,即p<0.05时界定为“过度使用(*)”,再结合标准频数判断“过多使用(+)过少使用(-)”,下同。
表2 各子库动词限定、非限定用法频数及学习者库与母语库非限定用法频数卡方检验
第四步,利用AntConc软件“Word List”工具生成词表,选取6个子库中最高频的5个动词,依次是be,have,think,learn和make。以learn为例,首先,利用表达式“[Ll]earned_VVN”抽取该形式作为动词小句的检索项,包括用于完成体和被动态的限定用法以及非限定用法;其次,利用PowerGrep软件中的“select&replace”功能,输入“\S+_VH\S+\s(\S+_[RXNP]\S+\s)*learned_VVN”检索其完成体用法并用“VH learned”替换;用“\S+_VB\S+\s(\S+_[RXNP]\S+\s)*learned_VVN”表达式检索其被动语态用法并用“VB learned”替换,将剩下的“learned非限定小句”检索项保存创建小型语料库,一共创建30个(5个动词在6个子库中的检索项)小型语料库。
第五步,将30个小型语料库依次导入国际知名的定性研究软件NVivo10,依据自行设计的标注框架创建“节点”,并将每一行检索项拖入相应节点,此过程完成了语料手工标注和频数统计两项工作,各动词在各子库各标注维度的频数汇总如表3所示:
表3 高频动词“-ed非限定小句”标注维度频数
注:符码GM指语误;PNPA、PNPB分别指后置和前置的名词短语构件;AB指前面有副词;PO指介词宾语;LI指列举功能。语法属性分类参见Biber等(Biber et al.1999:198 200)。
第六步,可类似于第三步,利用卡方检验技术检验上述原始数据子库间的差异显著性,也可以将其频数标准化,利用SPSS中的3-Way ANOVA检验子库类型、具体动词以及标注维度对于频数差异的影响显著性,结果如表4所示。
表4 高频动词“-ed非限定小句”非限定用法主体间效应的ANOVA检验(因变量:标准频数)
第七步,根据上面统计分析的结果并结合“-ed非限定小句”出现的具体语境分析上述特征的性质,界定是母语相关特征还是中介语发展特征,并按照图5所示解释框架来深入分析特征背后的原因。
图5 学习者特征的解释框架(方秀才,2015)
第八步,根据上述特征总结和原因解释讨论研究的应用价值,主要体现在英语教学(如DDL)基于语料库的教材和词典编写(方秀才,2011)专门针对学习者特征的诊断性测试试题设计和基于母语库的水平测试试题设计以及利用学习者与母语者的特征对比优化写作评分标准。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。