好文档 - 专业文书写作范文服务资料分享网站

聋人汉语书面语语料库词语偏误分类及产生原因探究

天下 分享 时间: 加入收藏 我要投稿 点赞

聋人汉语书面语语料库词语偏误分类及产生原因探究

吕会华

【摘 要】[摘 要] 以建设聋人汉语书面语语料库为目的,以服务于语言研究和教学为基本原则,以典范的现代汉语作为判定偏误的标准,对聋人汉语书面语中存在的词语偏误进行了分类与分析,对聋人汉语书面语词语偏误产生的根源作了初步探究。

【期刊名称】北京联合大学学报(自然科学版) 【年(卷),期】2024(032)001 【总页数】9

【关键词】[关键词] 聋人;汉语;书面语语料库;词语偏误

0 引言

部分聋人学习汉语具有将汉语作为第二语言学习的特点,他们所产出的汉语书面语和外国人学习汉语时写出的书面语一样,都具有中介语的特点。中介语语料库建设与普通汉语语料库要求不同。“中介语语料库必须进行偏误标注,这是由中介语的特点决定的,也是学者们研究的需要。”[1]而“语料标注的内容与质量决定了一个语料库的功能与使用价值”[2]。聋人汉语书面语语料库作为一个中介语语料库,其一,必须进行偏误标注处理;其二,需要确定标注的内容,对语料所存在的偏误进行分类以利于开展标注工作和后续研究;其三,需要对标注体系进行比较详细的解说,以便于培训标注者,保证标注的质量。 北京语言大学HSK作文语料库[3],是一个中介语书面语语料库,我们将在HSK作文语料库词处理规则的基础上,扬长避短,确立聋人汉语书面语语料库词语偏误的内容及分类。

HSK作文语料库将词语偏误分为错词、缺词、多词及离合词偏误4大类。我们将沿袭其大类别的划分标准,在小类别上略有改动,使其操作性更强。在实际的词语偏误标注中,为了适应更广泛的研究人群、适应不同研究者的研究目的以及为了标注工作的简便,只标注错词、多词、缺词和离合词错误4大类,另外将不能归类的偏误归为存疑。在本研究中,将大类下的小类进行细致的切分与解说,一方面给予标注者提供参考,提高标注质量;另一方面为今后对词语偏误进行进一步研究奠定基础。从词语的角度讲,我们希望此项工作达到两个目的:其一,为建设聋人汉语书面语语料库词语偏误的标注提供理论和技术上的支持,构建词语偏误标注的规则;其二,对聋人汉语书面语词语偏误进行全面的归纳与梳理,找出聋人汉语书面语偏误产生的原因,指导未来的教学工作。

1 聋人汉语书面语词语偏误分类

“词汇层面的偏误存在比较复杂的界定问题,但总体上可分为构词偏误和用词偏误两大类。构词偏误主要是指留学生在词汇使用过程中,受母语、目的语等的影响,误造一些新词,主要有语素错序、语素替代等。用词偏误主要是指留学生在词汇使用过程中,由于语义不清等原因误用了目的语的其他词语,包括单双音节的相互替代以及语义偏误等。”[4]聋人汉语书面语词语偏误问题也主要集中在构词偏误和用词偏误两个方面,本文将从这两点出发,对聋人汉语书面语词语偏误进行分类与分析。本文语料全部检索自北京联合大学开发的《聋人汉语书面语语料库V1.1》,文中所列例句均为原始语料,句中存在除偏误词以外的其他语法或词汇偏误,本文均未做修改。 1.1 错词(CC)

错词,指错误的词和固定短语等,包括构词和使用两方面的偏误。在HSK作文

语料库词处理标准中,将错词分为颠倒、生造词、使用错误和搭配错误4小类。在尝试使用此标准进行标注中我们发现,词语使用偏误和词语搭配偏误极易混淆。词语搭配错误,又和句法中的搭配偏误有交叉,因此这2项标准的确定存在概念不清和不易操作的问题。因此我们引入了“易混淆词”作为错词中的一类,将词语使用错误和搭配错误进行重新梳理,凡和句法中搭配偏误(主谓搭配不当、动宾搭配不当、定中搭配不当、状中搭配不当,中补搭配不当等)有交叉的,留待句法处理;可进入易混淆词的,归入易混淆词。 1.1.1 语素颠倒

颠倒是指将词的构成成分写错顺序了。几个构词成分都是正确的,只是顺序错了,如表1,这种情况在聋人产出的书面语中特别多。吕会华[5]于2008年的调查显示,语素颠倒占所有复合词偏误的13.65%。 1.1.2 生造词

生造词是指汉语中有表达此概念的词语,但使用者不选用,自己“造”一个新词。生造词和写颠倒不一样,写颠倒的词语构词成分和目标词一致,只是构词成分摆放错了位置。生造词的构词成分有的和目标词一致,有的不一致。在复合词偏误的调查中[5],新造词的比例最高,占所有偏误的39.42%。

李冰[6]将生造词分为5大类14小类,分别是:①日语汉字词偏误:近形词、异形词;② 构成语素偏误:近义语素误代、非近义语素误代、语素误加、语素遗漏、语素错序及语素压缩;③ 多词杂糅偏误;④ 类比造词偏误;⑤重叠偏误。李冰研究的分类非常细致,某些类别亦可体现聋人汉语书面语词语偏误的特点,有可借鉴之处。邢红兵[7]将生造词分为:①新造词:指使用的合成词在汉语中没有对应的词或者虽然有对应词但其中至少有1个语素跟目标词无关;②语素替代:

聋人汉语书面语语料库词语偏误分类及产生原因探究

聋人汉语书面语语料库词语偏误分类及产生原因探究吕会华【摘要】[摘要]以建设聋人汉语书面语语料库为目的,以服务于语言研究和教学为基本原则,以典范的现代汉语作为判定偏误的标准,对聋人汉语书面语中存在的词语偏误进行了分类与分析,对聋人汉语书面语词语偏误产生的根源作了初步探究。【期刊名称】北京联合大学学报(自然科学版
推荐度:
点击下载文档文档为doc格式
36c8m6v5f11od1e2lms547le14lox100wh7
领取福利

微信扫码领取福利

微信扫码分享