汉语双字词常模特征跨词性对比研究
宋丹贵1, 李德高2
1.浙江大学 外国语言文化与国际交流学院, 浙江 杭州 310058
2.曲阜师范大学 翻译学院, 山东 日照 276826

作者简介: 1.宋丹贵(https://orcid.org/0000-0002-9583-0546),女,浙江大学外国语言文化与国际交流学院博士研究生,主要从事心理语言学研究; 2.李德高(https://orcid.org/0000-0002-9511-3109),男,曲阜师范大学翻译学院教授,博士生导师,心理学博士,主要从事心理语言学研究。

摘要

汉语中不同词性词有不同的常模特征规律。名词的具体性、意象性、语义透明度最高,但笔画数最少;动词的词频最高、习得年龄最晚,但感官经验度最低;形容词的熟悉性、主观词频和情感经验度最高,但具体性最低。同时,具体性、意象性和感官经验度之间的相互关联只存在于名词和形容词中。13个常模特征可以归为频率、语义、视觉复杂性和词义数四个公共因子,但各因子所主要代表的变量情况在不同词性词之间有相似之处,亦有不同之处。另外,动词和形容词之间的相似性高于它们分别与名词之间的相似性程度,习得年龄、情感经验度、意象性和主观词义数最能把名词与另外两种词性区分开来。

关键词: 现代汉语; 双字词; 常模特征; 词性; 比较研究
A Normative Study of Nouns, Verbs, and Adjectives in Simplified Chinese
Song Dangui1, Li Degao2
1.School of International Studies, Zhejiang University, Hangzhou 310058, China
2. School of Translation Studies, Qufu Normal University, Rizhao 276826, China
Abstract

Aiming to compare the normative features of two-character (2C) words of different categories in simplified Chinese, we collected scores on 13 features (frequency, number of strokes, number of meanings, subjective frequency, subjective number of meanings, AoA, compositionality, semantic transparency, familiarity, concreteness, imageability, emotional experience rating, and sensory experience rating) for 1,717 nouns, 1,114 verbs, and 459 adjectives. Statistical analyses revealed both similarities and differences among the three categories of 2C words in normative characteristics.One-way ANOVA showed that 2C nouns had the highest scores in concreteness, imageability and semantic transparency, but the lowest score in number of strokes; 2C verbs were the most frequently used, the latest to be acquired, but the least to arouse people's sensory experiences; 2C adjectives were rated to be the most familiar, the most commonly encountered in daily life, the most to evoke people's emotional experiences, but the least concrete. Pearson correlations analyses indicated that subjective frequency enjoyed positive correlations with frequency and familiarity, but had a negative correlation with AoA. Significant correlations between concreteness, imageability and sensory experience rating were only found for nouns and adjectives, but not for verbs.Factor analyses suggested that the 13 variables for Chinese 2C words could be elegantly compressed into four common factors: Frequency, Semantics, Visual Complexity and Meaningfulness. Frequency, Semantics, Visual Complexity and Meaningfulness explained 18.91%, 18.65%, 9.48%, and 8.68% of features variance for the 2C nouns, 18.69%, 15.58%, 9.09%, and 9.82% for the 2C verbs, and 17.79%, 17.10%, 9.12%, and 10.04% for the 2C adjectives. Compositionality tended to reflect the visual complexity dimension for the 2C words in general. However, AoA was loaded onto Frequency for the verbs and for the adjectives, but onto Semantics for the nouns. Emotional experience rating clustered with frequency, subjective frequency, and familiarity for the nouns, but clustered with sensory experience rating, concreteness, and semantic transparency for the verbs and the adjectives In a word, some results are consistent with and some other results are inconsistent with previous findings in European languages. There was a greater degree of similarity between the verbs and the adjectives than between the verbs and the nouns or between the adjectives and the nouns.It implicated that further studies on the unique aspects of normative features of 2C words in Chinese would likely yield significant contributions to the understanding of the language.

Keyword: modern Chinese; two-character words; normative features; syntactic categories; comparative study
一、 引 言

关于词的常模特征, 学界不仅对英语和法语等语言进行了大量研究[1, 2], 而且对汉语单字词、双字词和多字词的常模特征也分别进行过一些研究[3, 4]。研究发现, 简体汉字的具体性和意象性之间显著正相关, 熟悉性和频率之间显著正相关[5]; 繁体汉字词义数和频率之间显著正相关[6]。甚至有学者专门考察过名词、动词或形容词的常模特征[7, 8]。但是迄今为止, 还没有人对汉语不同词性词的常模性特征进行过比较研究。本文拟对现代汉语3 290个常见名词、动词和形容词的常模特征进行比较研究, 考察不同词性词的常模特征。

常模研究涉及词的多个特征。词频、词义数、熟悉性、习得年龄、意象性和具体性是汉语字词常模研究中经常考察的指标, 其中词频和词义数为客观指标, 分值往往通过相应词典直接获取。但是, 考虑到心理学研究和其他相关研究, 汉语词语常模研究还应包括笔画数、主观词频、主观词义数、可分解性、情感经验度、感官经验度和语义透明度等。笔画数影响汉字的识别加工[9], 有助于体现词的视觉复杂性程度; 通过量表评定可获得词的主观词频[10]; 主观词义数是人们对词的含义数量的主观认识, 也是认知实验任务中可操纵变量之一[6]; 可分解性是认知实验任务中的可操纵变量[11], 也是反映言语结构复杂性的重要指标[4]; 情感经验度和感官经验度分别指词能唤起人们的情感经验[12]和具体感知觉经验[13]的程度, 两者经常被用作常模特征指标[2, 13]; 语义透明度是指词可以从字面上理解其含义的程度[3], 是认知实验任务中经常操纵的变量之一[1]

现代汉语中, 词义和词性特征之间是相互关联的。即在上述13个常模特征(词频、熟悉性、词义数、习得年龄、意象性、具体性、笔画数、主观词频、主观词义数、可分解性、情感经验度、感官经验度和语义透明度)上, 名词、动词和形容词之间应存在显著性差异。现代汉语常用词中, 双字词占约70%以上的比例[14]。因此, 本研究首先确定3 000多个双字词, 然后通过系列问卷调查获取其常模特征分值, 并进一步对三种词性词在常模特征上的差异性进行比较, 为汉语词汇研究提供新的参考。

二、 方 法

首先, 把同时出现在《现代汉语频率词典》[15]和《HSK中国汉语水平考试词汇大纲:汉语8 000词词典》[16]中的4 197个双字词和没有出现在《现代汉语词频词典》但出现在《HSK汉语能力测试词汇大纲》前两个级别中的183个双字词确定为初选词。把这些初选词随机分为63组, 制成63份词汇联想问卷。问卷指令是“ 请在每个词的右边, 写出看到该词后首先想到的另外一个词” 。每份问卷打印50份, 随机发放给3 150位在校大学生。把受试应答中累计出现至少两次的刺激词确定为二次选词。再从二次选词中选定在《现代汉语规范词典》[17]中只标示为名词、动词或形容词者, 获得3 296个目标词(1 719个名词、1 116个动词和461个形容词)。

然后, 从《语境多样性副标题词频库》[18]获得每个词的词频, 并分别从《现代汉语多义词词典》[19]和《新华字典》(http://zidian.cibiao.com)获得每个词的词义数和笔画数。同时, 把这3 296个目标词随机分为44组, 在习得年龄、可分解性、具体性、情感经验度、熟悉性、意象性、感官经验度、语义透明度和主观词频共9个指标上分别制作44个7点量表, 量表指令如表1所示。同时, 在主观词义数方面制作29个3点量表。把这425个量表打印17份, 随机发放给来自7所高校的7 225位大学生。最终, 每个目标词在每个特征方面获得17个分值, 所有问卷调查的信度系数均高于0.960。同时, 我们对3 296个目标词进行词汇判断任务考察, 删去被试反应平均准确率低于50%的词, 此类词共6个, 其中名词、动词、形容词各2个。因此, 最终3 290个现代汉语常见双字词入选研究的关键材料。

表1 问卷调查指令
三、 结果与讨论
(一) 单因素方差分析

各常模特征分值结果如表2所示。考虑到词频和词义数偏度较大, 本文对这两个指标的分值分别进行了对数转换。

表2 3 290个双字词各常模特征描述性统计结果

以词性为变量, 对每个指标分值进行单因素方差分析(见表3)表明, 名词的主观词义数最少, 可分解性分值最低, 笔画数最少, 意象性分值最高。以往研究也表明, 名词的意象性程度高于动词[20]和形容词[21]。在具体性和语义透明度方面, 名词的分值比动词和形容词都高, 动词比形容词的分值高。名词是三种词性词中具体性最高和语义透明度最高者。然而在情感经验度方面, 名词的分值却是三种词性词中最低的。动词与形容词在主观词义数、可分解性、笔画数、意象性方面均没有显著性差异。动词是三种词性词中词频分值最高、感官经验度分值最低和习得年龄最大者。在感官经验度、词频和习得年龄方面, 名词与形容词之间没有显著性差异。形容词是三种词性词中熟悉性分值最高、主观词频分值最高、情感经验度分值最高、具体性分值最低和语义透明度分值最低者, 名词和动词在熟悉性和主观词频上没有显著性差异。

表3 三种词性词的各常模指标差异比较
(二) 相关分析

对三种词性词的13个特征分值分别进行皮尔森相关分析(见表4)表明, 不论名词、动词还是形容词, 词频和熟悉性均与主观词频正相关, 均与习得年龄负相关。即词频高的双字词通常更为人熟悉, 日常生活中更为常用, 人们习得的时间也更早。习得年龄与具体性、熟悉性、感官经验度、主观词频、语义透明度负相关。这说明, 习得较早的双字词通常其含义更加具体, 人们更加熟悉, 更易唤醒人们的感官经验, 在生活中使用得也更加频繁, 其语义透明度也更高。与Li等对成语的研究结果[4]一致, 熟悉性与习得年龄负相关, 与主观词频正相关, 即越是熟悉的双字词, 其习得年龄越早, 主观词频也越高。具体性和语义透明度正相关, 说明双字词的具体性越高, 语义透明度也就越高。情感经验度与熟悉性、感官经验度、主观词频正相关, 因此, 越是容易唤起情感经验的双字词, 使用者对它们就越熟悉, 它们就越容易唤起使用者的感官经验, 在日常生活中越经常使用。感官经验度与语义透明度和具体性正相关, 即越是容易唤起感官经验的双字词往往具有越高的语义透明度和具体性。

表4 三种词性词的各常模指标相关系数矩阵

虽然对动词和形容词来说, 习得年龄与可分解性、意象性或主观词义数之间的相关性没有达到显著性水平, 但对名词来说, 习得年龄与主观词义数正相关, 与可分解性和意象性均负相关。也就是说, 在习得年龄分别与可分解性、意象性和主观词义数的相关关系上, 动词和形容词相似, 而且两者均不同于名词的情况。此外, 以往研究表明, 意象性与具体性[5, 7, 22]和感官经验度[2, 13]正相关, 但本研究中, 这两种相关在名词和形容词上得到证实, 在动词上并没有得到证实。

(三) 因子分析

对三种词性词的常模特征分别进行(主成分)因子分析, 结果如表5所示。表中因子1— 4大致上可分别命名为频率、语义、视觉复杂性和词义数。虽然三种词性词的常模特征均可归为四个公共因子, 但从各因子所主要代表的变量情况看, 不同词性词之间既有相同之处又有不同之处。相同的是, 词频、主观词频和熟悉性归在因子1频率上, 感官经验度、具体性和语义透明度归在因子2语义上, 笔画数和可分解性归在视觉复杂度上。然而, 其他五个指标的因子所属情况, 不同词性词之间有些差异。对名词来说, 四个因子在解释各变量间差异方面的贡献率分别为18.91%、18.65%、9.48%和8.68%, 而且与对汉语单字词[5]及意大利语名词[7]的研究结果相同, 频率的贡献率最大。这四个因子在解释各变量间差异方面的贡献率对动词来说分别为18.69%、15.58%、9.82%和9.09%, 对形容词来说分别为17.79%、17.10%、10.04%和9.12%。

表5 因子分析结果

笔画数和可分解性主要反映了双字词的视觉复杂性。这是因为组成双字词的两个汉字的相对位置非常重要[23]。例如, “ 黄金” 和“ 金黄” 就是两个含义不同的词, “ 阿姨” 和“ 姨阿” 分别一个是词, 一个是非法组合。因此, 初学者往往对双字词中汉字的相对位置容易混淆[24]。此外, 对动词和形容词来说, 意象性也与笔画数和可分解性紧密关联, 但对名词来说, 意象性似乎已经抽象成了词义数这样的特征。

习得越早的词的频率越高。这一点适合动词和形容词, 然而却不太适合名词。因为对动词和形容词来说, 习得年龄与词的频率特征紧密关联, 但对名词来说, 习得年龄与语义特征紧密关联。对动词和形容词来说, 情感经验度与感官经验度、具体性、语义透明度紧密关联, 它们体现了词的语义特征。但对名词来说, 情感经验度与词频、主观词频、熟悉性紧密关联, 也就是说, 在日常生活中越常用、越为人们熟悉的名词在词汇识别中越易唤醒人们的情感经验。

以上对3 290个双字名词、动词和形容词在13个常模特征方面的统计分析表明, 动词和形容词之间的相似性高于它们分别和名词之间的相似性程度。同时, 词的可分解性主要体现在三种词性词的视觉复杂性; 习得年龄、情感经验度、意象性和主观词义数似乎最能把名词和另外两种词性区分开来。研究的部分结果印证了印欧语相关结论, 也有部分结果属首次发现。因此, 双字词常模特征及其与词性关系的这些现象对深入开展汉语词语认知研究有重要参考价值。

The authors have declared that no competing interests exist.

参考文献
[1] Juhasz B. J. , Lai Y. H. & Woodcock M. L. , ″ A Database of 629 English Compound Words: Ratings of Familiarity, Lexeme Meaning Dominance, Semantic Transparency, Age of Acquisition, Imageability, and Sensory Experience, ″ Behavior Research Methods, Vol. 47, No. 4(2015), pp. 1004-1019. [本文引用:2]
[2] Bonin P. , Méot A. & Ferrand L. et al. ,″ Sensory Experience Ratings(SERs) for 1, 659 French Words: Relationships with Other Psycholinguistic Variables and Visual Word Recognition, ″ Behavior Research Methods, Vol. 47, No. 3(2015), pp. 813-825. [本文引用:3]
[3] Tse C. S. , Yap M. J. & Chan Y. L. et al. ,″ The Chinese Lexicon Project: A Megastudy of Lexical Decision Performance for 25, 000+ Traditional Chinese Two-Character Compound Words, ″ Behavior Research Methods, Vol. 49, No. 4(2017), pp. 1503-1519. [本文引用:2]
[4] Li D. G. , Zhang Y. & Wang X. L. ,″ Descriptive Norms for 350 Chinese Idioms with Seven Syntactic Structures, ″ Behavior Research Methods, Vol. 48, No. 4(2016), pp. 1678-1693. [本文引用:3]
[5] Liu Y. Y. , Shu H. & Li P. ,″ Word Naming and Psycholinguistic Norms: Chinese, ″ Behavior Research Methods, Vol. 39, No. 2(2007), pp. 192-198. [本文引用:3]
[6] Chang Y. N. , Hsu C. H. & Tsai J. L. et al. ,″ A Psycholinguistic Database for Traditional Chinese Character Naming, ″ Behavior Research Methods, Vol. 48, No. 1(2016), pp. 112-122. [本文引用:2]
[7] Barca L. , Burani C. & Arduino L. S. ,″ Word Naming Times and Psycholinguistic Norms for Italian Nouns, ″ Behavior Research Methods, Vol. 34, No. 3(2002), pp. 424-434. [本文引用:3]
[8] Alonso M. Á. , Díez E. & Fernand ez A. ,″ Subjective Age-of-Acquisition Norms for 4, 640 Verbs in Spanish, ″ Behavior Research Methods, Vol. 48, No. 4(2016), pp. 1337-1342. [本文引用:1]
[9] Sze W. P. , Yap M. J. & Liow S. J. R. ,″ The Role of Lexical Variables in the Visual Recognition of Chinese Characters: A Megastudy Analysis, ″ Quarterly Journal of Experimental Psychology, Vol. 68, No. 8(2015), pp. 1541-1570. [本文引用:1]
[10] Desrochers A. , Liceras J. M. & Fernández-Fuertes R. et al. ,″ Subjective Frequency Norms for 330 Spanish Simple and Compound Words, ″ Behavior Research Methods, Vol. 42, No. 1(2010), pp. 109-117. [本文引用:1]
[11] Cieslicka A. B. ,″ Do Nonnative Language Speakers Chew the Fat and Spill the Beans with Different Brain Hemispheres? Investigating Idiom Decomposability with the Divided Visual Field Paradigm, Journal of Psycholinguistic Research, Vol. 42, No. 6(2013), pp. 475-503. [本文引用:1]
[12] Newcombe P. I. , Campbell C. & Siakaluk P. D. et al. ,″ Effects of Emotional and Sensorimotor Knowledge in Semantic Processing of Concrete and Abstract Nouns, Frontiers in Human Neuroscience, Vol. 6(2012), pp. 1-15. [本文引用:1]
[13] Juhasz B. J. , Yap M. J. & Dicke J. et al. ,″ Tangible Words Are Recognized Faster: The Grounding of Meaning in Sensory and Perceptual Systems, ″ Quarterly Journal of Experimental Psychology, Vol. 64, No. 9(2011), pp. 1683-1691. [本文引用:3]
[14] Ma G. J. & Li X. S. ,″ How Character Complexity Modulates Eye Movement Control in Chinese Reading, ″ Reading and Writing, Vol. 28, No. 6(2015), pp. 747-761. [本文引用:1]
[15] 北京语言学院语言教学研究所编: 《现代汉语频率词典》, 北京: 北京语言学院出版社, 2015年.
[Language Teaching and Research Institute of Beijing Language and Culture University (ed. ), Modern Chinese Frequency Dictionary, Beijing: Beijing Language and Culture University Press, 1986. ] [本文引用:1]
[16] 北京语言大学汉语水平考试中心编: 《HSK中国汉语水平考试词汇大纲: 汉语8 000词词典》, 北京: 北京语言大学出版社, 2000年 .
[Chinese Proficiency Oral Test Center of Beijing Language and Culture University(ed. ), HSK Chinese Proficiency Test Vocabulary Guideline(Dictionary of Chinese Usage: 8, 000 Words), Beijing: Beijing Language and Culture University Press, 2000. ] [本文引用:1]
[17] 李行健编: 《现代汉语规范词典》(第3版), 北京: 外语教学与研究出版社, 2014年.
[Li Xingjian(ed. ), A Dictionary of Stand ard Modern Chinese(the 3rd Edition), Beijing: Foreign Language Teaching and Research Press, 2014. ] [本文引用:1]
[18] Cai Q. & Brysbaert M. ,″ SUBTLEX-CH: Chinese Word and Character Frequencies Based on Film Subtitles, ″ PloS One, Vol. 5, No. 6(2010), pp. 1-8. [本文引用:1]
[19] 袁晖主编: 《现代汉语多义词词典》, 太原: 书海出版社, 2001年.
[Yuan Hui(ed. ), A Dictionary of Modern Chinese Polysemous Words, Taiyuan: Shuhai Publishing House, 2001. ] [本文引用:1]
[20] Xia Q. S. , Wang L. & Peng G. ,″ Nouns and Verbs in Chinese Are Processed Differently: Evidence from an ERP Study on Monosyllabic and Disyllabic Word Processing, Journal of Neurolinguistics, Vol. 40(2016), pp. 66-78. [本文引用:1]
[21] Montefinese M. , Ambrosini E. & Fairfield B. et al. ,″ The Adaptation of the Affective Norms for English Words(ANEW) for Italian, ″ Behavior Research Methods, Vol. 46, No. 3(2014), pp. 887-903. [本文引用:1]
[22] Yao Z. , Wu J. & Zhang Y. Y. et al. ,″ Norms of Valence, Arousal, Concreteness, Familiarity, Imageability, and Context Availability for 1, 10Chinese Words, ″ Behavior Research Methods, Vol. 49, No. 4(2017), pp. 1374-1385. [本文引用:1]
[23] 葛本仪: 《现代汉语词汇学》, 济南: 山东人民出版社, 2001年.
[Ge Benyi, Modern Chinese Lexicology, Jinan: Shand ong People's Publishing House, 2001. ] [本文引用:1]
[24] 郝美玲厉玲: 《初级阶段留学生汉语复合词加工影响因素研究》, 《语言教学与研究》2015年第2期, 第8-18页.
[Hao Meiling & Li Ling, ″ Factors Affecting Cognitive Processing of Chinese Compounds: Evidences from Non-Proficient L2 Learner, Language Teaching and Linguistic Studies, No. 2(2015), pp. 8-18. ] [本文引用:1]