客观化创造力测量工具:《中文远距联想测验》编制

引用本文

李良敏, 罗玲玲, 刘武. 客观化创造力测量工具:《中文远距联想测验》编制[J]. 东北大学学报(社会科学版),2015,17(1): 19-24. 复制到剪切板

LI Liang-min, LUO Ling-ling, LIU Wu. An Objective Measuring Tool of Creativity: The Development of Chinese Remote Association Test[J]. Journal of Northeastern University (Social Science),2015,17(1): 19-24. 复制到剪切板

DOI: 10.15936/j.cnki.1008-3758.2015.01.004

客观化创造力测量工具:《中文远距联想测验》编制

李良敏^1,2, 罗玲玲¹, 刘武¹

1.东北大学科技与社会研究中心, 辽宁沈阳 110819;
2.辽宁省交通高等专科学校学生工作处, 辽宁沈阳 110122

收稿日期: 2014-06-20

作者简介:李良敏(1980 -),女,辽宁沈阳人,东北大学博士研究生,辽宁省交通高等专科学校讲师,主要从事科学创造方法论研究; 罗玲玲(1950 -),女,湖南新邵人,东北大学教授,博士生导师,主要从事科学创造方法论研究; 刘武(1951 -),男,吉林长春人,东北大学教授,主要从事科学创造方法论研究。

摘要: 依循Mednick远距联想测验(RAT)思路和我国台湾学者任纯慧等编制的中文远距联想测验(CRAT)的观点,并依据北京语言大学《汉语常用词词频表》,编制了符合中国大陆学生语言习惯的《中文远距联想测验》。通过预测验,对题库题目进行难度、区分度分析,选出优质题项与吴静吉等人(1999)编制的《新编创造思考测验》一起对筛选样本进行施测。施测结果表明,《中文远距联想测验》的内部一致性信度较高,Cronbach'α系数为0.734;其效标效度也较好,与《新编创造思考测验》的流畅性、变通性和独创性分数相关非常显著。该测验已被应用于大学自主招生考试,效果良好。

关键词: 《中文远距联想测验》测验量表编制创造力测量

An Objective Measuring Tool of Creativity: The Development of Chinese Remote Association Test

LI Liang-min^1,2, LUO Ling-ling¹, LIU Wu¹

1. Research Center of STS, Northeastern University, Shenyang 110819, China;
2. Students' Affairs Division, Liaoning Provincial College of Communications, Shenyang 110122, China

Abstract: Based on Mednick's remote association theory, CRAT by Ren chunhui and her colleagues from Taiwan, China and The Chinese Common Words Frequency Table by Beijing Language and Culture University, Chinese Remote Association Test suitable for the language habits of the mainland students was developed. Based on the difficulty and discrimination parameters in the pretest, the quality items were selected and used to test the screening samples together with New Creativity Test by Wu jingji et al. The results showed that Chinese Remote Association Test has a quite good internal consistency, with its Cronbach's α being 0.734, and the test has a good criterion validity, with remarkable correlations to New Creativity Test in fluency, flexibility and originality. Chinese Remote Association Test has been used in university independent recruitment examinations and performed satisfactorily as a screening instrument.

Key words: Chinese Remote Association Test test scale development creativity measurement

随着时代的发展和科学技术的进步,人类创造能力的开发越发重要,而有效的创造力测量手段是创造力开发的基础之一。目前创造力测量面临的主要困难之一是现行创造力行为测量如托兰斯创造思维测验的主观评价标准多元、过程复杂^[1],难以适应大规模施测的要求。

目前,中国即将进行的高考招生制度改革是贯彻党的十八届三中全会精神、落实国家中长期教育改革和发展规划纲要而采取的重大举措,旨在消除高考制度恢复后长期存在的“一考定终身”“唯分数论”现象,扭转基础教育中根深蒂固的“应试教育”倾向,形成普通高校基于统一高考和高中学业水平考试成绩的综合评价多元录取的基本模式,健全“学生多次选择,高校依法自主招生”的运行机制,构建“淡化录取批次、学生与高校双向沟通、多次选择的录取模式”。高校自主招生、综合评价、多元录取必将成为今后高校招生的主要机制,而这就提出了开发适于大规模、客观评分的创造力行为测量手段的迫切要求,这就是本研究的基本目标和出发点。

《中文远距联想测验》正是这样一种可进行客观评分的创造力行为测量工具。其测量标准的客观性基础是语言词汇使用的统计规律,由于词汇使用的地域分布特征,该测验的编制方法也明显区别于普通创造力测验^[2]。

一、远距联想测验的发展

远距联想测验(remote association test,简称RAT)是一种以语料库语言学中词频统计规律为基础的创造力测量工具,因此具有其他创造力测量技术所不具备的突出特点,即测量评分标准具有统计意义上的客观性。常见创造行为测验必须由经过专门训练的评分者根据主观判断评分,因而效率低、误差大,而远距联想测验题目标准答案具有范围限定的唯一性,因此可进行客观评分。

纵观远距联想测验的发展,美国学者S.A.Mednick(1962)依据联结理论编制远距联想测验^[3]。该测验提供三个含义相隔很远的刺激词,例如same,head,tennis,要求被试想出一个能与三个刺激词有关的中介连结词,例如match。该测验经过实践检验拥有良好的信度。此外,被试远距联想测验得分与设计课程教师对学生创造力的评价的相关显著(r=0.70,df=19,p<0.01)^[4]。在化学公司工作的科学家,如果RAT的分数较高,通常也会有较高的工作职位;RAT分数较高的心理学系毕业生,其导师对其创造力的评分也较高;IBM的工程师中,RAT分数较高的工程师较能提出有效促进公司改善的方案。Andrews的研究表明,在理想的工作环境下,拥有较高的RAT分数的科学家,比起低RAT分数的科学家,能提出较好的研究成果^[5,6,7]。

国内台湾学者任纯慧、陈学志、练竑初和卓淑玲(2004)依据Mednick(1962)的概念编制适合华人使用的中文远距联想测验(Chinese Remote Associates Test,简称CRAT)。其不同于RAT之处在于将测验的线索刺激由“词对”改为“字对”,例如提供“航、婚、知”三个字,要被试找出一个能与这三个字分别组成词的一个字,如:通。词库的选取是台湾“教育部”国语词典简编本,并针对变字词出现的频率与目标字出现的位置两变量加以控制,以避免产生混淆的结果。编制完成的中文远距联想问题分为甲乙两式题本,以407名高中生为施测对象,测验信度的内部一致性系数为0.58Symbol~A@0.74,再测信度0.88与0.79;以威廉斯创造力测验为效标,其中冒险性、想象力、挑战力与CRAT总分均相关显著(r=0.24~0.32,p<0.05),而以威廉斯创造思考性活动测验为效标时,CRAT总分与开放性、精密性及标题均显著相关(r=0.21~0.29,p<0.05)^[8]。

中国大陆的中文远距联想测验编制研究尚处于空白状态。文献检索显示:截至2014年1月,通过CNKI数据库搜索关键词“中文远距联想量表”,搜索记录结果100多条,其中只有台湾学者陈学志、吴清麟、陈柏熹发表于全国教育与心理统计与测量学术年会暨第八届海峡两岸心理与教育测验学术研讨会论文摘要集的一篇《以线性对数潜在特质模式探讨中文远距联想测验试题成份对试题难度之影响》与关键词相关,其余只有部分文章涉及关键词“远距”或“联想”,其内容与本文提到的中文远距联想测验不相关,可见大陆学者尚未关注中文远距联想测验的编制问题。作为一种可进行客观评分的创造力行为测量方法,中文远距联想测验具有其他创造力行为测验所不具备的技术优势,即它适应高校自主招生、综合评价、多元录取的现实需求,具有广阔的发展前景,因此有必要进行深入研究。

由于语言使用习惯的原因,台湾的中文远距联想测验在大陆的使用过程中会受到较多限制。虽然中国台湾与大陆“同文同种”,当地政府推行的“国语”是以现代北方汉语语法和北京话语音为基础的,但由于“国语”已经在台湾发展了50年以上,已与大陆“普通话”出现较大差异。陈瑞端和汤志祥的研究(1999)表明,根据纯语料库语料统计: 大陆、台湾和港澳三地单区词语所占比重为53.55%; 共享词语次之,为27.53%; 而双区词语最少,为18.92%。三者相对比例约为5∶3∶2^[9]。台湾和大陆语言差异很大的这种状况,将使在大陆直接使用CRAT导致较大误差,因此有必要开发适合大陆语言环境的中文远距联想测验。

二、《中文远距联想测验》题库构建

本研究采用北京语言大学汉语国际教育技术研发中心编制的《汉语常用词词频表》(http://nlp.blcu.edu.cn/downloads/download-resources/36.html#ecms)中的双字词,共有39786个词,词频总数60219305个,其中有50.00%的词词频大于等于118次,40.00%的词词频大于等于206次,30.00%的词词频大于等于369次,20.00%的词词频大于等于732次,10.00%的词词频大于等于2045次。因此将高频词设定为词频大于等于2045次,记为H;词频小于2045次但大于等于369次的设定为中频词,记为M;频次小于369次的设定为低频词,记为L。

试题编制过程首先考虑一个词组的三个双字词的选择必须注意不同频次等级词的搭配,如果不考虑一个词在词组中的位置,高中低三个频次词共有10种组合,即:LLL、LLM、LLH、LMM、LMH、MMM、MMH、HHL、HHM、HHH,由于词的联想难度应当随着语词的使用频次减少而提高,所以上述顺序也应当反映测题的难易顺序。另一项考虑是目标字的出现位置,共同字出现在双字词的第二个位置可能会比在第一个位置更容易联想到,共同字的位置状况共有4种,第一种,共同字都出现在双字词的第一位,记为111,第二种,共同字出现在两个词的第一位,另一词的第二位,即112;第三种,共同字出现在一个词的第一位,另两词的第二位,即221;第四种,共同字都出现在三个词的第二位,即222。考虑到以上两种因素,选取词组时总共有10种词频分布×4种共同字位置总共40种词组特征,如表1所示。

表1 词组分布方案

表1中从左上到右下的排列顺序,也反映了测题的难易顺序。选取符合以上40种特征的词组各10组,共400组,建立《中文远距联想测验》题库。

三、《中文远距联想测验》

编制过程

通过预测验,对题库题目进行难度、区分度分析,最后筛选出49个题项,以辽宁省交通高等专科学校164名学生为样本,同时与吴静吉等人(1999)编制的《新编创造思考测验》^[10]一起对样本进行施测,对编制的测验量表进行Cronbach信度分析,并以《新编创造思考测验》为效标进行效度分析。

1. 预测验

将400个词组随机分成各包含100题的四个测试版本A、B、C、D。测试中每个项目形式为呈现三个线索字,如“毯、眉、发”,要求被试者找出一目标字,使该目标字能够与三个线索字各自组合成一个合法的中文双字词。

(1) 材料:将400个词组随机分成各包含100题的四个测试版本A、B、C、D。测试中每个项目形式为呈现三个线索字,如“毯、眉、发”,要求被试者找出一目标字,使该目标字能够与三个线索字各自组合成一个合法的中文双字词。

(2) 被试:随机分配500位被试对四个测试版本作答。被试为东北大学艺术学院、文法学院的学生,平均年龄20.4岁,其中男性215人,女性285人。

(3) 施测程序:施测时间总共为40分钟,由主试者向被试宣读指导语,等被试都没有问题之后开始进行测验。

(4) 试题筛选:围绕测试结果进行难度、区分度分析,根据分析的结果决定保留区分度大于0.241、P值小于0.005的30道优质题(各题目区分度统计见表2),用于与《新编创造思考测验》进行效标效度检验。

表2 49个题目的区分度统计

2. 《中文远距联想测验》信度和效度分析

以辽宁省交通高等专科学校物流系、汽车系和机电系164名学生为样本(其中有效样本为141人,平均年龄20.1岁),同时进行《中文远距联想测验》和《新编创造思考测验》施测。

分析结果显示,《中文远距联想测验》的内部一致性信度Cronbach'α系数为0.734。总分与《新编创造思考测验》的流畅性、变通性和独创性分数相关非常显著,结果如表3所示。

表3 《中文远距联想测验》的效标效度

以上结果说明,虽然本测验与任纯慧、陈学志、练竑初和卓淑玲等人的台湾版《中文远距联想测验》采用不同的效度标准,但都以经过严格检验的标准创造力测验为效标,两者的效度水平基本相同。

为进一步保证《中文远距联想测验》量表的科学性和有效性,笔者建立了受试者全体和性别常模,此外独立样本t检验表明,男女生《中文远距联想测验》分数差异不显著,结果如表4所示。

从以上结果可以看出,新编《中文远距联想测验》的信度和效度指标都较好,并且与台湾的CRAT的信度和效度相近。

表4 《中文远距联想测验》学生常模

四、《中文远距联想测验》的使用 1. 施测

《中文远距联想测验》共有30个中文字词联想题项。主试者等所有的受试者都拿到题本之后,请受试者先填写个人基本资料,并且要求受试者在填完个人基本资料之后不要马上翻页,确定所有受试者皆填写完毕之后,即开始说明作答方式。主试者朗读以下指导语,并要受试者一起阅读:

具有创造力的人会产生更不同于其他人的联想,越是有创造力的人越能够将看似不相关的事物联结在一起,也就是进行远距联想,而本量表最主要是在测量各位的中文远距联想能力。在底下你会看到三十个中文联想题目,每个题目均由三个中文“线索字”所组成,你的工作就是试着找出一个中文“目标字”,使得该“目标字”可以与前面三个“线索字”各自组合成为一个合法的中文双字词。例如:“毛”字,可以与其三个线索字形成“毛毯”、“眉毛”以及“毛发”三个合法的中文双字词,故“毛”字便是该题目的目标字。请注意,目标字既可以是组合双字词的第一个字(如:毛毯、毛发),也可能是接在线索字后而形成合法双字词(如:眉毛)。这些题目中,有的很简单,但有的却很复杂,请不要在单一题目上花很多的时间,而忽略后面的题目。测验时间为25分钟。

示例:毯、眉、发、毛

如果你有问题,请随时举手问主试者。如果没有,请在填完个人资料后,翻页开始作答。

主试者朗读完指导语后询问受试者是否有问题,确定所有受试者都了解作答方式后,便可以开始测验。主试者宣布开始之后,受试者开始翻页作答,主试者同时开始计时。在测试实施期间应避免受试者间交谈,如果在测试时间结束前已经有受试者作答完毕,则请该受试者安静地坐在座位上等待,测试时间结束要求所有受试者停笔,收回量表并清点份数。

2. 计分方式

以《中文远距联想测验》量表所提供的答案为标准答案,每答对一题即得一分。若受试者以拼音标注答案或者是出现错别字也可酌情计算分数。

3. 量表应用

《中文远距联想测验》可以作为工具,在自主招生考试过程中选拔优秀的学生,也可以在其他方面测验学生的发散性思维能力。

五、结语

作为一种可进行客观评分的创造力行为测量方法,《中文远距联想测验》除了具有如信度、效度较高,评分便捷等优点以外,其最大优势还在于可扩展性,即可以建立拥有大量试题的题库,并根据汉语常用词词频表加以扩充,这样就可以满足各类选拔考试的需要。尽管《中文远距联想测验》具有很好的发展前景,但仍存在一定局限:

第一,理论基础尚不稳固。目前,创造力研究还处在经验性研究阶段,鉴于有关《中文远距联想测验》理论上的不成熟,决定了建立在这个理论基础上的测量工具也不成熟,换个角度,测量工具的不成熟也左右着理论的发展,这是个无法解决的矛盾,但是事物就是这样充满矛盾地发展着。诚如吉尔福特所指出:“创造性的能力和创造性准则的种种测验的信度,一般来说也许是低的,不过,我们可以用种种方式来解决这类困难,我们不应该因这些困难而使自己不敢涉及这一领域。”^[11]

第二,评定对象与评定工具在结构上不对称,创造力测评研究难以深入。目前,创造力理论的薄弱和创造力概念的混乱,使创造力测评的研究也难以深入。事实上,创造性才能的结构十分复杂,《中文远距联想测验》很可能只是接触到这个结构的个别方面^[12]。此外,由于国内并没有以词汇联想为主要测量方式的创造力测验,本研究以《新编创造思考测验》建立《中文远距联想测验》的同时性效度,而两个测验测量创造力的方式不同,因此测量到的可能是创造力的不同维度。

第三,《中文远距联想测验》为言语性的创造力测验,适用于具备基本读写能力的被试。资料显示:RAT和言语智力的水平呈显著相关(r=0.49),表明RAT可能和言语智力测验之间不具有区别效度,这个问题在《中文远距联想测验》中也可能存在^[13]。

第四,语言使用的习惯是会随着时代的变化而改变的,因此《中文远距联想测验》必须每隔一段时间进行修订^[8],以期能够正确地测量出个体的远距联想能力及创造力。

总之,本研究建立了中国大陆第一个《中文远距联想测验》,此测验不但可以用于测量个体的远距联想能力和创造力,同时还具备易于施测、测验时间较短、计分客观与施测简单等优点。虽然本测验在某些方面还存在局限,但就目前来看,本测验是创造力研究者的一个很好的工具,其还有进一步研究和开拓的空间。下一步需要开展的研究工作包括:进一步扩大样本范围,针对中小学生和成人开展研究;建立《中文远距联想测验》题库,形成拥有较大数量有效题目,可根据需要组合各种试卷的测题集合;加强与其他多种创造力测验包括CRAT的相关研究,寻找更有效、更可靠的创造力测量工具。

参考文献

[1]	傅世侠,罗玲玲. 科学创造方法论[M]. 北京:中国经济出版社, 2000:551-552. (1)
[2]	朱腊梅,王小晔. 中国心理测量近二十年发展的述评与思考[J]. 心理科学, 2000,23(2):223. (1)
[3]	Coney J, Serna P. Creative Thinking from an Information Processing Perspective: A New Approach to Mednick's Theory of Associative Hierarchies[J]. Journal of Creative Behavior, 1995,29(2):109-132. (1)
[4]	Mednick S A, Mednick M T. Examiner's Manua1, Remote Associates Test[M]. Boston: Houghton Mifflin, 1967. (1)
[5]	Bowden E M, Jung-Beeman M. Getting the Right Idea: Semantic Activation in the Right Hemisphere May Help Solve Insight Problems[J]. Psychological Science, 1998,9:435-440. (1)
[6]	Bowden E M, Jung-Beeman M. Normative Data for 144 Compound Remote Associate Prolems[J]. Behavior Research Methods, Instruments & Computers, 2003,35:634-639. (1)
[7]	Bowden E M, Jung-Beeman M. Aha!Insight Experience Correlates with Solution Activation in the Right Hemisphere[J]. Psychonomic Bulletin and Review, 2003,10(3):730-737. (1)
[8]	任纯慧,陈学志,练竑初,等. 创造力测量的辅助工具:中文远距联想量表的发展[J]. 应用心理研究, 2004(21):195-212. (2)
[9]	陈瑞端,汤志祥. 九十年代汉语词汇地域分布的定量研究[J]. 语言文字应用, 1999(3):10-18. (1)
[10]	吴静吉,陈甫彦,郭俊贤,等. 新编创造思考测验研究[J]. 学生辅导双月刊, 1999,62:132-148. (1)
[11]	吉尔福特J P. 创造性才能它们的性质、用途与培养[M]. 施良方,沈剑平,唐晓杰,译. 北京:人民教育出版社, 1990:9. (1)
[12]	Stein M I. Creativity Research at the Crossroads: A 1985 Perspective[C]//Conference on Creative Research. New York: Buffalo, 1985. (1)
[13]	Sawyer R K. 创造性:人类创新的科学[M]. 师保国,译.上海:华东师范大学出版社, 2013:53. (1)

本文献在全文中的定位：

... 创造力行为测量如托兰斯创造思维测验的主观评价标准多元、过程复杂^[1],难以适应大规模施测的要求。 ...

本文献在全文中的定位：

... 使用的地域分布特征,该测验的编制方法也明显区别于普通创造力测验^[2]。 ...

本文献在全文中的定位：

... 联想测验的发展,美国学者S.A.Mednick(1962)依据联结理论编制远距联想测验^[3]。该测验提供三个含义相隔很远的刺激词,例如same,head,tennis,要求被试 ...

本文献在全文中的定位：

... 与设计课程教师对学生创造力的评价的相关显著(r=0.70,df=19,p<0.01)^[4]。在化学公司工作的科学家,如果RAT的分数较高,通常也会有较高的工作 ...

本文献在全文中的定位：

... 拥有较高的RAT分数的科学家,比起低RAT分数的科学家,能提出较好的研究成果^[5,6,7]。 ...

本文献在全文中的定位：

... 拥有较高的RAT分数的科学家,比起低RAT分数的科学家,能提出较好的研究成果^[5,6,7]。 ...

本文献在全文中的定位：

... 拥有较高的RAT分数的科学家,比起低RAT分数的科学家,能提出较好的研究成果^[5,6,7]。 ...

本文献在全文中的定位：

... 标时,CRAT总分与开放性、精密性及标题均显著相关(r=0.21~0.29,p<0.05)^[8]。 ...

... 变化而改变的,因此《中文远距联想测验》必须每隔一段时间进行修订^[8],以期能够正确地测量出个体的远距联想能力及创造力。 ...

本文献在全文中的定位：

... 词语次之,为27.53%; 而双区词语最少,为18.92%。三者相对比例约为5∶3∶2^[9]。台湾和大陆语言差异很大的这种状况,将使在大陆直接使用CRAT导致 ...

本文献在全文中的定位：

... 164名学生为样本,同时与吴静吉等人(1999)编制的《新编创造思考测验》^[10]一起对样本进行施测,对编制的测验量表进行Cronbach信度分析,并以《新 ...

本文献在全文中的定位：

... 解决这类困难,我们不应该因这些困难而使自己不敢涉及这一领域。”^[11] ...

本文献在全文中的定位：

... 分复杂,《中文远距联想测验》很可能只是接触到这个结构的个别方面^[12]。此外,由于国内并没有以词汇联想为主要测量方式的创造力测验,本研 ...

本文献在全文中的定位：

... 之间不具有区别效度,这个问题在《中文远距联想测验》中也可能存在^[13]。 ...


东北大学学报(社会科学版) 2015,Vol. 17 Issue (1): 19-24