教育研究,既是教师专业发展的重要途径,也是学校深化改革的重要方式。正如苏霍姆林斯基所说:“如果你想让教师的劳动能够给教师带来乐趣,使天天上课不至于变成一种单调乏味的义务,那你就应当引导每一位教师走上从事研究这条幸福的道路上来。”
一、学校教育研究的内涵与特征
(一)走出传统研究观的误区
传统的教育研究观认为,教育研究是一件高深莫测的事情,教师不可能也没有必要从事教育研究,教师所要做的,就是运用和移植理论工作者的研究成果。传统的教育研究观导致了一线教师和教育理论工作者的诸多偏见。例如,从教师方面看,一些教师认为,所谓教育研究,就是用一套“理论”术语来总结和陈述自己的经验,就是把自己在实践中积累的“做法”抽象、提升为理论化的“说法”。而当教师用自己不太擅长的理论语言来陈述自己的“做法”时,会感觉自己离研究之路愈行愈远。从理论工作者方面看,一些教育理论工作者则以为,教育研究必须像自然科学研究那样,遵循严格的科学研究的规范;而这种严格的研究程序与研究规范,往往是一线教师难以做到的,即便做了也可能不伦不类。因此,教育研究和教育实践是一种合理的社会分工,没有必要打破这种分工,迫使或诱使教师从事力不从心的研究工作。陈旧、传统的教育研究观导致了以下一系列弊端。
第一,严重影响了教育改革的深入推进。
20世纪80年代以来,我国中小学开展了大量的教育教学改革与实验,取得了较丰硕的成果,使中小学的教育教学得到了一定的改观。但是,由于传统研究观的影响,教育研究并没有被广大的中小学教师所认可和接受,课堂教学依旧是“填鸭式”的教学模式,缺乏生机与活力。正如叶澜教授所指出的:
上课是执行教案的过程,教师的教和学生的学在课堂上最理想的进程是完成教案。教师期望的是学生按教案设想作出回答,教师的任务就是努力引导学生,直至得出预定答案。学生在课堂上实际扮演着配合教师完成教案的角色。于是,我们就见到这样的景象:课堂成了演出“教案剧”的“舞台”,教师是“主角”,学习好的学生是主要的“配角”,大多数学生只是不起眼的“群众演员”,很多情况下只是“观众”与“听众”。
第二,严重削弱了教师的职业声望。
《教师法》明确规定:“教师是履行教育教学职责的专业人员。”作为一种专业,教师职业与普通的职业之最大的不同是需要进行专业学习与专业研究。为此,《教师法》在第二章“权力和义务”中进一步指出,教师有“进行教育教学活动,开展教育教学改革和实验”的权利,有“从事科学研究、学术交流,参加专业的学术团体,在学术活动中充分发表意见”的权利,等等。可以说,从事研究是凸显教师职业之专业性的重要保障,没有研究,也就没有教师职业之专业性。然而,传统的教育研究观却将教育研究与教师的日常工作对立起来,这种对立容易使教师职业沦落为一种普通的职业,从而失去了其专业性。如果想把教育建设成为一门专业,就需要打破这种旧式分工,使教师不但成为教育研究者,而且成为教育研究的主体。从这个意义上来讲,教育研究是教师作为专业人员的一种专业生活方式,他自己创造着自己的专业生活质量,这是教师在专业工作中自主性和自主能力的最高表现形式。
(二)学校教育研究的内涵与特征
学校教育研究是“以学校为本”“以学校为基础”“解决学校中实际问题”的研究。具体来说,有三方面含义:一是“为了学校”,研究不是为了解决某一宏大的理论问题,而是为了解决学校所面临的具体的实践问题,以改进学校实践、提升办学质量为根本指向;二是“在学校中”,也就是说,学校教育研究的主体,不是校外专家,而是学校教师,研究的主要对象是教师日常的学校教育生活;三是“基于学校”,即学校教育研究不以构建可推广性的、普适性的理论或经验为最高旨趣,而是一切从学校的实际出发,挖掘学校的各种资源潜力,提供有启发性的校本改革经验。与理论工作者的教育研究相比,学校的教育研究有如下几个鲜明的特征。
1.研究问题的具体性
学校教育研究的对象,是学校教育工作者自身的教育教学实践,研究课题的确定往往是研究者根据素质教育与新课改的目标,结合学校与个人的实际情况创造性地生成的。因此,学校教师从事研究的立足点应该聚焦于解决其在新课改中所遇到的实际问题、聚焦于新课程理念与教育教学实践结合产生的新困惑。比如,新课程所倡导的三维目标如何在课堂中有效地整合?新课程倡导尊重学生、激励学生,是不是就不能批评学生?新课改要求教师创造性地使用教材,教师如何备课?新课改倡导合作学习、探究学习,如何提高课堂教学效率?等等。这些问题与研究者自身的教育教学实践工作密切相关。
2.研究方法的灵活性
由于学校教育场域的复杂性,学校的教育研究在方法与程序的设计上不可能像自然科学研究那样进行严格而精确的设计。在大多数情况下,学校教育研究主要是采用一些比较简便易行的方法,如观察、与学生谈话、问卷、测评等。如果说科学家的研究比较注重研究方法的精确设计,那么教师的教育研究则更加注重简单方法的创造性运用。
例如,同样是观察法,不同的教师在观察的对象与视角上都可以不同。一位教师主张观察三类学生:第一类是缺乏良好学习生活习惯的学生,第二类是家庭情况特殊的学生,第三类是教师子弟。这是观察对象的差异性选择。另一位教师主张用“三面‘镜子’观察学生”,即用“显微镜”观察小事、拿“放大镜”激活亮点、以“望远镜”发现特长。这是观察视角的差异性选择。还有教师提出在课堂观察中要“读懂学生的眼神”,他把学生的眼神分成六类:两眼迷茫,不知所云;东张西望,漫不经心;目不转睛,熟视无睹;眼皮低垂,精神不振;双目凝神,若有所思;眼神兴奋,情绪活跃。由此可见,看似简单的观察法,其实也需要创造性的运用。
3.研究成果的多样性
教师的研究主要是一种行动研究,教师的知识主要是个人化的实践性知识,这就决定了教师的研究成果是可以多样化的。也就是说,其研究成果既有显性的、可以编码的文字材料,也有隐性的不能编码的技能经验。其中,显性的书面性成果又可以包括学术论文、经验总结、调查报告、教育叙事等;而隐性成果则往往表现为典型课例、优秀课件等。过去,由于受到传统研究观的影响,我们往往将教师的研究成果窄化为文字性的论文,结果使许多教师对科研产生畏难情绪。
二、研究方法的历史发展
“工欲善其事,必先利其器。”在人类历史上,我们的先辈们曾经对研究方法进行了不懈的探索和改进。关于研究方法的思考与探索大致可以分为三个阶段,即古代思辨主义的传统、近代科学方法的勃兴和现代多元方法的发展。
(一)古代思辨主义的传统
在自然科学产生之前的漫长的古代社会,由于人类生产力水平的低下,不可能有发达的研究工具与系统的研究方法,人们对自然、社会乃至人自身的探讨主要是借助思辨、直觉和类比这样一些朴素的方法来展开的。这些朴素的研究方法的运用在早期的自然科学、医学、教育等领域都有充分的表现。
例如在医学界,中国的中医理论著作《黄帝内经》就是借助类比思维建立了庞大的中医学体系。《黄帝内经》从阴阳五行学说出发,认为万事万物的属性都可以从五种元素(五行)的特性进行推理。例如,因为世界有五行,所以人体有五脏,而且五脏的特性与五行的特性是一致的。五脏疾病的产生和治疗都要从五行的特性出发来进行理解。以肝为例,在五行中肝属木,而木的特性是喜欢舒展(“木日曲直”),故由此类比推演,肝的特性是性喜条达,所以有“疏肝解郁”之说。
在教育领域,类比与直觉的方法也获得了充分的运用。例如,中国古代的教育论著《学记》,其关于教育问题的论述大多采用类比的方法得出结论。比如,关于教师的使命与作用,《学记》是这样论述的:“善歌者,使人继其声;善教者,使人继其志。”又论述说:“古之学者,比物丑类。鼓无当于五声,五声弗得不和。水无当于五色,五色弗得不章。学无当于五官,五官弗得不治。师无当于五服,五服弗得不亲。”(白话文翻译为:古代求学的人,能够对同类事物进行比较,举一反三。鼓不等同于五声,而五声中没有鼓音,就不和谐;水不等同于五色,但五色没有水调和,就不能鲜明悦目;学习不等同于五官,但五官不经过学习训练就不会发挥好的功能;师不等同于五服之亲,但没有教师的教导,人们不可能懂得五服的亲密关系。)直到近代,伟大的教育家夸美纽斯仍然运用类比的方法来进行教育的思考,他的名著《大教学论》就是将教育与自然比较,从而获得了很多深邃的教育见解。夸美纽斯在《大教学论》中指出:“学校改良的基础应当是一切事物里面的恰当的秩序……教导的恰切的秩序应当从自然去借来。”
例如,关于内发性教育原则,他在书中是这样论述的:在自然的一切作为里面,发展都是内发的。
比如:以一只鸟儿而论,首先形成的不是足爪、羽毛或皮肤,而是体内各部分;体外各部分要到后来有了合适的时机再去形成。
模仿。——同样,园丁并不把穗接在外表的树皮里面,也不接在木材的外层,而是切一个切口,切到木髓里面,把接穗尽量深深地插进去。
同样,树木得到天上的雨水和地下的水分作养料,它之所以吸收养料也不是经由外层的树皮,而是经由最内层的微孔。由于这个缘故,所以园丁并不灌溉树枝,而只灌溉树根……所以,如果教育青年的教育家肯去特别注意知识的根芽,即悟性,这种根芽不久就会把它们的生命力输送给树干,即输送给记忆,最后输送给花儿与果实,这就是说,熟练地运用语文和实际的能力就会产生出来。
偏差。——有些教员在这一点上犯了错误,他们不对他们所教的孩子把学科彻底讲解清楚,却无止无休地要他们默写,要他们死记硬背……就是说,不知道怎样去照料知识的根芽,也不知道怎样进行知识的接穗。
纠正。——所以:1.学生首先应当学会理解事物,然后再去记忆它们。2.教师应该知道一切可以使悟性变锐敏的方法,应当熟练地应用那些方法值得一提的是,夸美纽斯虽然采用了朴素的类比方法来思考教育,但是,他高度关注方法的重要性。他指出:“到目前为止,研究者所阐明的事物还是不多,这是因为他们只是向前冲,过分看重理智的力量,过分看重了刻苦勤奋本身,而不知道单靠赤手空拳和聪明是达不到什么结果的,只有有了相应的工具和设备,事情才会更容易更正确地进行。”“一切有赖于方法,因此需要的只是好的方法,应用这种方法来研究事物和关于事物的学说,就能很好地分辨出必要的和非必要的,有用的和无用的,真实的和虚伪的。”
(二)近代科学方法的勃兴
近代以来,思想家们日益认识到方法的重要性,“科学方法”作为一种重要的研究工具被提上了日程。例如,思想家培根(1561~1626)认为,两千五百年来西方之所以在科学上无所建树,是因为未找到科学的认识方法。在《新工具》这部划时代的名著中,他指出:“在机械力的事物方面,如果人们赤手从事工作而不借助于工具的力量,同样,在智力的事物方面,如果人们也一无凭借而仅靠赤裸裸的理解力去进行工作,那么,纵使他们联合起来尽其最大的努力,他们所能尝试和所能成就的东西恐怕总是很有限的。”
培根主张把实验法、归纳法作为科学发展最重要的方法。他认为,人类由于没有找到有效的方法做支撑,因此常常受到四种幻象(亦译为“假象”)的干扰。这四种幻象分别是种族幻象(即将人类的愿望强加给自然)、洞穴幻象(即个人的经验与偏见)、市场幻象(即各种含糊混乱的概念叠加)、剧场幻象(即因错误的理论看到歪曲的自然)。
而消除这些幻象的有效方法就是归纳法,“以真正的归纳法来形成概念和原理,这确实乃是排除和肃清假象的对症良药”(培根)。
可以说,培根开创了现代科学方法的先河。培根之后,很多伟大的思想家继续深入探讨和论证了科学方法的价值与意义。例如,孔德(1798~1857)提出了“思想发展三阶段”论。孔德认为,无论个体智力的发展还是各门学科的发展乃至人类社会的发展,都先后经过了三个不同的理论阶段:神学阶段,又名虚构阶段;形而上学阶段,又名抽象阶段;科学阶段,又名实证阶段。
孔德认为,个人智力的发展也是经历这三个阶段的。“童年时期是神学家”,爱好神话和虚构;“青年时期是形而上学家”,喜欢抽象和理想;“壮年时期是物理学家”,不再喜爱好高骛远的虚构和抽象,而是关心实际,重视现实。他写道:“我们每个人都清楚,如果他回顾一下自己的历史,就可以看到曾经相继经过三个阶段,在童年时期是神学家,在青年时期是形而上学家,在壮年时期是物理学家。”
孔德认为,各门科学知识的发展也经历了这三个阶段。早期受神学的统治,天文学表现为占星术,化学表现为炼金术;中期受“形而上学”的支配,力求在经验的自然现象背后寻找抽象的或精神的本性;近期进入实证时期,力学、物理学和化学相继成为实验的科学。
近代科学方法的勃兴使自然科学从哲学的母体中分离出来,并日益成为成熟学科的典范。科学方法以及由此形成的科学主义思潮开始向社会科学领域渗透,使社会科学研究出现“科学化”的浪潮。心理学与教育学的研究都先后出现了科学化运动。
在心理学领域,传统的学习理论主要是个人经验的总结和概括。例如,中国古代学习理论的代表“朱子读书法”就是朱熹对自身读书方法(即学习方法)的总结。他倡导的读书法共六条:循序渐进、熟读精思、虚心涵泳、切己体察、着紧用力、居敬持志。朱熹的学习理
论虽然颇有见地,但是毕竟没有超出直觉与感悟的传统研究范式,19世纪末以来,巴甫洛夫、桑代克、华生、斯金纳等心理学家通过实验方法构建了现代学习理论,使心理学走上了科学化的道路。
桑代克首先用实验法研究动物心理,用以代替对动物的自然观察,为动物心理学的研究开辟了新的道路。他用小鸡、猫、狗和猩猩做了大量实验,其中猫走迷笼实验最为著名。他设计了13只迷笼,这些迷笼各有一个互不相同的装置,当猫按动了这个装置后,笼门就会自动打开。实验的猫处于饥饿状态,笼外放着食物,猫出来后就会吃到食物。桑代克将13只猫轮流放入每个迷笼里,观察猫的反应,记录它们逃出迷笼所花费的时间。桑代克发现13只猫中有11只被放入迷笼后都有一种逃脱拘束的行为。它们先是乱抓、乱咬,竭力要从笼中逃出来,作出许多无效的动作。最后偶然触动了开门的装置,逃出来获得了食物。经过很多次的尝试以后,无效的动作逐渐减少,而导致成功的动作则逐渐保留下来,最后猫在放入迷笼后就立刻能用一定的方式打开笼门。
桑代克据此认为,动物的学习是一种尝试与错误的过程,也就是选择联结的过程。学习的实质就是有机体形成“刺激”(S)与“反应”(R)之间的联结。他明确提出:“学习即联结,心理即人的联结系统。”他进一步将动物的学习推广到人类的学习。他指出:“下至26个字母,上至科学或哲学,其本身都是联结造成的。人之所以善于学习,就是因为他养成了这许多联结。”在他看来,“理智、性格或技能的任何事实,都意味着按照一定的方式对一定的情境发生的反应倾向”。教育的目的就是把其中的某些联结加以永久地保留,把某些联结加以清除,并且把另一些联结加以改变或利导。
20世纪初,科学方法渗透到教育研究领域,并由此形成了实验教育学思潮。实验教育学的倡导者主张运用自然科学的实验方法研究教育现象,代表人物是德国的梅伊曼、拉伊,法国的比纳、西蒙,美国的赖斯、桑代克和贾德,英国的温奇等。
1901年,德国教育家梅伊曼首先将实验教育思想称为“实验教育学”,1907年,德国教育家拉伊又出版了《实验教育学》一书,系统阐释了实验教育思想。随后众多的教育学家加以发展。实验教育学家认为,应该从实验心理学的角度出发.采用心理学实验的方法来分析和研究教育问题。
梅伊曼认为,以往的教育理论缺乏精确的根据,只不过是伦理的构造或个人经验的集合,容易导致用错误主张指导实践的后果。为了使人们了解采用某种教育手段的理由,梅伊曼强调以实验的方式研究教育问题,并首先把心理实验的方法应用到教育研究中,开了“实验教育学”之先河。
拉伊把自己的实验教育学称之为新教育学,而把以思辨为特征的传统教育学称之为旧教育学。他认为旧教育学多是一些教育家的个人经验或推论,在实验教育学看来,这些“个人经验或推论”仅仅只是各种假设,必须通过实验的研究方法对它们进行检验,以辨别其真伪。换句话说,只有实验教育学才能把教育学从思辨中解放出来。在《实验教育学》一书中,拉伊论证道:“新旧教育学的主要区别,在于它们积累经验的方式和研究的方法。旧教育学依靠知觉、内省观察和观察别人进行研究,可是这些方法本身是不完善的。因此,实验教育学通过全面的观察、统计和实验,来补充和完善旧的研究方法。”
梅伊曼和拉伊的工作迅即引起了热烈响应,实验教育思潮风行一时,并从德国迅速扩展到英国、美国等国,形成了19世纪末20世纪初的欧美教育实验热潮。
(三)现代多元方法的发展
科学方法的运用给社会科学研究带来了诸多的启示,但是社会科学毕竟不同于自然科学,作为活生生的生命体,人是不能够像自然科学那样被完全“物化”的,因为人是有思想、有情感的生命个体,社会科学所研究的“人”不同于自然科学所研究的“物”。因此,自然科学对“物”的研究结论并不能简单地移植到“人”的身上。例如,近代科学心理学关于动物学习的研究并不能完全揭示人类学习的复杂过程,正是这种差异导致行为主义学习理论内部的创新以及认知主义、人本主义等学习理论的兴起。
早在19世纪,狄尔泰(1833~1911)就指出了社会科学与自然科学研究的重大差异,他指出,“自然需要说明而人类需要理解”。狄尔泰由此开创了现代解释学方法的先河。晚近以来,后现代思潮成为学术研究的亮点。在价值取向上,后现代思潮反对现代主义的“同一逻辑”,主张用“差异逻辑”来取代“同一逻辑”,强调世界的差异性、异质性、多样性。反映在研究方法上,后现代思想家强调解构传统,反对把科学方法作为社会研究的唯一方法,主张研究方法的多元化、个性化。在后现代思想的推动下,人种志方法、解释学方法、叙事方法等开始在教育与社会科学研究中日益壮大。
三、研究问题的分类与界定
(一)界定研究问题的意义
爱因斯坦指出,提出问题比解决问题更重要。因为问题一旦提出开始解决的时候研究者已经知道他们需要什么,知道他们自己的目的是什么,而且许多问题的陈述本身就已经暗含着“解题”的理论视角与研究思路。比如,假设我们要探讨的问题是“课堂中的教学对话”,那么这个问题已经暗示我们需要从对话理论的视角来寻求解决的思路。但是,在提出一个有价值的问题之前,我们完全没有参照系,就像一个在大海中迷失航向的帆船,不知道自己该驶向何方,因此提出问题需要的是我们大胆的探索和创造性的想象。两千多年以前,苏格拉底借助他的“产婆术”与他人展开对话,在对话的过程中,他通过不断提问使对方认识到自身认识的模糊不清乃至自相矛盾,最后不得不承认对某个问题一无所知。与苏格拉底对话的人实在难以忍受苏格拉底的频繁追问,于是提出互换角色,由他们提问,苏格拉底来回答,但是这种角色的转换却使他们发现自己更被动,因为他们根本提不出一个深刻的问题,他们以为提问者的角色比回答者角色占据着更主动、更有利的地位,而事实上提出问题比答复问题还要困难。研究问题的界定是做好研究工作最重要的基础。在研究设计中,研究问题的界定具有三个重要的功能。
(1)界定研究问题可以促使研究者反思研究的意义。我们总是从教育困惑开始我们研究的历程,但是在困惑阶段,我们还不清楚自己的研究到底具有怎样的理论与实践意义,随着我们对困惑的清理与反思,问题就会越来越清晰,而问题的价值与意义也就会逐渐显现出来。比如,很多老师对学生学习兴趣匮乏感到困惑,但这种困惑还不能说明我们的研究到底具有怎样的意义。随着思考的深入,我们可能发现教材编写的某些缺陷是影响学生学习兴趣的重要因子,于是我们可以把基于校本的课程开发作为一个研究的问题,由此出发,探讨课程开发对学生发展的重要意义。在这个例子中,我们对研究意义的反思是和研究问题的界定紧密相连的。
(2)研究问题的界定可以帮助研究者聚焦自己的研究,也就是根据研究问题来选择适宜的概念框架,从而在研究问题、研究目标和概念框架之间建立起内在的逻辑一致。
(3)研究问题的界定可以指引研究者如何去完成研究,也就是根据研究问题来选择恰当的研究方法,在研究问题、研究方法、研究效度之间建立起内在的一致性。
我们经常看到一些蹩脚的研究设计,这些研究设计最主要的缺陷恰恰是对研究问题缺乏深入的思考和精确的界定。具体表现在如下三个方面。
(1)研究“没有意义的问题”。所谓“没有意义的问题”指的是那些研究者为了某种学术或其他方面的需要自己凭空杜撰出来的问题,或者为了证实自己的假设以说服别人而不得不进行的、自己已经知道答案的问题。前者对处理现实生活中的实际问题没有密切的关联,后者对人类知识的增长没有实质性的贡献,只是对一些一般人都知道的常识进行所谓“科学的”论证。比如,许多教师在写论文时,谈到班级管理,就讲培养和选拔班干部;谈到教师师德,就讲师爱的伟大,等等。这些论述固然正确,但却是老生常谈,并没有给我们带来知识的增长或思想的启迪,只不过是把传统教育学教科书中的观点进行了重复,因此不能认为是有意义的问题。
(2)研究问题太宽泛。如果研究问题太宽泛,缺乏缜密的思考,那么研究就很难深入。例如,“如何提高课堂教学效率”——这就是一个非常宽泛的问题,因为影响课堂教学效率的因素非常之多。诸如师生关系、教材选择、教学方法、提问设计、作业设计、班级管理等都可以认为是影响教学效率的重要因子。因此,这种泛泛而论的研究注定只能浅尝辄止。由此可见,研究问题需要深入思考和准确界定。
(3)研究方法选择不当。研究问题有多种类型,不同类型的研究问题需要采用不同的研究方法,对研究的信度与效度也有不同的要求。因此,明确研究问题的分类是做好研究工作的前提。例如,“转化学困生的有效策略研究”和“学困生是怎样形成的”就是两个不同类型的问题,需要有不同的研究方法。
(二)研究问题的分类
有学者认为,社会科学研究中的问题可以分成很多不同的类型:概化问题和具体问题、工具主义问题和现实主义问题、变量问题和过程问题。
1.概化问题和具体问题
概化问题是一个指向某一特定人群的、对其具有一定普遍意义的问题,其抽样方法是从特定人群中抽取一些有“代表性”的样本进行调查。量化研究往往选取概化问题。例如“中学生心目中的好教师特征研究”,我们可以在多个省市选择几十所学校展开调查研究,其目的是获得一个普遍性的结论。概化问题注重研究具有普遍性、概括性、代表性的问题,这种研究假设源于逻辑实证主义的观点。逻辑实证主义认为,万事万物背后都存在一个普遍的、放之四海而皆准的规律,而科学研究的目标就是发现和揭示这种普遍性的规律。
具体问题指的是一个特殊的个案所呈现的问题,研究只对这个个案本身进行探讨。质性研究往往采用具体问题。比如“张三为什么辍学了”,这个问题就是把张三作为一个个案进行深入研究,研究结果不强调普遍性,而是注重对个案的深入理解。具体问题注重特殊性、情境性、个体性,这种研究假设源于现实主义哲学的观点。现实主义哲学家批判逻辑实证主义者的观点,认为根本不存在普适性的规律,尤其是在社会科学研究中具体的问题反而更为合理和合适。比如:我们可以给动物同样的刺激,从而获得同样的反应,这就是所谓“规律的普遍性”;但是如果我们把同样的干预策略用在不同的学生身上,可能得出的结果是不同的。同样的激励措施,对有些学生可能会产生明显的效果,而对另外一些学生其结果可能是无动于衷。
2.工具主义问题和现实主义问题
工具主义问题要求基于可观测的和可量化的数据来提出问题。工具主义者坚持客观主义的立场,认为只有可观测、可测量、可操作的事物才能成为研究的对象,而诸如情感、态度和价值观等,由于其不可观测、不可测量则不能直接成为研究对象。例如,按照工具主义的观点,我们不能直接研究“智力”问题,而只能把“某一智力测验的分数”作为研究智力的工具。同样,“态度”问题也是不能直接研究的,而必须转化为态度量表测量的分数才能成为研究的对象。
现实主义问题则相反。现实主义者认为,那些看似不可观测的现象(诸如情感、态度、信念、动机等)都是真实的,并不需要通过“操作性定义”将其转化为可测量的数据。按照现实主义者的理解,假如我们要研究某个学生的学习动机,我们没有必要借助心理学的人格量表来进行测量,而是可以通过观察、访谈等方式直接深入其内心世界。
3.变量问题和过程问题
变量问题关心的是差异和相关,它们通常是关于“是否”“有多少”“在多大程度上”以及“……的关系是否存在”之类的问题,例如“教师的教学方法与学生的学习成绩之间是否存在正相关”“家庭环境在多大程度上影响儿童的学习成绩”“教材设计是否能激发学生的学习兴趣”等等。这些问题关注的是两个变量(或者说两个因素)之间的相关关系,因而都属于变量问题。量的研究主要关注的是变量问题,量的研究的目的也主要是揭示两个变量之间的关系。
过程问题关心的是事件如何发生,而不是它和其他变量是否存在特定的关系以及多大程度上它能被其他变量所解释。例如“教师的教学风格是如何影响学生的学习的”“差生是怎样形成的”“一个良好的班集体是如何形成的”等等。质的研究往往更关注过程问题。
(三)研究问题的界定
在实证研究中,研究问题的界定往往采用操作性定义的方法。所谓操作性定义(operational definition),又称操作定义,是根据可观察、可测量、可操作的特征来界定变量含义的方法。即从具体的行为、特征、指标上对变量的操作进行描述,将抽象的概念转换成可观测、可检验的项目。从本质上说,下操作性定义就是详细描述研究变量的操作程序和测量指标。在实证性研究中,操作性定义尤为重要,它是研究是否有价值的重要前提。(www.zuozong.com)
1.操作性定义与抽象性定义
在科学研究中,存在着抽象性定义与操作性定义两种定义类型。例如,关于“智力”,我们可以查阅各种工具书来理解“智力”,从而可以把“智力”定义为“人认识、理解客观事物并运用知识、经验等解决问题的能力,包括记忆、观察、想象、思考、判断等”。这一定义比较笼统、概括,不同的人可以对此有不同的理解,因此只能是一个抽象性定义。但是,如果我们把“智力”定义为“比奈一西蒙智力量表的分数”,这就非常具体,不容易造成误解,这就是操作性定义。
在教育研究中,下操作性定义的目的是为了能客观准确地测量变量,为他人重复验证提供具体的做法,便于别人和同行之间的学术交流,避免不必要的歧义和争论。一般实证性的研究都要求下操作性定义。用测量操作方法来界定一个名词或概念的最大优点是具有明确客观的标准。当我们讨论一个问题或交流有关信息时,彼此都在同一个层面使用同一个概念,都清楚所用的概念意味着什么,就不会产生误解或歧义。即使对某一个概念产生疑问,也可以通过重复测量操作性定义予以验证。在教育研究中,之所以有许多说不清、道不明的问题,很大一部分是由于对所探讨的概念没有明确客观的操作性定义造成的。大家在不同的层面,从不同的角度,用不同的定义来探讨同一个问题,这样的研讨肯定会产生很多误解和歧义,很难获得一致的结果。
例如,我们要探讨学生学业不良的成因,那么什么是“学业不良”呢?是不是指学习成绩在60分以下就叫“学业不良”?如果一个学生文科成绩很好,而理科成绩糟糕,这个学生是否也应该被称为“学业不良”?再比如“学生学习负担的调查研究”,什么是学习负担过重,一个小学生每晚在家里复习1小时是否算“学习负担过重”?
衡量学习负担过重除了时间标准,有没有心理层面的指标?这些问题,如果我们没有一个清晰的界定,那么所有的思考、研究和交流就只能是盲目的甚至是无效的。
2.操作性定义的方法与策略下操作性定义的方法很多,主要有以下三种
(1)条件描述法
条件描述法通常是通过陈述测量程序来界定一个概念。这种陈述需要对达到某一结果的特定条件作出规定,指出用什么样的操作去引出什么样的状态。简单来说,条件描述法就是规定某种条件,然后观察产生的特定结果。这种方法常用于给自变量下操作性定义。例如:“智力”的操作性定义是:“在《韦克斯勒儿童智力量表》(WISC-CR)上的测量分数。”“自信心”的操作性定义是:“学生对即将来临的期终考试可能获得分数的估计值。”
(2)指标描述法
指标描述法通常是通过陈述测量指标来界定一个概念。这种描述法强调对所解释对象的测量手段、测量指标、判断标准作出明确规定。通常这些测量指标都能做量化处理,常用于给因变量下操作性定义。例如:“发散思维”的操作性定义是:“对同一物体多种用途的设想能力,具体指标为:在60秒内回答砖的不同用途达10项以上为优秀;5项至9项为一般;5项以下为差。”“差生”的操作性定义是:“在标准化成就测验中的分数低于个人智力所预测的成就分数一个标准差的学生,或者两门主课不及格的”
(3)行为描述法
行为描述法通常是通过陈述测量结果来界定一个概念。行为描述法强调对所解释对象的动作特征进行描述,对可观测的行为结果进行界定。通常这种操作性定义用于给因变量下定义。
例如:“旁观”的操作性定义是:“注视别人的活动达2—3分钟以上,自己未参与。"“合作”的操作性定义是:“对别人的活动给予支持,并直接参与活动,成为其中一员。”
3.操作性定义的多样性
由于操作性定义仅仅反映研究对象的某个侧面,因此一个比较抽象的概念可以有多个操作性定义。比如“智力”,我们可以运用不同的智力测验量表从而形成不同的操作性定义。
又比如:有人要研究大学生的学习态度,对“学习态度”可以通过查阅教育词典、百科全书、教科书等获得抽象性定义,或者研究者自己给学习态度下一个抽象性定义。但这样的定义往往无法具体操作、测量,只能作价值判断。于是研究者试图给学习态度下操作性定义,以便对学习态度进行测量,获取资料。研究者将学习态度定义为本学期学生上课的出勤率,然后每周上课点名获取出勤率的资料。当然,学习态度涉及很多因素,会有很多指标,如上课的参与程度、举手发言的频率、作业的正确率等,出勤率仅仅是其中的一个因素,但研究者仅以出勤率来代替学习态度,以出勤率解释学习态度,这就体现了操作性定义的独特性与多样性。
四、分析框架的生成
(一)什么是分析框架
分析框架也叫理论框架、概念框架、理论背景等。国外学者Mi.les和Huberman概念框架定义为一种可视的或者写下来的成品,它是“用图表或文字解释研究的主要内容(主要的因素、概念或变量)以及它们之间的关系”。国内学者陈向明教授则认为,概念框架展现的是研究者的初步理论设想,通常包括:①组成研究问题的重要概念以及这些概念之间的各种关系;②研究问题的范围、内容维度和层次;③研究者自己目前发展出来的工作假设。概念框架可以用语言表述,也可以用图表直观地表现出来。建立概念框架的目的是促使研究者在研究开始之前就用比较简洁、直观的方式将研究问题所包含的重要方面呈现出来。概念框架一方面可以将研究者心中原本隐蔽的一些理论假设明朗化,另一方面可以进一步加深研究者对问题的理解,发展自己原有的理论。
现代科学认识论的研究告诉我们,所有的观察都渗透着理论。我们在“看”的过程中,就已经有“理论”的介入,只不过有些人意识到了自己持有的“理论”视角,而有些人可能全然不知。更重要的是,我们每个人所持有的“理论”可能是完全不同的,因而我们对世界的理解也千姿百态。正如俗话所说“横看成岭侧成峰”,我们看世界的过程中所看到的东西其实与我们的“理论”(或者说认知框架)息息相关,在不同的认知框架下,我们所看到的东西有可能完全不同。比如下面的图片,我们从不同的认知视角可以构建不同的意义。
在做研究的过程中,研究问题的提出其实也是与分析框架紧密相连的。比如,在现代主义的视野中,教材被看做是知识体系,教学的重点是知识的重组与重构;但是在后现代主义的视野中,教材是一个“文本”,教学的重点是作者与读者的对话。又比如学校管理,在科学管理理论的视野下,制度是管理人、约束人的工具和手段,有些校长称之为“制度管人”;但是在人本管理的理论视野下,制度是教育人、激励人的平台,有些校长称之为“制度育人”。“制度管人”和“制度育人”,不仅仅是说法的不同,更重要的是理论框架的差异。因此,在研究中,认真地反思和构建分析框架,是促使研究工作深入的关键。分析框架和研究的关系就像地图和旅行者的关系。一个旅行者来到一个陌生的城市,只有借助于地图才能让自己的旅行线路清晰起来,才能对这个城市在头脑中有清晰的轮廓,才能知道要到达特定的旅游景点需要经过怎样的路线。离开地图的指引,旅行者就会迷失方向,就不知道有哪些景点可看以及怎样才能到达那些景点。
分析框架不等同于文献综述。文献综述一般是整理归纳别人研究的成果,而分析框架既需要查阅和整理文献,同时更需要创意性的进行理论建构。也就是说,分析框架不是在文献里简单找到的东西,而是研究者通过对文献的检索、阅读、整理和吸收,在文献基础上结合自己的研究问题进行的积极主动的建构。建构起逻辑清晰的分析框架,可以看成是研究工作的重要阶段性成果。
(二)分析框架的表现形式
分析框架可以用多种形式进行呈现,除了传统的文字叙述之外,也可以采用更加简洁的图形、图表等形式来描述,例如树形结构、因果网络、圆圈相交关系、时序流程等。一些学者把这些可视化的表现形称之为“概念地图”。
用可视化的方式(概念地图)来表示分析框架,有利于我们自觉地整理自己的研究思路,使我们比较模糊的认识不断地清晰化、概念化、结构化。这是因为概念地图是一种“在纸上思考”的方式,概念地图描述的是核心概念以及它们之间的关系;当我们把研究的问题与相关的核心概念及其关系用可视化的方式表现出来的时候,我们就容易明确自己思考的方向和存在的不足。
根据研究的目的和研究的问题的不同,概念地图可以有很多种表现形式。例如表达概念之间关系的抽象的概念框架、表达事件之间相互联系的“流程图”、表达变量之间影响路径的因果关系图、表达概念层次结构的“树形图”等等。概念地图的形式没有固定的模式,每一个教师都可以发挥自己的想象力创造出个性化的图形表达方式。从这个意义上,我们认为,画概念地图不仅可以帮助我们整理自己的理论框架和发展我们自己的理论,同时还可以激发我们研究的乐趣。
概念地图不是一蹴而就的,而是需要不断修改完善的。因此,我们不要企图在研究初期就构建出完善的概念地图。我们可以把概念地图的完善过程比作是软件的版本升级。每一次重新描绘概念地图的过程都是对低端版本的一次升级。最开始我们所描绘出的概念地图大多是粗糙的、粗线条的、不完善的。而正是这个粗糙的“低版本”概念地图让我们看到自己认识上的缺陷和漏洞,从而不断地修改、调整、补充和完善,最后形成个性化的、统整性的“高版本”概念地图。
概念地图最好不要画在黑板上,因为黑板上的内容会不断被擦掉,这就使我们“看”不到自己思考的过程。概念地图最好是画在纸上,或者把每一个“版本”的概念地图保存在计算机里。这样我们就能够看到自己思维深化的进程。
(三)分析框架的来源
分析框架可以有多种来源,包括个人的经验知识、已有的理论文献乃至创造性的思想实验等。
(1)个人的经验是我们从事研究的重要背景
在传统的量的研究中,个体的经验往往被视为“偏见”,被看做是无价值的内容,并总是试图防止它对研究产生影响。但是,在质的研究中,个人的身份和经验却常常被视为有价值的、重要的研究背景。质的研究者认为,如果将研究和研究者个人的生活割裂开来,就会失去一个重要的获取思考、假说和效度检验的来源。事实上,我们在进行文献阅读时,之所以选择了某些理论概念而忽略或摒弃其他的理论概念,这一选择的过程往往是结合我们自己的实践经验来展开的。我们自己的阅历和实践经验构成了我们筛选理论的一把重要的筛子。比如,在新课程改革的背景下,一个老师可能对如何引导学生进行合作学习感兴趣,而对如何让学生进行探究性学习则甚少提及。这其中可能蕴含着教师基于自己实践经验的筛选。
(2)已有的理论文献是我们构建理论框架的重要来源
学术界对已有文献的重要价值给予了高度重视,并做了许多生动形象的阐释。例如,有学者将前人的系统理论比作是一个“大衣柜”,它可以为自己的研究提供一个框架,如果将自己的研究放到这个柜子里合适的地方挂起来,就可以看到自己的研究与其他研究之间的联系。也有学者将前人的理论比作是“数盏探照灯”,认为它可以揭示研究现象的某些侧面,帮助研究者对自己的研究问题进行聚焦,“探照灯”的光束不仅可以为本研究领域勾勒出一个基本的地域范围,而且可以为本研究照亮方向。还有学者把前人的理论比作“光点”,认为一个有用的理论可以照亮你观察的内容,它让你的注意力集中到特定的事件或现象上,并让你了解到别人可能忽视或误解的关系。不过,当一个理论照亮一块区域的同时,也让周围的区域沉浸在黑暗之中——没有哪个理论能够照亮所有的地方。所以,针对不同的问题,需要有不同的理论支撑。
教育公平是当前教育界的热点话题,但我们对这一问题的分析却不能简单地凭借日常经验甚至主观臆断,而是必须借助已有的文献建构坚实的分析框架。上述案例中,作者正是从既有的理论文献中选取了布迪厄的教育理论,从而构建起严谨的理论分析框架。
(3)思想实验也是构建分析框架的有用方式
思想实验是指使用想象力、依靠逻辑推理去进行的实验,所做的都是在现实中无法做到(或现实未做到)的实验。思想实验的主要特点是启发性和逻辑性。首先,思想实验之所以具有启发性,是因为思想实验需要充分发挥研究者的想象力。通过想象力的发挥,对研究者头脑中的灵感进行深加工、精加工,它把灵感进一步引导到有待解决的问题上来,并且已经为问题的解决、认识的深化迈出了积极而富有创意的第一步。其次,思想实验之所以具有逻辑性,是因为思想实验也是一种“实验”,它按物化实验的格式(即“如果……那么……”)展开,主要过程和结果均以逻辑的形式表述,其中逻辑推演是思想实验的基本方法,离开逻辑,思想实验无法进行,也不能得出科学的结论。
在自然科学领域,思想实验具有悠久的传统,爱因斯坦的大多数工作都是基于思想实验完成的。在类似经济学的社会科学中,思想实验也经常被使用。但是,作为一种探讨研究设计的技术,特别是针对质的研究的设计,它却没有受到应有的关注。在分析框架的构建过程中,思想实验实际上就是“思维建模”。思想实验可以帮助我们检验现有理论是否存在问题,通过“在头脑中”对某种解释进行证实或者反驳,推动我们研究思路的拓展和深化。
思想实验在科学革命的过程中起着推动作用。例如,19世纪末,以经典力学、电磁理论和经典统计物理学为代表的经典物理学经过三百多年的发展,达到了完整、系统和成熟的阶段。当时不少物理学家认为物理学的大厦已经基本建成,一些基本的、原则的问题都已经得到解决。英国物理学家开尔文曾说:“在物理学晴朗天空的远处,还有两朵小小的令人不安的乌云。”这两朵乌云是指当时经典物理学无法解释的黑体辐射实验和迈克尔逊一莫雷实验。正是这两朵乌云引发了20世纪物理学的革命。这场物理学变革的推动力量是爱因斯坦的思想实验。爱因斯坦较早地看到了经典物理学的“危机”,他一直在思考两个问题:一个是,如果有人跟着光跑而企图抓住它,那么又会发生什么呢?另一个是,如果有人凑巧在一部自由下落的升降机里,那么又会发生什么呢?因这两个问题,他建立了关于时间、空间与物质运动之间关系的全新理论——狭义相对论。相对论的诞生,将人类对客观世界的认识向前推进了一大步,开拓了科学研究的新领域。
五、抽样技术的应用
教育研究是有目的有计划地认识教育现象、探索教育规律的活动,具有很强的探索性。为了揭示教育现象与过程的发展规律,选取的研究对象必须是有典型代表意义的,这样才能保证研究结果的可靠性。如何选择有代表性的研究对象,即取样问题,就成为考虑研究计划时很重要的一环。善于进行科学的取样,也是科学研究的基本要求。
(一)总体、样本、抽样的基本概念
总体,即研究对象的全体。凡是在某一相同性质上结合起来的许多个别事物的集体,当它成为统计研究对象时,就叫做总体,它是一定时空范围内研究对象的全部总和。例如,假如我们要调查某市小学生的课外阅读情况,那么这里的总体就是该市全市范围内所有的小学生。样本,是从总体中抽取的,对总体有一定代表性的一部分个体,也称为样组,它是能够代表总体的一定数量的基本观测单位。样本中所包含的个体的数量称为样本容量。我们之所以要抽取样本,是因为有些研究所涉及的总体的范围太广、人数太多,如果逐一调查,必然要花费巨大的人力和财力。仍以上面的例子为例,由于我们调查的总体(即全市所有小学生)可能有数十万人,我们不可能逐一进行调查,就必须从总体中抽取部分个体进行调查,以节省我们人力和财力的支出。
抽样,是遵循一定的规则,从一个总体中抽取有代表性的一定数量的个体进行研究的过程。抽样的目的在于,用一个样本去得到关于这个总体的信息,并且从样本的特征去推断总体,从而对相应的研究作出结论。
抽样技术之所以可行,是因为抽样技术植根于科学原理的基础之上。抽样技术是以概率论的大数定律作为理论基础的,是根据部分样本的实际资料对全部总体的数量特征作出推论估计。由于是按随机原则从调查总体中抽选样本单位,而且抽样推断的抽样误差可以事先计算并加以控制,因而保证了研究结果的准确性和研究的可靠性,并使研究有一定的深度,提高了研究的效率。
科学运用抽样技术对于获得可靠、可信的研究结论至关重要。在教育研究过程中,如果抽样技术不科学,至少会造成三个方面的问题。首先是大量资源的浪费。一些抽样可能涉及众多的调查对象,需要花费大量的人力、物力和财力,还需要投入大量的时间和精力。在这种大规模样本的研究中,如果不按照科学抽样技术规程运作,就有可能获得许多“遭受污染的数据”,使研究结论不科学、研究资源大量浪费。其次,不科学抽样会导致抵触情绪的增加。抽样误差必然导致多次重复抽样调查,这会带来相关研究人员和被调查者的抵触情绪。第三,不科学抽样可能带来过失误差的扩大。有人误以为用行政命令手段大量增加样本容量,就可以使样本接近总体。这其实是对抽样技术的误解。如果一个研究只需选取500人作为样本就可以推断出总体情况,就不需要抽样上万人。人多,抽样误差确实减少了,可是过失误差又会增大。
(二)选择样本的基本要求
为了保证抽样的科学水平,应遵循一些基本的要求。但是不同类型的研究范式对抽样的要求是不同的。例如,量的研究主要是概率抽样,而质的研究则主要是非概率抽样。两种抽样类型就具有完全不同的要求。考虑到抽样技术在量的研究中运用最为广泛,因此这里我们仅以量的研究为例,谈谈量的研究对抽样的基本要求。
1.明确规定总体
要从内涵和外延两方面明确总体的界限。研究的目的、课题性质决定总体的内涵。譬如,“大学生学习现状调查与学习指导的研究”,总体就是全国的所有大学生;“弱智儿童智能特点的研究”,总体就是所有的弱智儿童;、“初中学习困难学生教育的研究”,总体是城乡初中学习困难的学生。当然还必须对“学习困难”的含义加以明确的界定。
研究目的决定了总体的范围。研究者准备将研究成果推广到什么样的范围,就应在该范围内抽样。这就是说,要区分是城市学校还是农村学校,是重点校、一般校还是基础薄弱的学校,是大学理科还是工科、文科,是男生还是女生,是低年级还是高年级。从某一总体抽取的样本,经过研究获得的结果只能推广到这一总体中去。
2.抽样的随机性
我们都听说过“瞎子摸大象”的故事:一群瞎子摸着一头大象,摸到象牙的说大象是刀一样的东西;摸到尾巴的说大象是绳子一样的东西;同样,摸到腿的说大象是柱子、摸到身子的说大象是墙……我们不要笑话“瞎子说瞎话”,其实在抽样统计中我们自己就是“摸象”的瞎子,因为我们只知道样本而不知道总体,我们只能够通过抽取的样本来推断总体。为了使这种推断更加准确,就必须使得样本尽可能“均匀”地来自于总体,从而提高样本的代表性。这就必然涉及抽样的随机性问题。
在量的研究中,抽样的随机性不是说我们抽取样本是随意的,而恰恰相反,抽样的随机性要求我们尽可能使每个被抽取的个体都具有均等的机会,也就是说使被抽取的任何个体与个体之间是彼此独立的,在选择上没有联系。比如,假设我们要调查某所学校学生的近视率,那么我们设计的抽样方法必须保证该校所有学生都具有均等的被抽取的概率。如果这所学校共一千人,那么每个学生都应该具有千分之一被抽取的概率。
3.抽样的代表性
抽样统计的基本过程是先从总体中抽取部分个体组成样本,再对样本数据进行统计分析,最后以样本结果来推测总体情况。而能否从样本准确地推测总体情况,这就要求抽取的样本必须具有代表性,也就是说样本必须尽可能与总体的情况相一致。例如,假设我们要调查某所学校学生的学习主动性,那么我们抽取出来的学生样本必须既要包含优等生,也要包含后进生和中等水平生,而且还应该使三类不同学生在样本中的分布情况与总体的分布情况相一致。
如果抽样缺乏代表性,那么取样的偏差将导致研究结论的无效。一个非常典型的案例是1936年美国全国新闻杂志联合会就总统候选人进行选民民意测验,取样对象是各州交通处登记在案的汽车主人和各城市的电话用户两类人。正式选举开票结果是罗斯福当选,民意测验结果错误。分析其原因,主要是抽样时将多数没有汽车、没有电话的选民排除于调查对象之外了。又如,有人研究某大学学生课余休闲和爱好,利用晚自习时间到图书馆发放问卷,问卷回收率达90%以上,结论是:65%的大学生晚上都是在图书馆度过的。这一结论明显与事实不符,因为抽样的对象是在图书馆自学的学生,而许多没有进图书馆的学生则被排除在调查之外。
4.合理的样本容量
一般来说,样本容量与样本代表性呈现正相关,大的样本更具有代表性,研究结果可能更具有一般性。但是在抽样过程中,具体的样本大小还要考虑诸方面的因素,例如研究的不同类型;预定分析的精确程度、允许误差的大小、总体的同质性程度、研究者的时间、研究耗费的人力和物力、取样的方法等。在调查研究中,如果要求的精确度高、允许的误差值小或总体的异质性很大时,就要考虑使用较大的样本。
对一项具体的研究而言,到底多大的样本容量才是合理的?这个问题并没有统一的答案。美国学者威尔斯曼认为,如果一项调查所涉及的总体容量在2000人以上,那么样本的最小容量可以定在200人左右;而对于一个调查对象为25000人的总体容量,样本容量达到500或600应该是足够的。
(三)概率抽样与非概率抽样
所谓概率抽样,是指在被限定的研究对象中每一个单位都具有同样大的被抽中的概率。概率抽样以概率论为依据,通过随机化的机械操作程序取得样本,所以能避免抽样过程中的人为因素的影响,保证样本的客观性。虽然随机样本一般不会与总体完全一致,但它所依据的是大数定律,而且能计算和控制抽样误差,因此可以正确地说明样本的统计值在多大程度上适合于总体;根据样本调查的结果可以从数量上推断总体,也可在一定程度上说明总体的性质和特征。概率抽样主要分为简单随机抽样、等距抽样、分类抽样、整群抽样等类型。在量的研究中,绝大多数抽样调查都采用概率抽样方法来抽取样本。
六、研究质量的分析
评价一项研究的质量好坏,主要的标准是看研究是否具有较高的信度与效度。只有同时兼具较高的信度与效度的研究才能称之为高质量的研究。
(一)研究的效度
研究的信度与效度在量的研究设计中经常需要审慎的思考。研究的效度是指结论能被明确解释的程度(内在效度)和结论的普遍性(外在效度)。内在效度和外在效度这两种效度都只是度的问题。
内在效度是指研究结果能被明确解释的程度。在教育实验中,内在效度指自变量与因变量的因果联系的真实程度,即因变量y的变化在多大程度上来自自变量。
外在效度又称为推广效度,就是研究结果能被推广到的人群和范围的程度。在教育实验中,外在效度涉及教育实验研究结果的概括化、一般化和应用范围问题,表明实验结果的可推广程度。当前学校教育研究非常重视教育科研成果的推广和运用,但是在推广之前,我们确实需要认真地思考一项研究过程可以推广的程度或者说可能应用的范围。因此,外在效度在学校教育研究中是一个非常重要的话题。
比如:在一所高中进行一项关于学习兴趣的调查研究,从这所高中的三个年级分别随机抽取3个班(每个年级的各班之间没有明显差异),然后进行问卷调查,统计结论就可以很好地推广到这所学校的其他班级,具有较好的外在效度。但是推广到其他学校就不会有多少意义了。因为其他学校的情况与这所学校可能存在不小的差异。所以在运用这些调查研究的结果时,必须审慎地考虑它们的使用范围。
外在效度不仅仅是量的研究所关注的问题,同时也是质的研究关注的课题。在质的研究中,不同学者对外在效度有不同的表述,例如“质的研究的推论问题”“质的研究的概括力”“质的研究结果是否具有代表性”等等。但是,质的研究成果的“可推广性”在学理上面临着诸多的难题,例如质的研究大多是在自然情境中展开的,而不是像量的研究那样有严格的实验控制;质的研究对样本的选取往往容量很小,有时甚至就是针对一个人的个案研究;质的研究在抽样时基本不遵循概率抽样的原则,而是采取目的性抽样,不如量的研究那样具有代表性;等等。鉴于上述因素,学术界对质的研究的效度问题持有许多不同的观点。在此,笔者比较认同陈向明教授的观点,即大样本调查所获得的结论只能抓住这些样本表面的“共性”,如果要深入样本的个性层面,把握一个个样本个性背后的深层共性,就必须通过小样本的个案不断抵达共性的深层。
(二)研究的信度
在讨论研究的效度时,有必要讨论一个相关的概念——研究的可靠性,即信度。信度是指研究的方法、条件和结果是否可重复,是否具有前后一贯性。比如,在观察同一个教师的课堂教学行为时,不同的观察者在对待同一教师的同一表现时,是否能达成一致的意见?如果采用相同的课堂观察表,不同的研究者可以得出相同的结论,这就说明此项研究具有很高的信度,因为它可以重复。
在质性研究中,由于研究方法带有较强的主观性色彩(比如访谈法的运用就需要依赖研究者个人的魅力与机智),研究结果又难以量化,所以信度问题在质的研究中具有不同的处理方式。在质的研究中,提供多种证据来源是提高研究信度的有效方法。比如,对一位教师课堂教学的评价,我们可以倾听学生的观点、执教教师的个人反思、同行的评议等,如果透过不同的证据来源能够获得较为一致的结论,就说明该研究的设计具有较强的信度。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。