本帖最后由 光爱哈赫 于 2011-8-28 22:49 编辑
二、实验心理学的变量与设计(一道选择题或大题)
(一)心理学实验的基本含义与基本形式
心理实验是指通过人为地、系统地操作环境,导致某些行为发生变化,并对之进行观察、记录和解释的科学方法。在实验法中,研究者可以积极地利用仪器设备干预被试的心理活动,人为地创设出一些条件,使被试者作出某些行为,并且这些行为是重复出现的。
(二)心理学实验与理论(其实都体现在实验之中)
1、实验范式
在心理学中,为了验证某种假设以及发现某些有意思的现象,实验者会设计具有验证性目的的实验。有些实验比较经典,被有相同或类似目的的后人多次沿用,就形成了一种实验范式。实验范式包括实验的目的,具体流程,手段以及实验设计等。(其实就是经典的实验例子,比如,stroop实验范式,词干补笔实验范式等)
2、实验逻辑
如果我们根据某种理论命题得到两个变量间存在因果关系,或者我们根据经验事实和主观判断推测现象X是造成现象Y的原因,即:X→Y,为了证明这一假设,我们要首先观察Y的变化情况。先在没有X时Y的情况,然后引入X后Y的情况,然后比较两次有没有变化。这就是实验最基本的分析逻辑。实际情况更加复杂,要排除其他各种因素造成Y在前后两次中所得结果不同的可能性。(这就是为什么我们要对自变量,因变量和额外变量进行控制的原因)
3、实验与理论的关系
一方面,心理学实验需要理论的指导。(问题与假设的提出是基于理论的)
另一方面,心理学的理论也需要实验的检验(实践才是检验真理的唯一标准)
(三)心理学实验中的变量及其控制
变量是在数量上或质量上可变的事物的属性。
1、自变量的种类及控制
自变量是实验者所操纵的,对被试的反应产生影响的变量。大致可以分为四类
作业变量:任务的任何特征作为自变量来操纵(记忆词表,错觉图形等)
环境变量:实验环境的任何特征(照明情况或照明强度)
被试变量:可能影响对某种刺激的反应的特性因素(性别,年龄,健康,智力,受教育水平)
被试暂时变量:由于某种原因,导致被试特性的暂时变化(疲劳,焦虑,被试给予不同指导语)
对自变量的控制:
建立合适的操作定义(用明确、统一、可量化的术语)【操作定义是对某个心理现象的测定程序】(如,疲劳定义为某种体力活动的劳动量,动机定义为挨饿时间)
确定自变量的各个水平(全距较大,且分布均匀)【因素型不超过4个,线性函数3-5个,复杂函数不少于5个】
校准实验仪器
控制呈现刺激的方式(呈现时间,次序、空间位置)
2、因变量的种类及控制
因变量是操纵自变量而引起的被试的某种特定反应。主要有六种。
反应速度、反应速度的差异、反应的正确率、反应标准、反应的难度、口语记录(主观)
对自变量的控制:
(1)反应控制:使用规范的指导语:内容确定,完全,简单明确,标准化
(2)选择恰当的因变量指标:要保证,有效性(效度),客观性(客观存在),数量化(能够量化)
(3)避免量程限制:天花板效应(超过量程,两个胖子站在10kg的秤上,秤都到底了)和地板效应(达不到量程,小学生做六级卷子,成绩都很差)
(4)反应指标的平衡:速度与准确性的平衡(在保证正确的同时尽量做快)
3、额外变量的种类及控制
额外变量是与实验目的无关但是会干扰实验的变量。包括两类
实验者效应(来自主试方面)
主试在实验中可能以某种方式(如表情、手势、语气等)有意无意地影响被试,使他们的反应附和主试的期望。(罗森塔尔效应,皮革马利翁效应)
要求特征(来自被试方面)
被试自发地对主试的实验目的产生猜想,然后再以一种自以为能满足这一猜想的实验目的进行实验的方式。(霍桑实验,安慰剂效应)
另外,被试的发展因素、成熟因素,历史因素,学习因素也都是重要的额外变量。
控制方法
1、排除法(把额外变量直接排除,如声光实验的隔音室,暗室。双盲控制法【主被试都不知道实验目的】)
2、恒定法(额外变量无法消除时,让它保持相对恒定,如实验仪器,物理条件)
3、匹配法(人为的划分成若干组,式被试的特质在一定程度上同质)
4、随机化法(平衡被试个体差异的方法,从理论上保证了被试具有代表性,一般大于30个)
5、抵消平衡法(有些额外变量不能消除也不能恒定,比如顺序误差、空间误差、习惯误差、疲劳效应和练习效应)
可以采取ABBA法和拉丁方设计(ABCD,BACD,BCAD,BCDA)
6、统计控制法
剔除极端数据,统计矫正,协方差分析来保证数据的可靠性
(四)实验设计
1、实验设计及评价标准
衡量一个实验设计好坏不仅要看其设计是否明确、是否有效、是否可操作性性及可重复验证性;同时也要看实验整体的科学性、可靠性和推广价值,这就需呀考虑到以下方面:
实验设计的内部效度;实验设计的外部效度,研究问题的理论与实践意义,实验指标的精确性与可靠性
2、前实验设计与事后设计(非实验设计)
前实验设计
单组后测设计(X O)
只有一个实验组,对实验组只给予一次实验处理,然后测量得到一个后测成绩。【在数学教学中,组织了课外辅导讲座,结果班上的数学成绩提高了。结论是课外讲座导致了数学成绩的提高】
局限:没有对照组,不能比较。没有前测也无法对之前成绩进行比较。同时,也没有考虑对机体变量、自变量及其他无关变量的控制,也很难排除历史、选择和成熟等内在因素所导致的。所以这种实验很难做出推断。
单组前测后测设计(O1 X O2)
比上面那种增加了前测,但还是仅有一组实验组
优点:有前测,可以提供基线数据,结果具有可比性;全部被试既是实验者又是控制组,可以控制选择变量
局限:最主要威胁是历史因素(中间时间可能有无关因素干扰),成熟也是(中间时间生理变化的影响),由于有前后测,练习效应也会影响。仪器、统计回归及测验与处理的交互作用,都会对内部效度造成影响
固定组比较设计(X O1)
O2
就是在第一个实验设计增加了一个对照组,但是没有经过随机分配。
优点:基本上能对历史因素进行控制。(时间上两组同时进行),因为没有前测,所以可以控制练习效应和仪器因素的干扰。最后也能对成熟因素做到有限控制。
局限:无法控制选择因素(没有随机分配被试),选择与成熟的交互作用和选择与处理的交互作用混淆不清
检验方法(独立样本T检验,U检验,中位数检验和卡方检验)
事后回溯设计(⊕ O)
指所研究的对象是已发生过的事件。
相关研究设计(O1 O2)
其中一个数据是另一个数据观察到得结果【吸烟是导致肺癌的原因】
前后都可能是原因,也有可能是第三方变量共同引起的。(可采用积差相关就相关系数)
准则组设计(⊕ O1)
O2
(O1是具有某种特征的准则组,O2是没有展示出准则组特征的效果)
【第一组学生的成绩很好,第二组学生的成绩很差,我们可以追溯出第一组的教师要比第二组的好】
优点:可以对自然条件下的各种事件进行追溯,以了解原因结果。
特别适用于简单因果关系的研究
可以提出研究假设充足的论据
在某种条件下,事后追溯更为有用,因为实验法带有认为性质
条件限制不能用实验法的,也可以用该方法。
局限:研究缺乏控制,不能操纵自变量和随机分配被试
一个结果可能有多个原因
有相关的两个因素也可能是第三方变量导致的
3、准实验设计
(单组)时间序列设计(O1 O2 O3 O4 X O5 O6 O7 O8)
就是把单组前后测实验设计中间插入了一些列周期性的测量。
优点:较好的控制成熟变量,可以控制测验因素的干扰,有可能控制统计回归的因素
缺点:由于没有控制组,不能排除那些与自变量同时出现的附加变量的影响。其次测验与处理的交互作用不易受到充分的控制。最后练习效应(多次测验会增加或降低测验的敏感性)
(单组)相等样本设计(X1O1 X0O1 X1O3 X0O4)
对一组被试选取两个相同时间样本,其中一个时间样本出现实验变量(X1),另一个时间样本不出现实验变量(X0),可以看成是单组后测的改良版。
优点:在控制内部效度方面完全有效(控制历史因素)
局限:控制外部效度并不理想(测验,实验安排的反作用,选择偏差与实验变量的交互作用,重复实验处理的干扰)
不相等实验组控制组前测后测设计(多组)(O1 X O2)
O3 O4
其实就是固定组比较设计中增加了前测
优点:由于添增了控制组,基本控制了,历史、成熟、测验因素对实验的干扰。其次,由于两组都有前测,实验者可以了解实验处理前的初始状态,从而对选择因素有了初步的控制。
局限:由于没有随机分配被试,实验组和控制组实际上是不对等的。因而选择与成熟、选择与实验处理的交互作用可能会降低该设计的效度。又由于两组都有前测,因而其实验结果不能推广到无前测的情境中去。
不相等实验组控制组前测后测时间序列设计(多组)(O1 O2 O3 O4 X O5 O6 O7 O8)
O9 O10 O11 O12 X O13 O14 O15 O16
也就是在不相等实验组控制组前测后测设计中间插入了一些列周期性的测量
优点:兼有两者优点,基本控制了历史、成熟、测验,选择与成熟交互作用
缺点:实验的反作用效果记忆选择偏差与实验处理X的交互作用则可能会成为影响该设计外部效度的因素。
拉丁方设计(平衡设计)(ABCD,BACD,BCAD,BCDA)A=X1 O1 ;B=X2O2
是一种设计的模式,为了达到实验控制的目的,使各组被试都接受不同的实验处理,而对实验处理的顺序进行了轮换。而且是只有后测的设计。
优点:抵消平衡的方式避免了顺序效应
缺点:由于不能采用随机分配被试的方法,选择因素可能与历史成熟,练习产生交互作用。
4、真实验设计
与前两种实验的最大区别在于能随机将各被试随机的分到各个处理水平结合,从而能更客观的反应实验处理的作用。
随机实验组控制组前测后测设计(R O1 X O2)
R O3 O4
就是不相等实验组控制组前测后测设计的随机化
优点:基本控制了绝大多数内部效度的影响
缺点:由于前测而获得的经验,可能对后测产生敏感性,出现反作用效果,导致对实验设计外部效度的影响。
随机实验组控制组后测设计(R X O1)
R O2
由于前测会影响外部效度,所以去掉了前测(是理想的实验设计)
随机多组后测设计(R X1 O1)
R X2 O2
R X3 O3
仅在实验处理的个数以及相应的被试组数增加了。其它同上
多因素实验设计
完全随机析因设计(完全随机双因素析因设计)【统计见多因素方差分析】
其实和上面的是一样的,只不过X从实验处理变成了处理水平结合
如典型的3×2完全随机化双因素实验设计
R Xa1Xb1 O1
R Xa1Xb2 O2
R Xa2Xb1 O3
R Xa2Xb2 O4
R Xa3Xb1 O5
R Xa3Xb2 O6
随机化区组设计
和前面那个基本一样,主要是接受实验处理的被试不同,是将同一实验组中或控制组中被试按不同特质水平分成的小组,并且每一区组接受所有不同的处理。
优点:考虑到个体差异对实验结果的影响,并在统计分析时将这种影响从组内误差中分离出来,节省了大量的试验被试,省时省力。 局限:主要是划分区组有一定困难。 (五)实验研究的效度
实验效度是指实验方法能达到实验目的的程度,也就是实验结果的准确性和有效性程度。
1、内部效度
是指实验中的自变量与因变量之间因果关系的明确程度。换句话说就是自变量而不是其他因素引起了因变量的变化,那么这个实验就具有较高的内部效度。所以,内部效度与无关变量的控制有关。
主试—被试间的相互作用:要求特征和实验者效应。(控制方法:双盲实验法)
统计回归:向常态分布的平均数回归。对有极端特性的被试有较大影响。(控制方法:匹配法和协方差分析)
被试的一些固有的和习得的差异,如性别、年龄、经验、个性等都对研究存在一定的影响。还有被试的亡失(随机分配)
此外还有选择;测验(练习、临场经验等);成熟(即被试身心的成熟);历史(即实验时间跨度中所发生的会影响实验结果的事);仪器的使用;上述诸多因素的交互作用等。
如果在一项实验研究中,由于上述种种原因造成了严重的混淆,导致自变量的操纵和变化没有引起因变量相应的变化,那么实验就会出现零结果。因此,如果零结果不是真正意义上说明自变量和因变量毫无关系,那么就必然提示了实验的内部效度存在大问题。
2、外部效度
指实验结果能够普遍推论到样本的总体和其他同类现象中去的程度,即实验结果的普遍代表性和适用性,研究者也将之称为生态效度。主要有以下三个方面的影响
影响外部效度的因素:(1)实验环境的人为性(2)被试样本缺乏代表性(3)测量工具的局限性
实验的内部效度和外部效度是相互联系、相互影响的。提高实验内部效度的措施可能会降低其外部效度,而提高实验外部效度的措施又可能会降低其内部效度。一般而言可以在保证实验内部效度的前提下,适当采取措施提高外部效度。
3、构思效度(想法靠不靠谱,转换成实验价值多大)
它是指实验研究假设和测量指标的理论构思及其操作化问题,即理论构思及其转换的有效性。构念效度直接决定了研究者的设想能不能以实验的形式表现出来。
好的构思效度应该是:来源具有合理性,具有一定的独特性,研究的理论构思结构严谨、清晰明确,有一定的层次。要对实验研究中的自变量和因变量给出严格的操作定义,并对自变量的操作水平和因变量的测量指标作出明确的界定。此外,在研究中也要选取多种指标,运用多种方法,从不同角度出发进行多维的分析和构思,以提高研究的构念效度。
4、统计结论效度
是有关决定实验处理效应的数据分析程序的有效性和准确性。统计程序的有效性涉及研究误差的变异来源和如何恰当运用统计显著性检验的问题。例如,如果研究的样本较小时,采用统计显著性水平作出推论则是很危险的。因为小样本时,样本成分和测量都波动比较大,具有不稳定性。
有两方面条件都能影响到统计程序的有效性。一是数据的质量,包括数据的类型、分布和量表特征等。它们决定了该采用何种统计分析程序来对数据进行分析才是正确的。例如,如果数据是计数型数据应采用参数检验,如果数据是计量型的则应采用非参数检验。二是统计检验的假设。数据分析中所采用的各种统计方法都有其明确的统计检验假设。在一项实验研究中,如果所得到的数据特征不能满足某种统计分析程序所要求的统计检验假设,那么就不能运用该统计方法进行数据分析,否则必然影响统计结论的效力。
后记 这一章经常会拿来考大题,实验设计是心理学的核心,所以重要性也不言而喻了。这一章很多内容要记,也不是那么简单的是,光靠机械记忆是很难背下来的,即便背下来也未必能灵活运用,所以这里要注意其中的逻辑,从非实验到准实验到真实验,其实是层层递进的关系,刚开始就像基本实验逻辑中的那样,只有后测,后面才慢慢完善起来,其中各种实验和变量的控制间都是有逻辑关系的,只要把握住了,形成组快,就很好记了。
介绍
美国心理学家罗森塔尔等人于1968年做过一个著名实验。他们到一所小学,在一至六年级各选三个班的儿童进行煞有介事的“预测未来发展的测验”,然后实验者将认为有“优异发展可能”的学生名单通知教师。其实,这个名单并不是根据测验结果确定的,而是随机抽取的。它是以“权威性的谎言”暗示教师,从而调动了教师对名单上的学生的某种期待心理。8个月后,再次智能测验的结果发现,名单上的学生的成绩普遍提高,教师也给了他们良好的品行评语。这个实验取得了奇迹般的效果,人们把这种通过教师对学生心理的潜移默化的影响,从而使学生取得教师所期望的进步的现象,称为“罗森塔尔效应”,习惯上也称为“皮格马利翁效应”(皮格马利翁是古希腊神话中塞浦路斯国王,他对一尊少女塑像产生爱慕之情,他的热望最终使这尊雕像变为一个真人,两人相爱结合)。
|