Free考研资料

标题: 第二贴:统计和测量,求教!! [打印本页]

作者: 阿mew    时间: 12-12-13 08:55
提示: 作者被禁止或删除 内容自动屏蔽
作者: 路人十九    时间: 12-12-13 13:14
1.基础备考P414页,18题   在完全随机因素方差分析中,当组数大于三时,用均数两两比较的t检验,犯I类错误的概率将会(A)
A增大    B减小   C不变    D可能增大也可能减小
因为:
H0:任意两组之间无差异
H1:至少有一组两两比较有差异
此时犯第一类错误的概率就是P(拒绝H0 | H0为真)=P(接受H1 | H0为真)=1-P(接受H1 | H1为真)=1 - (1-alpha)^N
那么 N>=3时,作alpha=0.05的t检验,上述概率会随着N的增加而增大

作者: 路人十九    时间: 12-12-13 13:18
本帖最后由 路人十九 于 2012-12-13 15:54 编辑

2.大纲解析1000题P76页,20题   有一随机样本,n=50,s(n-1)=10,该样本的总体标准差的95%的置信区间是()
A[7.42,12.58]  B[8.04,11.96]  C[8.00,12.00]  D[7.26,12.74]
是用S(n-1)-Z(α/2) σs< σ<x+Z(α/2) σs这个公式吗?
这个是对的,因为题目未给出总体分布。样本容量n很大(n>30)所以认为样本标准差Sn-1的分布是接近正态分布的,它的期望就是总体标准差 σ,它的标准差 σs= Sn-1/root(2n),于是有S(n-1)-Z(α/2) σs< σ<x+Z(α/2) σs   .
3.P79页,41题  现有600名初中一年级学生身高的次数分布的资料,学生的最低身高是139cm,最高身高是171cm,学生身高的数据被分成了11组,组间距为3cm,现知道每组学生的人数,已有所有学生身高的平均数。其中两组被合并到其他组中,涉及的自由度是(D)  A10  B9  C7  D6
自由度=调查中分类的项目数-观察数目的统计量数,何为观察数目的统计量数?组间距、人数、平均数吗?

样本统计量是样本X1,X2,...,Xn的确定可测函数g(X1,X2,...,Xn),例如样本容量、样本均值、样本方差、样本标准差、样本全距、样本中位数等等都是。但是不是所有的统计量都能参与假设检验,且不是所有的统计量都相互独立,比如样本标准差是样本方差的平方根,它们之中任何一者确定,另一者也就确定了,也就是说,如果用它们参与假设检验,那么只会带来一个自由度的减少而不是两个。
这个题目显然是要做卡方分布拟合优度检验,那么会用到三个独立的统计量:样本容量、样本标准差(是根据每组人数、组距计算出来的)、样本平均数
所以自由度=11-2(合并组)-3(总人数、标准差、平均数)=6


作者: 路人十九    时间: 12-12-13 14:34
本帖最后由 路人十九 于 2012-12-13 15:57 编辑

4.冲刺必备P53页,8题  一位研究者取了n=12的样本对其先后进行3种条件的处理,如果用方差分析计算此研究的结果,则F的自由度为() A(3,36)  B(2,35)  C(2,24)  D(2,22)
建议背公式:
一般的,2x2被试者间(A)被试者内(B)混合设计的方差分析,有df总=df被试间+df被试内=(dfA+df被试不同质)+(dfB+dfAxB+dfBx被试)
其中
dfA=A的水平数-1=p-1
dfB=B的水平数-1=q-1
df总=数据总数-1=npq-1
df被试间=被试数目-1=np-1
df被试不同质=df被试间-dfA=np-p
dfAxB=dfA*dfB=(p-1)(q-1)
dfBx被试=df被试内-dfB-dfAxB=p(q-1)(n-1)
题目中说“先后进行3种条件的处理”,说明是被试者内设计,只有一个因素B,没有因素A,可以看作是p=1的特殊情形
于是dfB=q-1=2
df被试不同质=n-1=11
dfBx被试=df总-dfB-df被试不同质=3x12-1-2-11=22


作者: 路人十九    时间: 12-12-13 14:53
本帖最后由 路人十九 于 2012-12-13 14:54 编辑

5.P54页,13题   让64为大学生品尝A、B两种品牌的可乐并选择一种自己比较喜欢的。如果这两种品牌的可乐味道实际没有任何区别,有39人或29人以上选择品牌B的概率是(B)
A.2.28%  B.4.01%  C.5.21%  D.39.06%
解析中知道了p,q,μ,σ,Z=1.75,由于1.645<1.75<1.96,故P(Z1.75)在2.5%到5%之间。为什么是2.5%?1.645不是对应90%吗?所以,P(Z≥1.75)在5%到10%之间??
记n个人中喜欢B品牌的人数为X,若AB无差别,则p=q=0.5,由于样本n=64很大,可以认为X近似服从正态分布N(64*0.5 , 64*0.5*0.5)=N(32,16),那么化为标准分数Z=(X-32)/4,有Z~N(0,1),概率P(X>=39)等价于P(Z>=1.75)
由于概率P(-1.64<Z<+1.64)=90%,P(-1.96<Z<+1.96)=95%,
所以P(Z>=+1.75)=1-P(Z<1.75) = 1-[P(-1.75<Z<1.75)+P(Z<-1.75)] = 1-P(-1.75<Z<+1.75) - P(Z>+1.75)
移项后有
2*P(Z>+1.75)=1-P(-1.75<Z<+1.75) > 1 - P(-1.64<Z<+1.64)=10%
2*P(Z>+1.75)=1-P(-1.75<Z<+1.75) < 1 - P(-1.96<Z<+1.96)=5%

综合有 2.5%<P(Z>+1.75)<5%
于是只能选B



作者: 路人十九    时间: 12-12-13 15:01
本帖最后由 路人十九 于 2012-12-13 15:56 编辑

6.P56页,44题  两样本平均数比较作t检验时,分别取以下检验标准,以(D)所犯第Ⅱ类错误的概率最小。
A.α=0.01   B.α=0.05  C.α=0.001  D.α=0.10
不用画图,建议记结论:
I. 样本容量n一定时,alpha和beta的变化相反,一者减小则另一者必然增大
II. alpha一定时,n越大, beta越小
III. alpha和n一定时,真值与伪值的差异越小, beta则越大

图的话参看重难点手册P394

作者: 路人十九    时间: 12-12-13 15:07
本帖最后由 路人十九 于 2012-12-14 10:45 编辑

7.P57页,3题  对于单因素方差分析的组内误差,下面哪些说法是对的(AB)?
A其自由度为k(n-1)  B反映的是随机因素的影响  C反映的是随机因素和系统因素的影响  D组内误差一定小于组间误差
解析:组间误差反映的是随机因素的影响,个体差异属于随机误差,处理效应反映的是系统误差。是不是有错误?


这样理解是可以解释这个题目的,但是我个人持保留意见,我不认为处理效应是一种“误差”,它确实是“系统性”的,然而它并不是一种“误差“,它是”效应“
我的个人理解如下:
区组效应反应了由于被试不同质所引起了数据的变化,这种变化在方差分析中的量化就表现为区组间的Sum Square,我们记作SSR,相应的Mean Square我们记作MSR
组内误差/随机性误差在方差分析中量化体现为残差,它包括了抽样、方法、测试、仪器等各种因素引起的随机误差,我们把相应的Sum Square记作SSE[或者SSW] (这里要指出,方差分析方法本身不能侦测到系统误差,即使实验中存在系统误差,它是一个常变量C,它不会体现在方差之中。如果想要观测系统误差,需要专门设计相应的试验,例如采用多种不同的测量方法测量同一对象,以观察其中彼此间的的稳定差异。),相应的Mean Square我们记作MSE或MSW(W是Within的意思)
处理效应是被研究的自变量,也就是不同的试验处理,对观测结果(因变量)产生的影响(显然它不是误差),在方差分析中它就量化表现为组间的Sum Sqaure,我们记作SSB(B是Between)或者SSA("A"是自变量A或者因素A的意思),相应的Mean Square我们就记作MSB或MSA

区组效应、处理效应、随机性误差显然都可以导致观测结果(因变量)的变化,如果F=MSA/MSE很大,超过了临界水平,这说明在统计意义上MSA>MSE,那么MSA扣取了MSE的那一部分(不是简单的MSA-MSE,而是通过统计方法从MSA扣去MSE)就代表了处理效应;如果MSA/MSE不大,没超过临界,在统计意义上就认为MSA=MSE,那就意味着统计意义下处理效应为0,就是说在统计意义下自变量根本没有对因变量产生作用。

作者: 路人十九    时间: 12-12-13 15:20
本帖最后由 路人十九 于 2012-12-13 15:20 编辑

8.大纲解析P236页,12题   有一个学生的成绩低于平均成绩1.2个标准差,他在该班的百分等级是(B)
A.16.87%  B.11.51%  C.4.93%  D66.87%
此题即默认总体成绩是正态分布的。记平均成绩为μ,标准差为σ,此人的成绩为X,由题意X=μ+1.2σ,那么他的标准分Z=(X-μ)/σ=1.2,查正态分布表Z=1.2时的P(0<Z<1.2)=38.49%,于是比此人分数更高的人的比例 P = 1 - P(Z>1.2) = 1 - P(Z<0) - P(0<Z<1.2) = 1-50%-38.49%=11.51%

作者: 路人十九    时间: 12-12-13 15:26
本帖最后由 路人十九 于 2012-12-13 15:27 编辑

9.P237页,13题  一位研究者报告单因素重复测量的方差分析时,F检验的结果是F(3,12)=5.95,据此结果可知此研究由几中处理水平、几个被试?(C)
A.3、12   B.4、13   C.4、5   D.3、13
基础备考和冲刺必备中各有一道两因素方差分析,交互效应的题。那单因素如何确定被试人数?
问题的关键在于题目中的“单因素重复测量”,这就说明此是单组前测后测设计,即单因素被试内设计。也就可以按照上面第4题的公式来处理。
从F的自由度可以看出dfB=3,也就是说,因素B有q=3+1=4个水平,dfBx被试=12,也就是(n-1)*(q-1)=12,那么n=5


作者: 路人十九    时间: 12-12-13 15:36
10.19题  100名被试被分为5组,每种接受一种实验处理。实验结束后,每种的平均数分别是50、60、70、80、90,则组间平方和为(C)  A.2000   B.500   C.20000   D.5000
怎么做?
首先分析题目:“每组接受一种实验处理”即每组接受不同的处理,即被试者间设计,且未划分区组,所以是单因素完全随机设计。按单因素完全随机设计的方差分析来处理。
先求所有数据的均值:X总平均=(50+60+70+80+90)/5=70
又100人分作5组,每组人数n=20
组间平方和SSB=20 * [(50-70)^2 + (60-70)^2 + (70-70)^2 + (80-70)^2 + (90-70)^2]=20*[2*(10^2+20^2)]=20000

作者: 路人十九    时间: 12-12-13 15:52
11.P238页,7题  估计总体参数可能落在置信区间以外的概率为显著性水平(错)
显著性水平α不就是估计总体参数落在某一区间时,可能犯错误的概率吗?犯错误不就是没落在置信区间?
PS:为什么基础备考P371页说:α越小,表示显著性水平越高?这俩不是一回事儿吗
文字游戏。
区间估计和置信度的数理定义:
设总体X的分布函数为F(x,θ),其中θ为未知参数,X1,X2,...,Xn是来自X的样本。对于给定值α(0<α<1),若统计量θ1和θ2满足:
P(θ1<θ<θ2)=1-α
则称随机区间(θ1,θ2)是参数θ的置信度为1-α的置信区间。
(顺便说,很多应用统计的书把α也称为显著性水平,但是数理统计中其实不是这样的,只有假设检验才有显著性水平一说,虽然形式是一样的,但是在做区间估计的时候,只有置信度或置信水平1-α而没有定义α表示显著性水平)
估且按一般应用统计教材的说法把α称为显著性水平,那么α的意义应该解释为“估计参数θ落在置信区间内
,可能犯错误的概率”或“认为置信区间包含参数θ,可能犯错误的概率”。揣摩揣摩这两种说法和题目所给的说法之间的区别吧。实在觉得难以理解就死记咯...
作者: 路人十九    时间: 12-12-13 15:53
本帖最后由 路人十九 于 2012-12-13 20:03 编辑

测量
这个后两题......等高人指点

作者: 阿mew    时间: 12-12-14 15:51
提示: 作者被禁止或删除 内容自动屏蔽
作者: 路人十九    时间: 12-12-14 20:50
本帖最后由 路人十九 于 2012-12-14 20:52 编辑
阿mew 发表于 2012-12-14 15:51
路人十九好,照你的解析:
1题似乎列个表比较好理解
2题S(n-1)-Z(α/2) σs< σ

1、这个重难点手册p392写的比较清楚,可以再看看,实在不行~记结论
2、这里x应该是写S(n-1),笔误哈,σs跟SE(x)看似形式一样,但是分母不同,前者是根号下2n,后者是根号下n,而且实际上还是大有不同的,后者那个公式是建立在总体分布已知且为正态时得出的,而且估计对象是总体均值的区间,前者则是总体分布未知,但样本很大,事实上是用林德伯格-列维中心极限定理得出样本统计量(X拔)近似服从正态分布,然后去估计总体的σ。。。这个问题可以看张厚粲《现代心理与教育统计》P206“标准差的区间估计”
4、(dfBx被试)和(df被试不同质)的区别在于,后者是由于各被试本身的某些特质的差异造成的,比如这12个人可能被要求在三种不同环境中分别做数学题,但是这12个人本来数学水平就不同,这种不同也会反映在总的方差中,但是这种不同跟我们的三种实验处理没有关系,也不是随机性的误差,所以要把这种差异分辨出来,这就是(SS被试不同质),也可以写作(SS被试间)。
SS(Bx被试)则是指随机变异,但是由于这是被试内设计,实验处理B的三个水平也对被试产生了影响,也就好像是因素B和被试本身同时作用一样,所以不同于被试间设计中的残差,这个随机变异记作(SSBx被试),如果要对B的显著性进行方差分析,那么F=SSB/SSBx被试,而不是F=SSB/SS被试间

作者: 阿mew    时间: 12-12-15 22:30
提示: 作者被禁止或删除 内容自动屏蔽
作者: 路人十九    时间: 12-12-16 10:22
测量12题应该是选C,答案可能给错了,被试团体同质性高,则总分分布收窄,方差减小,导致信度易被低估,又信度限制效度,效度也偏低
作者: 路人十九    时间: 12-12-16 10:26
13题公式就是100+15Z。如果在同年龄组前2.5%位置上,那么查正态表P=47.5%,得Z=1.96,算出智商为129.6,选D
作者: 阿mew    时间: 12-12-16 11:54
提示: 作者被禁止或删除 内容自动屏蔽
作者: 阿mew    时间: 12-12-18 22:32
提示: 作者被禁止或删除 内容自动屏蔽
作者: 阿mew    时间: 12-12-19 17:29
提示: 作者被禁止或删除 内容自动屏蔽
作者: geqianbeida    时间: 12-12-22 23:47
路人十九 发表于 2012-12-16 10:22
测量12题应该是选C,答案可能给错了,被试团体同质性高,则总分分布收窄,方差减小,导致信度易被低估,又信 ...

12题  同质性高 分布窄 信度容易被高估吧  效度可能变低

比如,测某学校学生的智力,如果抽取这个学校的前十名,和随机抽样相比,信度会虚高,效度会变低(不能反应真实情况)

作者: geqianbeida    时间: 12-12-22 23:48
阿mew 发表于 2012-12-19 17:29
彭聃龄《普通心理学》(第四版)P471页:某施测年龄组的平均得分为80分,标准差为5分,而某人得85分,他的得 ...

这个不是算的,就像1.96个标准差是双侧0.5的概率一样,是应该记住的一个常用数据。
作者: geqianbeida    时间: 12-12-22 23:52
阿mew 发表于 2012-12-19 17:29
彭聃龄《普通心理学》(第四版)P471页:某施测年龄组的平均得分为80分,标准差为5分,而某人得85分,他的得 ...

建议记住 1、1.96、2.58个标准差相对应的概率
作者: 路人十九    时间: 12-12-24 16:07
geqianbeida 发表于 2012-12-22 23:47
12题  同质性高 分布窄 信度容易被高估吧  效度可能变低

比如,测某学校学生的智力,如果抽取这个学校 ...

这个。。如果抽前10名,测两次计算重测信度,由于名次随机性很大,于是信度应该偏低,效度受制于信度,也偏低
作者: 阿mew    时间: 12-12-24 17:14
提示: 作者被禁止或删除 内容自动屏蔽
作者: qthz    时间: 13-4-17 09:47
提示: 作者被禁止或删除 内容自动屏蔽




欢迎光临 Free考研资料 (http://test.freekaoyan.com/) Powered by Discuz! X3.2