一、概念
标准差是度量离中趋势最常用的差异量数。作为样本统计量的标准差一般用符号S或SD表示,而作为总体参数的标准差则用希腊宇母表示。标准差的平方即为方差,分别用符号S2(样本统计量)和<r2(总体参数)来表示。
二、标准差与方差的求法
如同平均差一样,标准差也是用各数值与平均数的平均距离(离均差)来表示离中趋势。假如有那么一组数据,这些差的平均值就能够反映出该组数据的离散程度。但是也同计算平均差的情况一样,有些离均差是正的,有些是负的,它们相加就互相抵消而等于零。那么怎样才能做到既用平均离均差反映离散程度,又能避免离均差之和等于零呢?可能的出路有两条,一是取绝对值,但我们已经发现这不是一个理想的办法;另一条出路是,把每个离均差(不论正负)都平方,使它们都成为正值。
标准差与方差的概念易于理解,适于代数运算,能反映所有数据的差异情况,不易受抽样变动的影响。所以,比较而言,虽然其计算过程复杂一些,它是最为理想的差异量数。
我们看到,标准差与方差实质上是一个差异量数:标准差的平方就是方差,或方差的平方根就等于标准差,二者都是反映一组数据围绕典型值(如平均数)分布的情况。数据中的数值之间差异越大,越分散,与典型值的差异也就越大,数据的标准差或方差的值也就越大;反之,其值就越小,当数据完全没有差异时,所有数值都与典型值相等,这时标准差或方差等于零。
但是,方差有一个不太方便的地方,那就是它的度量单位。在上面关于句子长度(体现为单词数)的数据中,×代表每一句的单词数,×为句子平均单词数,那么(×-×)2的单位就应该是“平方差”,方差的单位也应是“平方差”,从实验解释的角度来看,这一概念不好理解,不利于说明问题。但是,标准差的单位却不同,方差经开方变为标准差之后,它的单位又变成了数值原有的单位一“词”。此外,标准差还具有许多其他有用的特点,因此,它是最常用的差异量数。
最后,需要指出的是,由于我们的例子仅仅是为了说明问题,数据中的数值都很小,但是在实践中,却经常会遇到很大的数值,因而在计算标准差时很麻烦。这时可以采用一个很简便的办法,那就是在计算标准差之前,先从各数值中减去一个常数。例如,在笔者进行的一项阅读研究中,所收集的数据为句子阅读时间,单位为毫秒,因而数值很大,例如4106,4172, 4296,4070。在计算标准差之前,可以先从每个数值中减去4000,这样得出的结果与从原数值直接计算所得的结果完全相同。其道理显而易见,因为标准差是从各数值与平均数的差的平方计算而来,当我们从原数值中减去一个常数时,也同时从数据的平均数中减去了该常数,所以各数值与平均数之差并没有变。
标准差的重要应用之一是对数值型数据进行标准化。在语言和语言教学研究中,标准化处理的主要用途是便于对考试分数的比较。
三、考分的比较
在教学评估以及教学研究中,我们经常要对考试分数进行比较分析,譬如比较两个人或同一个人在不同考试中的考分。所涉及的考试可能是非常接近的(如同一个年级的考试),也可能是很不相同的(如跨年级、跨语种、跨年度、跨学校等)。从逻辑上讲,要比较两个事物,二者必须具有可比性。具有完全可比性的不同考试是不存在的;不同考试的性质差异越大,其考分的可比性就越小。这时,要对其进行科学、有效的比较,就首先需要使其具有可比性。达到这一目的的手段就是对分数进行标准化处理。
我们现在以一个假想的例子来说明这个问题。假如有甲、乙两个学生,甲在某个考试中得了60分,而乙在另一个考试中得了65分,那么他们谁考得好呢?如果不假思索,可能有人会马上说:乙好于甲。其实,在回答这个问题之前,必须先回答另一个问题:所涉及的两次考试是否具有可比性。对这个问题的回答往往是否定的。从大的方面讲,可能考试所涉及的语种不同、教学和学习环境不同、教材和教学方法不同等;从小的方面讲,试卷本身也会有各种各样的差异,如考试内容、题型、试题难度、评分方法和评分尺度的掌握等。其次,即使在上述各方面两次考试十分接近,也还要考虑两个考分在各自的一组考分中所处的位置,也就是说要考虑两组考分的分布情况。假如甲所在的一组考分最高分为65分,最低分为40分,那么甲的考分在该组中是很高的;假如乙所在的一组考分最高分为90分,最低分为60分,那么乙的考分在该组中是很差的。所以,虽然乙得了65分而甲只得了60分,其实在各自的考试中,乙是个很差的学生,而甲却是个很不错的学生。
这就给我们一个启发:考分在各自分数组中所处的相对位置是可以进行比较的。虽然这同样无法保证百分之百的可比性,但这至少为比较不同考试的分数找到了一个较为可靠的途径。
四、标准化与标准分
一个分数在一组分数中的位置是参照该组分数的典型分数来确定的,也就是说,一个分数可以描述为在典型分之上还是在其下或是等于典型分,以及它离开典型分有多远。这个典型分数用平均分表示,离开典型分的距离用标准差表示(因为距离实际上表示分数的离散情况),这样我们就可以说某个分数离开平均分多少个标准差单位,同时用正负号来表示该分数是处于平均分之上还是之下(正号通常省略)。这实质上是把原始分数转换为标准差单位数,或以标准差为单位来表示一个分数与平均数的差,此过程称为标准化过程;一个分数离开平均分的“标准差单位数”则称为标准分或Z分,通常用字母Z表示。我们可以用公式表示这一标准化过程该式表示:先从一个分数中减去平均分,求出该分数离开平均分的距离(分数低于平均数时,差为负数;反之为正数),然后再除以标准差,即得标准分。
譬如,有一组分数的平均分为70,标准差为10分,有两个考生的分数分别为60和80,那么两者的标准分(即在该组分数中的相对位置)分别为:(60-70)/10和(80-70)/10,即-1和+1,也就是说两者的考分分别低于和高于平均分一个标准差单位。(www.zuozong.com)
标准分具有以下几个特点:
(一)一组分数的标准分之和为零,即=0,这是正负值相互抵消的缘故;
(二)一组分数的标准分之平均值为零,即Z =0;
(三)一组分数的标准分之标准差为1,即S =1;
(四)标准分属于等距数据;
(五)标准分具有相对性,即把原始分数由绝对转化为相对,以此来反映一组分数中各分数之间的相互关系,这一关系体现为各自离开平均分的距离和方向。从另一个角度看,一个分数的标准分也能告诉我们,在一组正态分布的分数中有多少个分数高于它或者有多少个分数低于它。譬如,分数的标准分等于0(即分数等于平均数)时,有一半的分数高于该分数,而有一半的分数低于该分数。
五、标准分的应用
通过把原始分数转换为标准分,原分数不见了,而代之以一个抽象的相对位置(标准分无实际单位),这样就可以用同一把尺子来衡量和比较不同考试(因而不同质)的分数。例如,我们上面提到甲、乙两个学生在两次不同考试中的得分分别为60和65,假如甲所在考分组的平均分为50,标准差为5,那么他的考分的标准分就是2;假如乙所在考分组的平均分为75,标准差为5,那么他的考分的标准分就是-2。据此,就可以知道他们在各自分数组中的相对位置,也就可以对他们的水平或能力进行比较:学生甲要好于学生乙。显然,如果不同考试的平均分和标准差完全一样,那么相同考分的标准分也就一样,不过这种情况是很少见的。一般情况下,不同考试的考分其平均分和标准差都存在不同程度的差异,因而不同的考分可能标准分相同,例如甲考了70分,所在考分组的平均分为80分,标准差为10分,乙考了75分,其所在考分组的平均分也是80分,但是其标准差却为5分,因而其标准分是一样的——都是离开各自的平均分一个标准差单位。同样的道理,相同的考分也可能标准分不同。
此外,利用标准分,也可以把不同质的考试分数合成(求和或平均数),然后再加以比较。譬如,在教学管理中,我们有时把某个教学阶段(如学期末或学年末)的几门不同课程的考试成绩相加,求出每个人的总成绩或平均分,然后加以比较,排出名次。其实,这种做法是不科学的,因为不同考试是不同质的(如难度不同、分散程度不同等),把不同质考试的分数求和或平均数,是没有意义的,同时也难以真实可靠地反映学生的整体情况,更不用说不同课程的重要性也并不是完全一样的。这时,应先把各门课程的考分转换成标准分,然后再求总和或平均分。例如,两个学生在精读、泛读、听力和口语等课程的二年级学年考试成绩的原始分数和标准分如下:
在该例中,按照原始分数计算总分,学生甲要低于学生乙,而把原始分数换算成标准分后计算总分,学生甲却高于学生乙(标准分为负数时,绝对值越大,表明离开平均数越远)。产生这种情况的原因是,在用原始分数计算总分时,没有考虑各门课成绩的分布情况,或者没有考虑其他考生的情况。因此根据原始分数的总分为学生排名次,是不可靠的。在高考录取时,也存在类似的问题。如果以各科原始分数的总分为依据,决定是否录取某个人,就有可能作出错误的选择。
再例如,某外语学院在其研究生教学中规定,只要有一门课程的考试成绩低于75分,即取消其撰写论文的资格。显然,这是不科学的。因为这实质上也是把不同质的考试硬拉在一起进行比较。同是75分,在不同考试中的意义是不一样的。在一个非常容易的考试中,它可能是比较低的分数,而在一个难度较大的考试中,它却可能是比较高的考分。如果凡是低于该分数的都不让写论文,这是不科学的,也是不公平的。科学的做法是把各科的考试分数换算成标准分,然后规定多少标准分以下的没有资格写论文。同上例一样,有了标准分之后,也可以把各科的成绩合成一个总分,或求平均分,排出名次,再制定一个标准,以确定总分或平均分为多少的人才有资格撰写论文。
总之,标准分在比较不同考试的分数或者把它们合成为总分时,起着重要的作用,而标准分的概念是与标准差的概念紧密联系的。
六、标准分与正态分布和百分位的关系
百分位是指把一组分数从高到低排列并分为100等分,以百分位等级表示某个分数在全部分数中所在的位置,即在全部考分中有百分之几的分数是低于该分数的或有百分之几的分数是高于该分数的。比如百分位等级为60的分数表示在全部考分中有60%的考分低于该分数或有40%的分数高于该分数。百分位表是在累积次数分布表的基础上编制的。
我们将会看到,标准分与正态分布和百分位的概念是紧密联系的,那就是通过标准化(即把变量的每个数值都转化为标准分)把一个呈正态分布的变量转换成标准正态分布。在正态分布的情况下,分布曲线下任意两个标准差(即标准分)之间的面积、任一标准差以上的面积或任一标准差以下的面积在总面积中的百分比都是一定的。例如,-2.33个标准差以下的面积为总面积的1%(0.01),0个标准差以下的面积为总面积的50%,1个标准差以下的面积为总面积的84.13%,等等。显然,“任一标准差以下的面积在总面积中的百分比”正是在正态分布的情况下,一组考分中任一考分的百分位(即该考分以下所有考分的累积次数在总次数中的百分比)。这也就是说,标准分与百分位是对应的,在考分呈正态分布时,两者所提供的有关考分的次数分布的信息是一致的。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。