当前位置:网站首页 >> 文秘18门基础课精讲       2018年7月21日  星期六  2:44:09

>>文秘18门基础课精讲

>>社会调查实务

项目四 调查信息的分析

发布时间:2013-01-02  来源:原创  作者:主编:王茜 肖晗 副主编: 侯典牧 戴香智 刘江兵 戴李君  发布者:网络秘书  浏览次数:1426  
字体:  【大】  【中】  【小】

 

项目四调查信息的分析
 
 【知识目标】
了解调查整理的意义与原则,掌握资料审核、分组、汇总的基本方法和技巧;
掌握频数和百分比表分析、集中量数和离散量数的分析、数据分布形态的分析、位置量数分析、相关系数分析的分析特点及使用条件;
理解理论分析方法:比较分析、类比分析、因果分析、结构功能分析、归纳、演绎分析等方法的特点,掌握文字资料和数字资料的整理。
【能力目标】
能对调查资料进汇总与分类;
能制作统计图和统计表;
能运用比较分析、分类分析、因果分析、结构功能分析、归纳演绎推理对调查资料进行理论研究。
任务12整理调查信息资料
【任务描述】
在调查实施阶段搜集到有关高校考证情况的原始资料通常是粗糙、杂乱、零碎的,虽然它们具有社会实在性,但无法显现宏观研究现象的总体特征。为了资料分析的需要,必须对其进行加工处理。因此,资料整理是从调查阶段过渡到分析研究阶段的一个必经的中间环节。
【任务完成】
一、任务完成目的与要求
了解调查整理的意义与原则,掌握资料审核、分组、汇总的基本方法和技巧,使学生基本上能独立完成调查资料的整理工作。
二、任务完成步骤
1.老师带领学生一起学习有关调查信息资料整理的基本原理及主要知识点;
2.老师布置任务,让学生在课下以小组为单位,将前阶段所收集到的资料进行整理;
3.在课堂上对各小组的调查资料整理状况加以分析,找出不足,并提出解决的对策建议;
4.老师再次强调资料整理在整个调查研究过程中的重要性及其操作技巧的运用。
一、调查资料整理的意义与原则
(一)资料整理的意义
 
社会调查方法
项目四调查信息的分析
 
所谓资料整理,主要是指对文字资料和对数字资料的整理。它是根据调查研究的目的,运用科学的方法,对调查所获得的资料进行审查、检验、分类、汇总等初步加工,使之系统化和条理化,并以集中、简明的方式反映调查对象总体情况的过程。资料整理是资料研究的重要基础,是提高调查资料质量和使用价值的必要步骤,是保存资料的客观要求。具体而言,在社会调查中资料整理具有重要的意义和作用。
(1)资料整理使资料质量有了保证。在调查资料的搜集过程中,由于各种主客观原因,所搜集的资料难免会出现虚假、差错、短缺、余冗等现象。要解决这些问题,除了在资料搜集过程中随时加强检查外,还必须在资料分析前进行一次系统的科学的整理与审核,改错补遗、查漏补缺、去伪存真、去粗取精,以保证资料的真实、准确和完整,从而保证整个调查工作的质量。
(2)资料整理使资料分析有了可能。根据研究目的,社会调查所搜集到的资料虽然非常丰富,但它们大多是零星的、不系统的,在体现社会现象性质特征上带有很大的随意性,要透过资料获得对社会现象内在规律的认识,就必须借助于完备的、系统的资料,只有对原始资料进行加工处理,使之系统化、条理化,资料分析才有可能。
(3)资料整理使分析质量有了基础。资料整理是从对社会现象个体的观察过渡到对社会现象总体的认识、从对社会现象的感性认识过渡到对社会现象的规律性认识的连结点。可以说,资料整理是资料分析质量的基础。因此,资料整理方法的正确与否,将直接影响到对现象进行总体分析的真实性。也就是说,资料分析的准确性和真实性,都是以资料整理方法的恰当性和科学性为基础的。
(4)资料整理使资料保存有了条件。社会调查资料既是社会调查结论的客观依据,又是今后相关调查的重要参考。而资料整理不仅可使保存的资料具有真实性和可靠性,而且为资料长期保存和利用提供了条件。
(二)资料整理的基本原则
资料整理作为社会调查研究的重要环节与过程,是资料分析的基础,资料整理的好坏直接影响到资料分析的效果。资料整理需要坚持的原则,简单而言就是6个字:“真”“准”“整”“统”“简”“新”。
(1)“真”,即真实性原则,指调查数据资料必须真实,不能弄虚作假,主观杜撰。对收集到的调查数据资料要根据实践经验和常识进行辨别,看其是否真实可靠地反映了调查对象的客观情况。一旦发现有疑问,就要再次根据事实进行核实,排除其中的虚假成分,保证调查数据资料的真实性。如果整理出来的调查数据资料不真实,那么,比没有调查数据资料还更危险。因为没有调查数据资料,顶多做不出结论,而资料不真实,就会做出错误的结论,这比做不出结论更有害。因此,“真”是整理资料时应遵循的首要标准。
(2)“准”,即准确性原则,指调查数据资料必须准确,不能模棱两可,含混不清,更不能自相矛盾。如果某位被调查者在年龄栏内填写的是30岁,而在工作年限栏内填写的是21年,这显然是不合乎逻辑的,对类似的调查数据资料都应认真审核处理。同时,对搜集来的各种统计图表应重新计算复核;对利用历史资料更要注意审查文献的可靠性程度。
(3)“整”,即完整性,指调查数据资料必须完整,不能残缺不全,更不能以偏概全。检查调查数据资料是否按照调查提纲或统计表格的要求收集齐全或填报清楚,应该查询的问题和事项是否都已经查询无漏。如果调查数据资料残缺不全,就会降低甚至失去研究的价值。
(4)“统”,即统一性,指调查数据资料必须统一。主要指调查指标解释、计量单位、计算公式的统一。检查各项调查资料是否按规定要求收集、是否能够说明问题、对所研究的问题是否起应有的作用。在较大规模的调查中,对于需要相互比较的材料更要审查其所涉及的事实是不是具有可比性。如果调查数据资料没有统一标准,就无法进行比较研究。
(5)“简”,即简明性,指调查数据资料必须简明,不能庞杂无序。经过整理所得的调查数据资料,要尽可能简单、明确,并使之系统化、条理化,以集中的方式反映调查对象总的情况。如果整理后的调查数据资料仍然臃肿、庞杂,使人难以形成完整的概念,那么,就会给以后研究工作增加许多困难。
(6)“新”,即新颖性,指调查数据资料应尽可能的新颖。在调查数据整理资料时,要尽可能从新的角度来审视调查数据资料、组合调查数据资料,尽量避免按照陈旧的思路考虑问题,更不能简单重复别人的老路。只有从调查数据资料的新组合中发现新情况、新问题,才能为创造性研究打下良好基础。需要强调的是:在整理调查数据资料时要首先做到真实、准确、完整、统一、简明,而后才是新颖。
(三)资料整理的基本程序
资料整理应当有目的有计划地进行,其应遵循的一般程序是:
(1)设计整理方案。制定整理方案,是保证资料整理有目的有计划进行的首要步骤。由于资料整理是在社会调查设计与实施的基础上进行的,同时又直接为资料的统计分析服务,因此,制定整理方案时,一方面必须与社会调查方案相适应,使整理方案有完全实现的可能;另一方面也必须与统计分析任务相适应,使资料整理结果能够满足统计分析的要求。资料整理方案的主要内容包括:根据研究目的,确定对调查中所搜集资料的哪些内容进行整理;确定如何进行资料分组;选择整理组织形式与方法;采用哪些汇总指标以及统计资料如何表现等。
(2)审核原始资料。在资料汇总之前,必须对调查得来的原始资料进行一次认真、细致、全面的审查和核定,重点检查调查资料的真实性、准确性和完整性。
准确性审核主要是检查原始资料是否真实可靠,数据计算是否正确。审核方法主要有逻辑审核与计算审核两种。逻辑审核主要是核查调查资料的内容是否合乎逻辑和常识,调查项目之间有无自相矛盾的地方,或不符合实际的地方。例如人口调查,某人年龄填报“9岁”,婚姻状况却为“已婚”,职业为“大学教师”,显然有误。计算审核主要是检查调查表中各项数据在计算方法、计量单位、计算结果上有无差错等。例如,部分数字之和是否与总体数字相符,各部分与总体之百分比相加是否等于1,各份问卷上填写的数字单位是否一致,等等。
完整性审核主要是检查应该调查的单位、项目是否都调查到了,问卷的回收率以及有效问卷是否达到要求,问卷或调查表上的所有问题是否都按要求填写了,等等。如果资料残缺不全,就会降低甚至失去社会调查的价值。
审核过程中如发现问题和错误,应分别情况及时进行纠正或处理。或根据实际进行修正,或遇疑问作补充调查,或坚决剔除无法补正的部分,以保证调查资料的真实性、准确性和完整性,确保资料整理的质量。
事实上,为确保资料的质量,资料审核在社会调查开始不久就应进行,如调查实施过程中的实地审核和调查资料收回时的搜集审核。资料汇总前的审核只是一次全面、系统、集中的审核。
(3)进行资料分组。资料分组是资料整理的关键。它是根据社会调查的目的和任务,按照整理方案中所选择的分组标志,对原始资料进行统计分组,为资料的统计分析作准备。
(4)实施资料汇总。资料汇总是资料整理工作的中心环节。它是按照一定的组织形式和方法,在资料分组的基础上实施的。资料汇总的组织形式有逐级汇总、集中汇总和综合汇总。逐级汇总是自下而上一级一级地汇总。其优点是能够满足各地区、各部门、各单位对统计资料的需要,便于就地审核和订正原始资料。缺点是逐级汇总费时较多,发生登记性误差的可能性较大。集中汇总就是把调查资料集中起来进行一次性的汇总。集中汇总可以缩短汇总时间,减少汇总差错,且有利于采用计算机汇总,但原始资料如有差错不能就地更正,汇总结果常常不能及时满足各地、各部门的需要。综合汇总是将逐级汇总和集中汇总结合起来的一种组织形式。即将各级都需要的基本资料实行逐级汇总,对需要在全国范围内进行加工的资料或者本系统的全面资料实行集中汇总。综合汇总具有逐级汇总和集中汇总的优点,同时又克服了两者的缺点,但它开支大。究竟使用哪种汇总的组织形式,要视具体条件而定。资料汇总的结果,需要以统计表或统计图的形式表现出来,简明扼要、形象直观地表达现象的总体特征。统计表和统计图既是资料整理的表现形式,也是进行统计分析的重要工具。
二、资料的审核
(一)审核的概念
审核即指在着手整理调查资料之前,对原始资料进行审查与核实的工作过程,目的在于保证资料的客观性、准确性和完整性,为下一阶段进行资料整理打下坚实的基础。在调查收集资料之后,为了保证资料整理和汇总的有效性,必须对资料进行严格的审核。倘若原始资料中有错误,整理、汇总、加工之后,就不易被发现和修正,从而可能导致错误的研究分析结论,失去调查研究的科学性。实际上资料的收集和资料的整理在大多数情况下是同步进行的,本书分开阐述。审核工作和收集工作同步进行,边收集边审核,通常叫作实地审核或收集审核;在收集资料之后集中时间进行审核,则叫作系统审核。对重要资料进行反复的多种形式的审核,则叫作多次审核。
(二)资料审核的基本原则
资料审核的基本原则,主要有如下四条:
(1)真实性原则。对所收集到的资料要根据实践经验和基本常识进行辨别,看其是否真实可靠地反映了调查对象的客观情况。一旦发现有疑问,就要及时根据事实进行核实,排除其中的虚假成分,保证资料的真实性。
(2)标准性原则。在较大规模的调查中,对于需要相互进行比较的材料,要进行审核其所涉及的事实是不是具有可比性。对于统计资料,则更要注意指标的定义是否一致、计量单位是否相同,等等。
(3)准确性原则。要对资料进行逻辑检查,检查调查得来的资料中有无不合理和相互矛盾的地方。例如,某调查对象的年龄栏内填写的是33岁,而结婚时间长短栏内填写的是25年,这显然是不合逻辑的,对于这类资料要认真审核处理。对收集到的各种统计图表应重新计算、复核,利用历史资料更要审查文献本身的可靠性程度。
(4)完整性原则。要检查调查资料是不是按照调查研究方案的要求搜集齐全。如果资料残缺不全,将会影响调查研究的目标的实现。
(三)资料审核的主要类型
关于类型的划分,关键在于把握好分类的标准。基于不同的划分标准,资料整理常见的类型主要有:
(1)按照资料审核的方法,可将其分为平衡审核与逻辑审核。所谓平衡审核就是将各种资料的计算口径予以平衡、一致;逻辑审核重点审核调查表格填写是否完整,有无逻辑性差错,计量单位是否准确,并在此基础上对各种资料进行理论分析,以求内容上合理性,针对某些现有的综合表中升降幅度变化比较大的要查明原因并写出说明,等等。
(2)按照将要进行审核的资料的属性,可将其分为对实地调查资料的审核与对文献资料的审核。实地调查资料的审核主要包括:对实地调查过程中所收集到的资料有效性的验证;对资料准确性的验证;对资料完整性的验证。而对文献资料的审核则主要包括:对所收集到的文献本身的真实性进行审核,以及对文献内容的可靠性进行审核。
三、资料的分组
(一)资料分组的概念
所谓资料分组,也称统计分组。它是根据社会调查的目的和要求,按照一定的标志,将调查总体划分为若干组的一种资料整理方法。资料分组具有两方面的含义:从现象总体角度看,它是“分”的过程,是将现象总体中的各个单位划分为若干性质不同的组成部分;从现象个体角度看,它又是“合”的过程,是把现象总体中性质相同的单位组合成一组。资料分组的要求是,通过分组应起到“组内同质、组间异质”的效果。
资料分组在调查资料整理中占有重要地位。只有将调查总体进行科学的分组,才能对调查资料进行科学的加工和分析,得出研究现象正确的结论,从而准确、深刻地认识事物的本质特征。列宁曾指出,由于分类的方法不同,同一个材料竟得出完全相反的结论。因此,资料分组是资料整理的关键,它关系到整个社会调查研究工作的成败。
(二)资料分组的意义与作用
(1)通过对资料进行分组可以区分社会现象的不同类型。社会现象存在着复杂多样的类型,它们在发展变化过程中所表现出来的特征各不相同。资料分组,就是对现象的不同类型加以划定,从而运用各种统计方法对其进行分析说明。例如,将人口按职业、经济收入、受教育程度进行不同的分组,有助于对人口的社会经济问题进行分门别类的、深入细致的研究。
(2)通过对资料进行分组可以说明社会现象的内部结构。社会现象的总体是由许多部分构成的,各部分的性质不仅互异,而且在总体中所占的比重也不一样,将被研究的社会现象总体按照某一标志区分为各部分,并计算出各组在总体中的比重,就可以进一步研究总体的构成情况,表明总体的内部结构及其发展变化情况。例如,以不同的文化程度来反映某地区社会工作者的构成情况,以不同的家庭消费支出来反映某地区农民在衣、食、住、行、用的开支及变化情况,等等。现象的内部结构反映了现象的性质,计算现象内部结构的构成比例,可以看出各构成部分所占比重是否合理,分析现象内部结构在时间上的变动情况,可以看出事物的变化过程及其发展趋势。
(3)通过对资料进行分组,可以初步分析现象之间的依存关系。一切社会现象都是处于相互联系、相互依存之中,并且表现出一定的数量关系。通过资料分组就可以从数量上反映现象之间的依存关系。例如,了解到居民家庭的人均月收入与月消费支出,通过分组就可以显示出两现象之间存在着依存关系。如表121所示:
 
 表121某高校学生在校月平均消费支出与其家庭月人均收入
 
 
 
按学生家庭人均月收入分组(元/人) 学生人数(人)人均每月消费支出(元/人)
1 000 以下80456
1 000~ 1 500 142635
1 500~2 000258889
2 000以上861 274
从表121可以看出,某高校的学生人均每月消费支出与其家庭人均月收入之间存在依存关系。家庭人均月收入越高,其人均月消费支出也就越高;反之亦然。
(三)资料分组标志的选择
对于调查资料进行分组的关键在于分组标志的选择。所谓标志,是指反映调查单位属性和特征的名称。它有品质标志和数量标志之分。品质标志是反映调查单位属性的名称,数量标志则是说明调查单位数量特征的标志。如进行残疾人生活状况调查时,残疾人的性别、婚姻状况、文化程度都属于品质标志,它只能用文字语言表示;残疾人的年龄、家庭人口、工资收入都是数量标志,它可用数值表示。
分组标志是资料分组的依据。分组标志选择得是否恰当,直接影响到资料分组的作用和效果。因此,选择分组标志应遵循以下原则:
(1)根据社会调查目的选择分组标志。调查研究对象往往具有众多特征,如何从这些特征中选择作为分组依据的标志,应根据社会调查目的和任务来确定。例如,老年人具有年龄、性别、文化程度、民族、职业、经济收入、生活费用支出等特征。如要了解老年人的生活状况,可以选择经济收入、月生活费用作为分组标志,而要分析老年人对待火葬的态度,则应选择年龄、文化程度作为分组标志。
(2)选择能够反映现象本质特征的标志。在研究对象的诸多标志中,有的标志是主要的、本质的;有的则是次要的、非本质的。只有选择了主要的、本质的标志作为分组标志,才能达到反映现象本质或主要特征的目的。例如,研究居民生活水平状况,可以按民族这一标志对居民分组,也可按城乡地区这一标志对居民分组,从现实情况来看,按城乡分组比按民族分组更能反映所研究问题的本质。又如,分析老年人对养老服务方式的态度,若以老年人的经济条件、身体状况作为分组的标志,更能揭示出老年人对养老服务方式的不同态度的主要原因。
(3)考虑现象所处的具体时空条件。社会现象会随着时间、地点、条件的变化而发生变化。同一分组标志,在某一时期、地点适用,在另一时期、地点就不一定适用。因此,应针对各种具体情况进行具体分析。例如,解放初期研究农村经济政策时,按阶级成分分组是基本的分组,而研究当前农村经济问题,选择生产水平、经济收入为分组标志比较恰当。
(四)资料分组的主要类型
关于调查资料分组的类型,可以从不同角度、按照不同标准进行划分:
(1)按分组标志性质的不同划分,可分为按照品质标志分组与按照数量标志分组两种基本类型。
按品质标志分组,就是按反映事物属性或质的特征的品质标志进行的分组。如老年人按婚姻状况、户居方式、受教育水平分组;流浪儿童按外流原因、外流生活来源、流出地分组等。这种分组能直接反映事物性质的不同,给人以具体明确的概念。按品质标志分组有的比较简单,如上面所举之例均如此,它们随着分组标志的确定,组别也就基本确定了;有的则比较复杂,如对人口职业分类就比较复杂,其类别繁多,且各组界限很难划定。对于比较复杂的重要品质标志的分组,国家往往编有标准的分类目录,以统一全国的分组口径。
按数量标志分组,就是按事物的数量特征进行分组。如分析贫困问题将贫困户按家庭人口分组,了解职工生活按经济收入分组,研究地区的社会保险按参保企业个数分组,等等。按数量标志分组,必须以分组结果能够反映被研究现象的不同类型和性质差异为前提。
(2)按分组标志数量的多少划分,则可分为简单分组与复合分组两种基本类型。
简单分组就是对研究对象只按一个标志进行的分组。如农村居民按家庭人均收入分组,妇女按初婚年龄分组,职工按性别分组等。它们分别只能从一个角度说明现象的分布状况和内部构成。对于同一总体采用两个或两个以上的标志进行简单分组,形成平行分组体系。在平行分组体系中,各简单分组的分组标志是平等的关系,无主次之分。
复合分组就是对所研究对象选择两个或以上的标志进行层叠分组。即先按一个标志分组,然后,再对每一个组别按另一个标志作进一步分组。例如对某高校的某系按专业和年级进行复合分组。
 
表122对某高校的某系按专业和年级进行复合分组表
 
 
 
按专业分组按照年级分组
社会工作专业06级
07级08级
 
09级
 
市场营销专业06级
07级
08级
09级
由表122可见,复合分组比简单分组能更深入地说明问题。但在分组时,应根据分析的要求,确定分组标志的主次顺序,主要标志在先,次要标志在后。另外,分组标志不宜过多,以防组数太多而显得内容繁杂,不利于说明问题。
四、资料的汇总
资料的整理分类既是一个分析过程,又是一个归纳过程,一旦分类和分组的标志制定下来,下阶段的工作就是要将资料进行归类,本书将之称为资料汇总。分组资料的汇总技术有手工汇总和电子计算机汇总两种。
(一)手工汇总
1.划记法即指是用点线符号(如“正”字)计算各组的单位数的方法。此方法简便易行,但只能汇总总体调查单位数,不能汇总标志值。一般在调查单位资料不多的情况下采用。
2.过录法即指将调查资料先过录到事先设计好的汇总表中,并计算加总,然后再将其结果填入正式的统计汇总表中。此方法汇总的内容较全面,也便于校对检查,但工作量大,费时费力。
3.折叠法即指将所有调查表中需要汇总的项目和数值折在边上,一张一张的叠在一起进行汇总计算。此方法不需过录,简便易行,适用于对标志值的汇总。但汇总需细致,否则,发现差错无法查明原因,只能从头返工。
4.卡片法即指将每个调查单位需要汇总的项目和数字摘录在特制的卡片上,再根据卡片分组归类和汇总计算。此方法比划记法、过录法、折叠法的质量要高,适用于调查资料多、统计分组细的情况。卡片法的操作步骤:首先是编号,将所选择的分组标志进行分组,然后依组序编号,并在调查表的有关项目下注上组号,每个调查单位也编号,以便核对;其次是制作卡片;再次是摘录,把每个调查单位的组号和汇总项目的实际数值摘录在卡片上;最后是分组计数,根据分组要求,对卡片资料加以汇总计数,卡片数即是调查单位数。
(二)计算机汇总
计算机汇总是资料汇总技术的新发展,是资料整理现代化的重要标志。在进行大规模的社会调查搜集资料的情况下,手工汇总既费时费力,又容易出差错。而计算机汇总优点显著:速度快,精度高,汇总量大,具有逻辑运算、自动工作和储存资料的功能。目前在我国计算机汇总已得到广泛应用。其汇总步骤大致可以分成四个阶段:编码、登录、录入和程序编制,其中编制程序是一个重要环节,它是按照计算机语言对汇总工作进行全面系统的安排。一般在统计工作中有已编好程序的软件可供选用。
1.编码即指将调查问卷中的信息数字化,转换成统计软件或统计程序能够识别的数字信息,这些工作是一种信息代换的过程。编码工作中主要是建立编码手册,编码手册记录着每一个数字所表示的实际意义。调查者要根据它将问卷调查所获得的资料转成能够统计、计算的数字,输入计算机,然后再根据它将计算机整理出来的结果转换成研究者能阅读的文字。
2.登录即将编好码的问卷资料过录到资料卡片上去,以便将它们输入到计算机。登录是一项比较简单的工作,但也需要工作者有高度的责任心感,耐心细致,确保资料转换不出差错。
3.录入即指将登录在资料卡片上的数据录入到计算机的存储设备上,在工作性质上与登录相近,所不同的是登录的操作是在资料卡片上进行,录入时在计算机的终端上进行。一般来说,在完成这项工作后,原始资料就可以束之高阁了。只要有编码手册、资料卡片或电脑磁盘就能再现原始资料。通过计算机保存资料,一方面大大节省了保存的空间,另一方面还可以将资料随时复制、计算,大大提高了资料利用和分析的方便程度。
4.编程即指编制一种可以输入计算机、指挥计算机按照要求整理资料的指令。现在通常这项工作已经由软件工作者做好了,研究者往往只需会使用软件包就可以了。整理资料的程序比较简单,又是统计分析的基础,目前可以使用的软件很多,一般到互联网上下载即可。最常用的是SPSS统计软件包,它已经解决了中文统计表格的输出问题,用起来很方便。
五、统计表图
经历了对资料的审核、整理、汇总之后,最后通常以统计表、统计图的形式出现,以便于后续的统计分析需要。
(一)统计表
(1)统计表的意义。统计表是用表格显示统计资料的一种基本形式。广义的统计表包括统计工作各个阶段的一切表格,如调查表、汇总表、整理表与分析表。本节所讲的统计表是狭义的,介绍的主要是显示资料整理结果所用的统计表。它既表明前述资料整理工作的终结,又是后续资料分析工作的开始。统计表的主要作用表现在以下几个方面:
首先,统计表把大量的统计资料有条理地组织与安排,使资料系统清晰,直观易懂,让人一目了然;
其次,统计表内的数字组织科学,排列有序,因而便于统计资料的比较对照;
最后,统计表是分析研究各指标之间的数量关系,进行统计分析的有效工具。
(2)统计表的结构。统计表的结构有形式结构和内容结构之分。形式结构一般由总标题、横行标题、纵栏标题、指标数值四部分构成。内容结构由主词、宾词组成。如表123所示:
表123我国2000年人口统计资料总标题
 
 
总人口性别绝对数/万人比重/%纵栏
标题
 
横栏
标题男65 35551.63女61 22848.37
合计129 533100.00指标
数值
↓
 
主词栏宾词栏
统计表的形式结构通常包括:总标题、横行标题、纵栏标题、指标数值等组成部分。总标题,即表的名称,用以概括说明全表内容,置于表的上端正中位置;横行标题,即横行的名称,通常用来表述表内各组的内容,一般写在表的左边;纵栏标题,即纵栏的名称,通常用来表述总体各组的统计指标名称,一般写在表的右上方;指标数值,即用来说明总体特征的各种综合指标值,填写在横行标题和纵栏标题相对应的空白处。
除了形式结构之外,统计表的内容结构则包括主词与宾词两大主要构成部分。主词,即指统计表所要说明的总体或总体的各个组,通常写在表的左边;宾词则指用来说明主词的一系列统计指标的名称和数值,通常写在表的右边。主词、宾词按通常位置排列,有时会使统计表的表式过分狭长或过于扁大,此时可将主词宾词合并排列或互换位置排列(如上表所示)。除了上述必备要素外,有些统计表根据情况的需要,还需增列补充资料、注解、附记、资料来源、填表单位、填表人及填表日期。
(3)统计表的基本类型。根据统计表的复杂程度,通常可以分为简单表、简单分组表以及复杂分组表。
其一,简单表,即指主词未作任何分组的统计表。它包含三种情况:主词按时间顺序排列的统计表;主词只列出调查单位名称的统计表;主词由地区、国家、城市等目录组成的区域表。如下面两个图表所示。这种表可用来反映调查单位的基本情况,也可用来分析现象发展变化的趋势。
 
表12 4中国老年抚养比的变化趋势(1995—2050年)
 
 
 
年份老年抚养比
199514.79
200015.60
200516.02
201017.62
201521.27
202023.77
年份老年抚养比
202529.46
203036.54
203541.45
204042.70
204544.46
205048.49
资料来源:杜鹏.中国人口老龄化过程研究.北京:中国人民大学出版社,1994:96.
 
表12 5日本、韩国和印尼老年人就业结构
 
 
 
产业日本(1990年)韩国(1980年)印尼(1971年)
第一产业33.384.476.0
第二产业19.53.06.2
第三产业47.212.515.9
资料来源:亚太经社理事会等.亚太人口老龄化,联合国.1996:23.纽约ST/ESCAP/1594.
其二,简单分组表,即指主词只按一个标志分组形成的统计表。利用简单分组表可以分析不同类型现象的特征、内部结构和现象之间的相互依存关系。
其三,复合分组表,即指复合分组表是指主词进行复合分组所形成的统计表。如表126所示。
 
表12 6某系2009年下学期某高校在校学生人数构成
 
 
 
按专业、性别分组人数
/人比重
/%
合计人数/人比重/%
市场营销男75630.4女69828.01 45458.4社会工作男34513.9女28911.663425.5国际贸易男1947.8女2078.340116.1
合计2 489100.02 489100.0
复合分组表由于是将几个标志结合起来进行分组,故能更深入地显示社会现象的特征和规律。
(4)统计表的宾词设计。其一,简单设计,通常就是将宾词指标名称作平行排列的一种设计。如表127所示。
 
表127某地区志愿者组织志愿服务人员性别和文化程度(简单设计)
 
 
 
志愿者
组织名称性别文化程度男女小计小学
及以下中学大专
及以上小计合计
 (甲)(1)(2)(3)(4)(5)(6)(7)(8)
甲组织
乙组织
丙组织
 合计
其二,复合设计,即指将宾词有关指标作重叠排列的一种设计。与简单设计相比,复合设计能更全面、细致、深入地说明研究对象的数量特征。如表128所示:
 
 表128某地区强制戒毒所2003年戒毒人员性别和文化程度(复合设计)
 
 
 
 志愿者
 
组织名称小学中学大专全部志愿服务人员
男女小计男女小计男女小计男女合计
 
 (甲)(1)(2) (3)(4)(5)(6)(7)(8)(9)(10)(11) (12)
甲组织
乙组织
丙组织
 合计
宾词指标是采用简单设计还是复合设计,应根据统计研究的目的来确定。但在复合设计中应尽量防止分组过多过细。否则,不仅增加汇总工作量,还有可能使统计表失去一目了然的作用。
(5)统计表的编制规则。为使统计表能更清晰地反映所研究现象的数量特征,便于分析比较,在编制统计表时应遵守下列各项规则:统计表的标题应简明确切,总标题要能概括表的基本内容,并表明资料所属的地区和时间;统计表中主词各行和宾词各栏的次序排列应当合理有序,一般应按先局部后总体的顺序排列,但当各部分栏不需要全部列出时,可以把合计栏或总计栏排在最前面;如果统计表栏数较多,为了更清晰地表明各栏之间的计算关系和便于进行文字说明,可在主词栏用甲、乙、丙、丁等文字标明,在宾词指标各栏用数字编号;统计表中的数字应注明计量单位,当全表只有一种计量单位时,可将单位写在表头的右上方。如果表中需要分别注明不同的计量单位时,横行的计量单位可以专设一栏;纵栏的计量单位可标在纵栏标题的右边或下方;统计表的表式,一般为“开口式”,即表的左右两端不划纵线。上下基线用粗横线封闭。
另外,统计表表中数字应排列整齐,对准位数如有相同的数字要全部照写,不能写“同上”“同左”“同右”等字样。当客观不存在数字时,应划“—”符号表示;缺乏某项资料时用符号“…”标示,数字为0时,要填0;表明不是漏填。总之,统计表中的数字部分不应留下空白,以免使人误以为漏填。必要时,统计表应加说明和注解。说明和注解一般写在表的下端。
(二)统计图
在整理数据时,常常会制作一些简单的统计图来说明调查资料的汇总结果。
 
 
 
图121某小学各年级学生人数统计图
 
所谓统计图就是用图形来表示变量的分布。所以又叫分布图。
与统计表相比,统计图虽然不如它精确,但却更直观、生动、醒目。常用的统计图有条形图、圆瓣图和折线图三种。
(1)条形图。又称为矩形图或长条图或直条图,它是以宽度相等、条形的长短或高低来表示不同的统计数字。可以用来反映事物的大小、内部结构或动态变化等情况等,应用范围十分广泛。分为单式图和复合图:
从图121中,可以十分清楚地看到调查对象中不同年级总人数的分布情况,形象鲜明。这种条形图只有一组对象,各年级的学生数,故称为单式条形图。如果把两组或两组以上的对象的条形图并列在一起,共同构成一个条形图,由既可以进行每组中条形间的比较,又可以对各组的同类条形进行比较。这种条形图称为复合条形图。如图122:
 
 
 
图122浙江省2008年各地财政收入情况统计图
(2)圆形图。圆形统计图是用整个圆表示总数,用圆内各个扇形的大小表示各部分数量占总数的百分数。通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系。由于一个圆的圆心角度数为360°,用360乘以每一部分所占有的百分比,即可得出该部分的圆心角度数,再在圆中按这些角度画出各个部分所占的百分比,即可得出该部分的圆心角度数,再在圆中按这些角度画出各个不同的扇形。
 
①圆心图特点
能清楚地反映出各部分数同总数之间的关系与比例,通过扇形的大小来反映各个部分占总体的百分之几。
如果要更清楚的了解个部分数量同总数之间的关系,可以用扇形统计图。扇形统计图可以让一些杂乱无章的数据变得清晰透彻,使人看上去一目了然,便于观察,利于计算各种数据,变得更加方便、快捷。
②制作圆心图注意事项
由于圆形统计图中各个百分比的和为100%,所以数据统计时,不能有交叉,也不能有遗漏,一定要保证使每个数据都能且只能在“一个”范围内.若统计方法不准确,先做适当的调整,再计算百分比与圆心角度数。
 
 
 
图1232010年5月来港游客情况统计图(总人数420 000人)
 
 
圆形统计图中,各百分比的和应该是100%,而圆心角的度数和应为360°。有时各部分百分比的和为99.9%,是由于取近似值所致,但它也一定程度体现了数据的准确性。
 
图12 4中国代表团历届奥运会金牌获奖情况统计图
计算百分比,是为了用“百分比×360°”得到圆心角度数,若百分比取近似值,那么后来得到的圆心角度数也是近似的,为了更准确地得到圆心角度数,可用“圆心角度数=百分比×360°”直接计算,减少误差。
 
③用Excel软件制作圆形统计图
打开Excel软件—输入数据—选中产生图表的数据区域—点击“插入”—“图表”—选择“饼图” —在右边选择你需要的种类—选择数据—确定。
(3)折线图。折线图又称为曲线图,它是通过上下变化的线段来反映所研究现象随时间变化的过程和发展趋势的图形。
从图中可以十分清楚地看出我国在奥运会上所得金牌数量的变化趋势。
【案例引入】
 
2002年12月3日22点16分,从摩纳哥蒙特卡洛举行的国际展览大会上传来了振奋人心的消息——中国当选为2010年世博会的东道主!选举的方式是由国际展览局89个成员国的代表以无记名方式进行投票。
在首轮投票中,中国以36票居第一,韩国28票,俄罗斯12票,墨西哥6票,波兰被淘汰。
在第二轮投票中,中国获38票,韩国34票,俄罗斯10票,墨西哥遭淘汰。
在第三轮投票中,中国获44票,韩国32票,俄罗斯被淘汰。
在最后一轮投票中,中国以54票胜出。
以首轮投票为例,制作成圆形统计图如下:
 
 
拓展阅读1
 
对资料的审核示例
 
一、对观察法所收集到的资料的审核
观察法是活的直观认识较好的方法,通过观察收集而获得的资料往往能够较大程度的排除人为因素所带来的不真实成分。但是,由于调查人员的介入,被调查对象往往可能作出各种假象掩示事实的本来面目,产生社会研究中的“测不准效应”。因此,研究者有必要对观察所得资料进行审核。
(一)要检查观察所得资料是否严格按照调研方案的要求所获得的。一个好的观察资料既要记下调研方案中所规定的调查内容,又要记下那些看到的但暂时尚不能归类的事实,而不是看就什么就记什么的随意记载。
(二)如果资料能有多种方法收集,则应把通过观察法所获得的资料和通过其他方法收集到的资料进行比较,发现问题及时去调查、核实。比如调查员在某个高校看到学生学习风气很好,而座谈会的时候,该高校的师生普遍反映并非如此,那么,调查人员就应该重新去核实。
(三)当观察是以小组为单位进行时,调查人员要随时将获得的情况与同小组其他调查成员所获得的情况进行比较。因为每个人所观察的客体在理解上会有差异,如果对观察结果进行比较,则可能得出比较正确的意见和评价。所以,特别是当对同一个观察客体所获取的资料有较大差异时,更应组织调查人员进行讨论和验证。
(四)对于较重要的问题要注意调查时间的长短。因为在较长时间的调查中,调查者可排除某些人为的虚假成分,同时还可观察到短期内调查者所观察不到的事宜。
二、对利用问卷调查所获得的资料的审核
问卷法通常被认为是社会调查研究中最为典型、也是最有效的资料收集方法,但问卷法所收集到的资料也并非就完全准确、有效,因此也必须对其进行审核。对于问卷法所收集到资料进行审核的基本操作如下:
(一)审核资料的完整性,仔细阅读问卷,看问卷中所有该填写的项目是否都填写了,假如有漏填的项目,最好请调查对象及时补充填写。
(二)审核资料的逻辑性,正如前文所言,某人的年龄栏里填33岁,而结婚时间长短栏中则填写25年。倘若发现类似的问题,则需要研究者在资料审核过程中根据相关内容作出判断并进行纠正。
(三)通过检查问卷所设置的控制性问题来判断回答的可靠性。比如,针对某高校学生课外阅读状况的调查问卷中,可以设置这样的问题:“请问您读过这本书吗?”其实所列出的书名是尚未公开出版过的。如果被调查者回答“读过”,那么其余问题的回答是否真实可靠,就值得去验证了。这样的问卷所收集到的资料可能是虚假的,通过审核,这样的问卷基本应该当作废卷,不纳入后续的汇总、统计、分析范围。
三、对书面文献资料的审核方法示例
文献研究法作为一种重要的资料收集方法,在整个调查研究中起着重要作用。文献是指用文字形式叙述的资料,主要指档案、报刊文章、个人日记、书信等。当调查者发现适合自己研究的文献材料时,先要确定文献的可靠性,否则,再好的材料也不能利用。所以,必须审核文献资料。
(一)审核文献的作者、出版者的背景,因为他们的政治背景及态度对文献是有影响的。有时可能会出现有意的“错误”,即作者在编撰文献时,可能隐瞒或歪曲事实。一般建议使用引用率比较高的文献更好。
(二)审核文献编制的时间,尤其是对于那些记叙性的文献,必须将文献编制的时间和文献中所描述的事件的时间加以对照。
(三)当研究人员参考的是财政等文献时,在审核过程中则特别需要留心伪造的文献,比如说某些企业的财务文献,可能由于各种原因在某些方面出现伪造的现象。必要的时候,在资料审核过程,调查人员需要想该领域的专家请教,他们可能有一套专门鉴定文献的方法和技术。
拓展阅读2
一个资料整理的实例
本书结合笔者曾经所做一项关于我国志愿者队伍建设状况的课题研究的例子,来说明资料汇总的操作技术。
本课题为了了解当前我国志愿者队伍建设及志愿者的相关状况,曾在湖南、湖北、广东及四川等地区进行了问卷调查,以收集相关资料。下面,摘选该问卷中的部分,作为示例。
1.姓名
2.年龄
3.专业特长
4.请问您的月收入是
 
a.800元以下
 
b.800~1 200元
 
c.1 200~1 600元
 
d.1 600元以上
5.您的文化程度是
 
a.中学及以下
 
b.大专
 
c.大学本科
 
d.研究生及以上
本课题调查问卷同提出了55个问题,收集了400份问卷资料,用手工整理资料的话工作量太大,而且难免会出差错,所以采用计算机进行资料整理。
(一)编码
上面摘选出的问卷中的五个问题,可以分为两类:第1、2、3题是开放式问题,第4、5题是封闭式问题。开放性问题需要先解决划分类别的问题。其步骤是先将答案通读一遍,然后进行概括、归纳,要注意穷尽性和互斥性原则。比如说专业特长这个问题,通读所以问卷的问答后归纳出了12个类别,145种特长,那么就用数码的前两位代表类别,后一位代表类别中的不同特长。如果规定文学类别编码是00,其中汉语文学的编码是001,外国文学是003,还可以规定活动方案策划是045,书画是065,等等,封闭式问题的分类是在调查之前就编制好的,所以只要指派具体的数字即可。下表就是本课题调查编码手册的一部分。
 
编码手册示例片段
 
 
 
格问题号码项目名称内容说明
1~31姓名问卷回答者姓名编号
4~52年龄问卷回答者年龄
6~83专业特长专业特长详见附表
94月收入1.800元以下
2.800~1 200元
3.1 200~1 600元
4.1 600元以上
105文化程度1.中学及以下
2.大专
3.大学本科
4.研究生及以上
在上表中,可以看出编码手册包含了4个项目。
1.资料卡片上的列数(即格)。如第1~3格,意味着资料卡片上的每一个个案的第1~3列的记录是被调查的姓名编码。第1~3列是3位数,它的编码可以从001~999,就是说可以记载999个调查个案的情况。课题调查中的问卷调查对象总共有400人,所以留3个格是绰绰有余的。如果课题调查对象有1 000人,那么就要预留4个格。留格的多少要考虑每一类别有多少子项,不超过9个一般留1格;10~99个一般留2格;以此类推。第4、5道题,每个问题的回答都只有4个选择,小于9,所以留1格就够了。
2.问题号码。编码手册上的问题号码和问卷上的题号是一致的。有了这个号码,就可以清楚地知道资料卡片的某几类资料是关于调查问卷中的哪一个问题的。
3.项目名称。这是指问卷中所要调查的问题或项目是什么,有的教科书将之称为变量。
4.编码的内容说明。即指某个问题或项目中的各个数字的具体含义。比如,编码手册的第5个问题,它规定了第5个问题调查文化程度,在资料卡片上它占10列,变量值1代表中学及以下,变量值2代表大专,变量值3代表大学本科,变量值4代表研究生及以上。如果我们在资料卡片的第一行读到这样的数字0013404543,这时我们可以根据编码手册转译过来,即第001号被调查者,年龄34岁,专业特长是活动方案策划,月收入1 600以上,文化程度是大学本科。反过来,我们也可以将这段文字内容转换为数字符号,那就是0013404543。编码手册的作用就是规定了资料卡片上每个位置上每个数字的实际意义。
在编码过程中,还要考虑到赋予问卷中问题无回答或不知道回答的情况以一个数码。给无回答答案的编码最常用的是0,对需要不止一个格的可以重复所给的数字(如00或000),给“不知道”答案的编码常为9或99、999。对大多数问题上述方法是可行的,因为指派数字往往从1开始,又很难超过9,所以让“无回答”为0,“不知道”为9很方便,但对少数问题,0和9两者均可能是被回答的问题本身所需要的数字(如家庭中子女的数目),在这种情况下:“无回答”和“不知道”的编码必须是在经验上绝对不会出现的数字(例如99,98;因为子女数目绝对不会有这么多)。这样往往在编码时要多增加1个格,如问家庭的子女数目,要占两格。如果回答有3个孩子, 在登录时要写03(高位空格补0);“无回答”的编码为99,“不知道”编码为98。
(二)根据编码手册将问卷或调查表上的资料数字化,再过录到资料卡片上去
首先将每张问卷上的调查资料根据编码手册的指南转换成数字并填写在问卷右侧的短线上,然后就可过录到登录卡(资料卡片)上。在过录工作中我们可以培训一些编码员进行逐份编码和过录工作,这样可以加快工作速度。对编码员的要求是有一定的文化水平,细致耐心。培训工作有半天时间就可以完成,因为他们的工作基本上是一一对应,对号入座,并不复杂,关键在于细致耐心,不出差错。
(三)将登录在资料卡片上的资料输入到计算机
便于使用计算机对于调查资料的识别与运算,研究者需要将登录卡上的数据敲入计算机。在这一阶段,特别要求录入者注意力一定要高度集中,严防跳行、漏读、按错数键所产生的错误。随着计算机技术的发展,数据录入后可以利用计算机来查错、纠错。查错的程序有两种:第一种是检查输入信息的有效性,即对数码进行幅度检查。幅度检查的方法主要是检查资料的子项是否都在规定的幅度范围内。例如,关于性别的调查项目答案只有两个:男、女,如果男=1,女=2,那么这个项目的答案幅度是1、2,不可能有3、4等数码。幅度检查就是要把那些超越幅度的错误找出来。第二种是检索输入信息相互之间的一致性,即对数码进行逻辑检查。逻辑检查主要是检查同一份问卷中,不同问题的答案是否项目矛盾,例如问卷的第4题是询问年龄,年龄的编码是这样的:1~13岁=1;14~25岁=2;26~40岁=3;…。第6题是询问婚姻状况:已婚=1,未婚=2。假如第4题的答案是1,那么第6题的答案应该是2,如果是1的话,那么,不是第4题就是第6题的答案错了。逻辑检查可以找出答案的逻辑矛盾。
(四)向计算机发布指令,通过计算机来整理资料
当资料全部录入计算机磁盘之后,倘若计算机事先安装有SPSS统计分析软件包,则只需调动一个指令,就可以开始整理资料了。例如:我们想整理前面表格中的第五个问题,只需输入:“频数   变量=V5,几秒钟后,计算机屏幕就会显示出:
 
 
变量值频数百分比/%累计百分比/%
17518.7518.75
214536.2555.00
312731.7586.75
45313.25100.00
合计400100.00—
研究者根据这个表格所输出的结果打印出来,再根据编码手册,转译一下,就可以得出下表:
 
参与志愿服务者的文化程度情况
 
 
文化程度人数百分比/%累计百分比/%
中学及以下7518.7518.75
大专14536.2555.00
大学本科12731.7586.75
研究生及以上5313.25100.00
合计400100.00—
当然,如果计算机暂时没有SPSS软件,就需要研究者要么先按照相关适用的软件,要么自己或求助于软件工作者来设计一个整理汇总的程序。
以上是一个整理问卷资料的完整过程。 因为问卷法取得的资料是大量的,所以必须使用电子计算机才能迅速、准确地取得汇总结果,如果只搞一个典型调查,收集的资料少,就不必使用计算机,只用手工整理就可以了。整理资料的方法很多,一个大型的调查需要使用各种方法收集资料,因此手工整理和计算机整理都有用场。
【拓展训练】
根据所收集到的资料,进行资料的初步整理,并制作统计表及统计图。
【完成评价】
任务完成评价参考得分为100分,具体操作参考下表:
 
 
小组
序号小组成员
态度
积极方法
得当信息
分组统计
图表创新
意识团队
合作总分权重
10(个人)1520201530100
 
 
任务13分析研究调查信息资料
【任务描述】
调查所得的原始资料经过审核、整理、汇总后,还需要进行系统的统计分析,才能揭示出调查资料所包含的众多信息,才能得出调查的结论,因而统计分析是现代社会调查方法中十分重要的一部分。调查者在统计分析的基础上,还必须对调查中所获得各种现象资料进行理论思维的加工处理,即运用比较分析、类比分析、因果分析、结构功能分析、归纳、演绎分析等方法,分析事物的内在联系、本质和规律,以便社会调查研究获得较为完整的科学结论。
【任务完成】
一、任务完成目的与要求
1.掌握频数和百分比表分析、集中量数和离散量数的分析、数据分布形态的分析、位置量数分析、相关系数分析的分析特点及使用条件,了解回归分析。
2.理解理论分析方法:比较分析、类比分析、因果分析、结构功能分析、归纳、演绎分析等方法的特点。
二、任务完成步骤
1.老师结合设计的项目讲解数据分析和理论分析的基本知识;
2.老师布置任务,要求学生对小组调查获得的数据进行分析,并在数据分析的基础上进行理论分析;
3.在课堂上教师就学生分析中存在的问题进行总结;
4.老师再次强调统计分析、理论分析的适用条件。
 
一、统计分析
(一)变量的测量等级
要做统计分析,需要首先看是什么变量形式,不同的变量适合用不同的统计分析形式。对事物的特性变量可以用不同的规则分配数字,因此形成了不同测量水平的测量量表(又可称为测量尺度)。基本的测量量表有四种:即类别量表、顺序量表、等距量表和等比量表。下面我们分别讨论这四种类型的量表。
1.类别量表类别量表中的数字分配,仅仅是用作识别不同对象或对这些对象进行分类的标记。例如,在一个调研项目中回答者可能勾选“男性”或“女性”一词表示性别,在编码时可能给男性分配数字代码1,给女性分配数字代码2。在这个例子中,数字并非代表数量,仅仅是“男性”和“女性”类别的名称,不代表任何数量的数据值被称作名义数据。数字只不过是类别的名称。在社会研究中,类别量表常用来标识不同的受访者、不同的性别、不同的职业、不同的班级、不同类型的企业等。
对类别量表中的数字,只能计算发生频度,以及和频率有关的一些统计量,如百分比、众数、卡方检验、二次检验等。计算平均数是没有任何意义的。
2.顺序量表顺序量表是一种排序量表,分配给对象的数字表示对象具有某种特征的相对程度。顺序量表可以让我们确定一个对象是否比另一个对象具有较多(较强)或较少(较弱)的某种特征,但并不能确定“多多少”或“少多少”,顺序量表规定了对象的相对位置,但没有规定对象间差距的大小。排在第1位的对象比排在第2位的对象具有多的某种特征,但是只多一点儿还是多了很多则无从得知。顺序量表的例子如比赛的名次等。
在顺序量表中,和类别量表一样,等价的个体有相同的名次。任何一系列数字都可用于表达对象之间己排定的顺序关系。例如,可对顺序量表施以任何变换,只要能保持对象间基本的顺序关系。因此,除了计算频度,顺序量表还可用来计算百分位数、四分位数、中位数、秩次数等。
3.等距量表等距量表也称区间量表,在等距量表中,量表上相等的数字距离代表所测量的变量相等的数量差值。等距量表包含顺序量表提供的一切信息,并且可以让我们比较对象间的差别,它就等于量表上对应数字之差。等距量表中相邻数值之间的差距是相等的,1和2之间的差距就等于2和3之间的差距,也等于5和6之间的差距。有关等距量表最典型的实际例子是温度计。还有如智商、考试成绩等。在社会问题研究中,利用评价量表得到的态度数据一般经常作为等距数据来处理。
等距量表中原点不是固定的(没有绝对0),测量单位也是人为的。因此,任何形式为y=a+bx的线性变换都能够保持等距量表的特性。这里,x是测量变量在原量表中的值,y是变换后得到的新值,b是一个正的常数,a可以是任何常数。因此,对四个对象A、B、C、D分别打分为1、2、3、4或22、24、26、28都是等价的。后一种量表可以从前一种量表经过变换得到,其中a=20,b=2。由于原点不固定,量表上数字的比值没有任何意义,例如D和B的比值变换前为2∶1,变换后却为7∶6,但测量值差距之比是有意义的,因为在这个过程中常数a、b都被消掉了。在不同量表中,对象D、B的差值和对象C、B的差值之比都是2∶1。
对于等距量表可采用类别量表和顺序量表适用的一切统计方法。此外,还可以计算算术平均值、标准方差以及其他有关的统计量。
4.等比量表等比量表具有类别量表、顺序量表、等距量表的一切特性,并有固定的原点(有绝对0)。因此,在等比量表中,我们可以标识对象,将对象进行分类、排序,并比较不同对象某一变量测量值的差别。测量值之间的比值也是有意义的。不仅“2”和“5”的差别与“10”和“13”的差别相等,并且“10”是“5”的2倍,身高、体重、年龄、收入等都是等比量表的例子。
等比量表仅限于使用形式为y=bx的变换,这里b是个正的常数。不能够像在等距量表中那样再加上一个常数a。例如从“米”到“厘米”的变换(b=100),不管是用米还是用厘米作为测量单位,对象之间的比较总是一致的。
所有的统计方法都适于等比量表,包括几何平均数的计算。遗憾的是等比量表对态度测量并没有太大的用处。
类别量表、序次测量、等距量表、等比量表构成了测量的层次,它们一个比一个等级高,而且次序不可逆。换句话说,处于高一等级上的测量不仅可以测量低等级测量可以度量的东西,而且还可以度量低等级测量所无法度量的东西。
以上四种测量层次,后一种测量都包含着前一种测量的反应功能和运算功能。
(二)频数和百分比表分析
类别数据统计上可以频数来表示,但顺序、等距和等比量表的数值型数据分布也可以作为类别来对待,用频数表描述,只要不同量表值的数目有限。频数表提供了变量数据分布的非常完整的画面。
 
表131频数表的打印输出
 
 
没有规定缺失值
类别代码频数百分比/%调整后百分比/%
中学肄业1284.24.2
中学毕业219128.528.5
大学肄业314121.021.0
大学毕业413620.320.3
研究生511817.617.6
拒绝回答6578.58.5
总计671100.0100.0
规定0为缺失值
类别代码频数百分比/%调整后百分比/%
中学肄业1284.24.6
中学毕业219128.531.1
大学肄业314121.023.0
大学毕业413620.322.1
研究生511817.619.2
拒绝回答0578.5—
总计671100.0100.0
表131Pamela L.Alreck,Robert B.Settle 著.调查研究手册,北京:中国轻工业出版社,2008,1:219220.显示了回答者在5个教育水平上的频数和百分比。这个例子中的表格是分析调查数据的统计分析程序产生的典型表格。频数表的第二列显示代码值,即分配给答案的代码。第三列标示为“频数”,表示做出特定反应的回答者人数。第四列标示为“百分比”,表示选择每一答案的回答者的比例。这些比例的计算方法是,用每个类别的频数除以回答者总数,并把分数用百分比表示。
案例表131的第五列标示为“调整后的”百分比。调整是基于报告的变量的缺失值。调查中经常有一些被调查者回答了完整的问卷,但没有回答一些个别项目。如果放弃这个问卷太可惜,一般调查中还把它作为有效问卷处理。因此,调整后的百分比与前一个百分比计算方式的区别在于调整后的百分比是基于回答了这一特定项目的人数。
案例表131上半部分的百分比与调整后的百分比相同,是因为拒绝回答教育水平的人被分配了代码值6,没有被规定为“缺失值”。
在使用单向频次表时需要解决的一个问题是选择百分比的基数。有三种选择:
①全部被调查者人数。如果有300人参加了某项调查,并决定利用所有参加者作为计算百分比的基数,每张单向频次表的百分比都将以300作为基数。
②需回答具体问题的人数。在大部分问卷中,不是所有的人都回答全部的问题。例如一项调查,调查了300人,其中问题4问调查者是否有狗或猫,其中回答没有的有100人,回答有的有200人,而问题5和6是专门问这200人的。在这种情况,用200作为计算百分比的基数较为恰当。
③作出回答的人数。在单向频次表中计算百分比的另外一个基数是回答了特定问题的人数。如300人问及某个特定问题,但28人表示“不知道”或没有回答,则要以272作为百分比的基数。
一般来说,需回答问题的人数被作为制表中计算百分比的基数。但也许在一些特殊场合,使用其他的基数会更合适。
另外,对于有多种答案的单个项目的百分比计算,其基数有两种情况:
例如,某问题要求被访者列出所有记忆中的商场的名称,多数人会列举不止一家商场。因此,答案的数量会超过被访者人数。如果200名被调查者中,平均每位列出3家商场,则200名被调查者会给出600个答案。问题是计算商场被提及的百分比应根据被调查者的人数还是众多答案的数量?这里可以有两种算法,一种是以600作为基数,另一种是以200作为基数。在调查中,一般的算法是以被调查者的人数为基数计算百分比,因为我们对给出特定答案的人的数量更感兴趣。
就数据的解释来说,如果分析的变量只能作类别考虑,类别变量是不连续的,唯一适合描述这种分布的统计量就是众数——数据频数最大和百分比最高的类别。
(三)相对程度分析
相对程度分析是统计分析的重要方法,是反映现象之间数量关系的重要手段。它通过对比的方法反映现象之间的联系程度,表明现象的发展过程,还可以使那些利用总量指标不能直接对比的现象找到可比的基础,因而在经济与市场调查分析中经常使用。经济和市场调查分析中常用的相对指标,主要有结构相对指标、比较相对指标、比例相对指标和强度相对指标等几种。
1.结构相对指标研究社会经济现象总体时,不仅要掌握其总量,而且要揭示总体内部的组成数量表现,亦即要对总体内部的结构进行数量分析,这就需要计算结构相对指标。
结构相对指标就是在分组的基础上,以各组(或部分)的单位数与总体单位总数对比,或以各组(或部分)的标志总量与总体的标志总量对比求得的比重,借以反映总体内部结构的一种综合指标。一般用百分数、成数或系数表示,可以用公式表述如下:
结构相对指标=(总体部分数值/总体全部数值)×100%
概括地说,结构相对数就是部分与全体对比得出的比重或比率。由于对比的基础是同一总体的总数值,所以各部分(或组)所占比重之和应当等于100%或1。
它从静态上反映总体内部构成,揭示事物的本质特征,其动态变化可以反映事物的结构发展变化趋势和规律性。
2.比较相对指标比较相对指标是指不同总体同类现象指标数值之比,就是将不同地区、单位或企业之间的同类指标数值作静态对比而得出的综合指标,表明同类事物在不同空间条件下的差异程度或相对状态。比较相对指标可以用百分数、倍数和系数表示。计算公式可以概括如下:
比较相对数指标=[甲地区(单位或企业)某类指标数值/乙地区(单位或企业)同类指标数值]×100%
3.比率(例)相对指标比例相对指标是总体内部不同部分数量对比的相对指标,用以分析总体范围内各个局部、各个分组之间的比例关系和协调平衡状态。它是同一总体中某一部分数值与另一部分数值静态对比的结果。其计算公式如下:
比率(例)相对指标=总体中某一部分数值/总体中另一部分数值
通常用倍数(系数)或百分数表示。
社会经济现象总体内各组成部分之间存在着一定的联系,具有一定的比例关系。为了掌握各部分之间数量的联系程度,需要把不同部分进行对比。比例相对指标就是同一总体内不同部分的指标数值对比得到的相对数,它表明总体内各部分的比例关系,如家计调查中的收支比例,国民经济结构中的农、轻、重比例等,通常用百分数表示,也可以用一比几或几比几的形式表示。
4.强度相对指标在经济和市场调查中,有时要研究不同事物间的联系,如流通费与商品销售额、产值与固定资产等,这就需要通过计算强度相对指标来分析。强度相对指标是两个性质不同但有一定联系的总量指标之间的对比,用来表明某一现象在另一现象中发展的强度、密度和普遍程度。它和其他相对指标根本不同的特点,就在于它不是同类现象指标的对比。强度相对指标以双重计量单位表示,是一种复名数。
强度相对指标的分子分母位置可以互换,因而有正指标、逆指标之分。实际应用时应注意与平均指标的区别。
在掌握了几种常用的相对指标的概念、作用及计算后,要注意区分不同的相对指标。
结构相对指标是以总体总量为比较标准,计算各组总量占总体总量的比重,来反映总体内部组成情况的综合指标。如:各工种的工人占全部工人的比重。比例相对指标是总体不同部分数量对比的相对数,用以分析总体范围内各个局部之间比例关系和协调平衡状况。如:轻重工业比例。比例相对指标和比较相对指标的区别是:
(1)子项与母项的内容不同,比例相对指标是同一总体内,不同组成部分的指标数值的对比;比较相对指标是同一时间同类指标在空间上的对比。
(2)说明问题不同,比例相对指标说明总体内部的比例关系;比较相对指标说明现象发展的不均衡程度。比较相对指标是不同单位的同类指标对比而确定的相对数,用以说明同类现象在同一时期内各单位发展的不平衡程度。如:甲地职工平均收入是乙地职工平均收入的1.3倍。
强度相对指标和其他指标的主要区别是:
(1)其他各种相对指标都属于同一总体内的数量进行对比,而强度相对指标除此之外,也可以是两种性质不同的但又有联系的属于不同总体的总量指标之间的对比。
(2)计算结果表现形式不同。其他相对指标用无名数表示,而强度相对指标主要是用有名数表示。
(3)当计算强度相对指标的分子、分母的位置互换后,会产生正指标和逆指标,而其他相对指标不存在正、逆指标之分。
5.计划完成程度相对指标计划完成程度相对指标是用来检查、监督计划执行情况的相对指标。它以现象在某一段时间内的实际完成数与计划数对比,来观察计划完成程度。用公式来表示:
计划完成率(%)=(实际完成数/计划完成数)×100%
此指标根据下达计划任务时期的长短和计划任务数值的表现形式不同,而有多种计算方法,实际应用时需注意区别。
6.动态相对指标动态相对指标就是将同一现象在不同时期的两个数值进行动态对比而得出的相对数,借以表明现象在时间上发展变动的程度。通常以百分数(%)或倍数表示,也称为发展速度。其计算公式如下:
动态相对指标=(报告期指标数值/基期指标数值)×100%
 
(四)集中量数、离散量数和数据分布形态分析
1.集中量数的分析方法集中量数所表示的是一组数据的集中程度或水平。常见的有算术平均数(Mean)、中位数(Median)、众数(Mode),另外还有加权算术平均数、几何平均数等。
(1)算术平均数。算术平均数是用来描述数据分布集中趋势的一个统计量,常用符号X来表示,它是一组观测值的总和除以该数目所得的商来计算,定义公式为:
X=ni=1xin
 
式中X——平均数;
ni=1xi——x1+x2+…+xn,n表示观察值个数;
n——观测值的数目。
例甲组5位员工的考核成绩分别为100、99、60、21、20,乙组5位员工分别为65、63、60、57、55。那么
X甲=100+99+60+21+205=60
X乙=65+63+65+57+555=60
所以X甲=X乙
优点:①容易理解,便于计算;②灵敏度高;③稳定性好。
缺点:①易受极值(极大值、极小值)影响;②在偏斜分布和U形分布中,不具有代表性。
在社会调查中,平均数有着广泛的用途:
①利用平均数可以对各个样本或总体进行比较。如,可以利用不同群体的满意度的平均数进行比较与分析。
②利用平均数可以反映样本或总体的一般水平。如要了解某一群体的平均消费水平,我们可把分数的总和除以人数,得出平均数,这样就能明白地反映这个群体消费的一般水平。
③利用平均数可以分析现象之间的依存关系。如根据员工对管理方式满意度的高低,可以看出员工的满意度与该部门领导的管理水平有密切关系。
④利用平均数可以研究样本或总体的一般水平在时间上的变化。如比较某个部门的客户满意度在不同时期满意度平均分的提高,可以看出该部门服务效果的不断提高过程。
计算和应用算术平均数的条件以及要注意的问题:
①要注意数据的同质性。算术平均数只能用于表示同类数据的集中趋势。不同质的数据不能计算平均数。所谓同质数据是指使用同一观测手段,采用相同的观测标准,能反应某一问题的同一方面特质的数据。
②数据要准确。要求一组数据中每个数据都比较准确、可靠,若数据模糊不清或分组资料有不确定组限时,不能计算平均数。
③要求数据无极端值(极大值、极小值)出现。
④使用中注意平均数与个体数值相结合。在解释个体特征时,既要看平均数,也要结合个体的数据。
⑤注意平均数与标准差、方差相结合。描述一组数据时既要分析其集中趋势,也要分析离散程度。
(2)中位数。中位数(或中数)是一组数据按从小到大排序后,处于中间位置上的变量值。中位数是一个位置代表值。如下列分数的中位数为43。
25274364190
中位数找出后,我们即可知全部数据中有50%的案例是高于此分数,也有50%的案例低于此分数或数值。
中位数寻找的方法须视数据中有多少个案(cases)来决定。
①若样本数目N是奇数,则先将N+1然后除以2,即(N+1)/2,在(N+1)/2之位置者之分数即为中位数。
Md=x(n+1)/2
以上例为例,因有5个分数,(5+1)/2 = 3,因此在顺序中第3位者即为中间之个案,其分数为中位数。
②若样本数目N是偶数,则中间两个分数的平均数为中数。我们可以N/2及(N/2)+1来找出这两个中间的个案,然后将此两个案之分数相加后除2。
Md=xn/2+x(x/2+1)2
如:
2527436475190
43及64两分数所占之位置是在次数分配顺序中之中间,中位数即为(43+64)/2 = 53.5。
中位数不受两端极端数据的影响,但反应不灵敏,也不适合进一步代数运算的要求。
中位数适用条件:
①当一组数据有极端值出现时。
②当一组有序数据两端有个别数据模糊不清或分组资料有不确定组限时。
③当需要快速估计一组数据的代表值时。
(3)众数。众数是一组数据中出现次数最多的变量值。众数可用观察法直接求得,如,一组原始数据49,65,57,38,49,51,68,83,75,80,65,68,57,49,67,其中次数出现最多的数值是49,所以49就是该组数值的众数,如果各个数据都不相同,就没有众数。如在一组数据中出现次数最多的数不止一个,就会存在不止一个众数。
众数的优缺点:众数的概念简单易懂,但比较粗略,不能灵敏地反映一组数据的变化,而且不适合进一步代数运算。一般用于类别变量或等级变量的资料。
应用中集中量数的选择方法:
在应用时,哪种集中量数能最准确、最稳定地反映数据整体的集中趋势,哪一种数据就是最好的集中量数。
平均数应用最多,但它往往受一个或几个极端数据的影响,使平均数反映数据整体集中趋势的准确性变得极低。
当一组数据存在极端数据、或数据整体中有个别数据不准确、不清楚的情况下,中数能比平均数更准确、更稳定地反映数据整体的集中趋势。
在需要快速而又粗略地找出一组数据的代表值时,中数较好。
 
平均数的误用实例
据建设部公布的2005年城镇房屋概况统计数据,北京人均住宅建筑面积为32.86平方米。按照这个数据,一个三口城镇之家,居住面积可达97平方米,这当然是相当不错的居住条件了。所以,乍一看这数据,肯定会有不少人为北京人有这样好的居住条件而羡慕。
但是,到底有多少北京居民真正享受到了这一平均数所描述出的生活质量呢?对于很多人来说,这个人均数字可能只是一个遥不可及的目标。在我们生活中,小两口挤一间房甚至几个人挤一间房的也非常普遍。
然而,在统计报告中,这些人却能分享一个非常体面的平均数。这个平均数,实际上掩盖了很多人居住条件差的事实。
当得到集中量数之后,我们就可以知道整组数据的平均结果,可以知道每一个数据和其他数据的比较结果。但是我们还无法了解数据相互之间的差别到底是大还是小,也就是不知道这些数据的分布或离散的程度。因此我们还需要描述数据离中趋势的统计量数。
2.离散量数的分析方法离散量数表示一组数据变异程度或分散程度的量数。离散量数越大,表示数据分布范围越广,越不集中,越不整齐。反映了集中指标对数据的代表性。
如图131所示,三个不同的曲线表示三个不同的总体,其均值相同,但离散趋势不同。
 
 
图131数据离散程度
(1)全距。全距(range):又称极差,数列中最大值与最小值之差。
R=XH-XL
 
其中XH ——最大数值;
 
XL ——最小数值。
如某班学生数学成绩最高为95分,最低为32分,则全距R=95-32=63。
(2)平均差。平均差(mean deviation,MD):各个数据与平均数差数的绝对值的平均数,称为平均差。
如果以算术平均数为原点,计算各变量与原点之差,这种差就叫离差。离差有正有负。若按正、负计算,其总和等于零,无法算出一个表示差异情况的指标。为了解决这个问题,不取离差的“代数和”,而取其绝对值之和,再除以变量的个数。这样,就可反映一群变量的差异情况。
平均差意义明确,它受两极端数值的影响较小,它利用了全部观测值,考虑到全部的离差,因而能说明全部观测值的离散情况,但计算时运用到绝对值,不便于代数运算。
(3)方差与标准差。方差(variance, σ2 S2 ):各数据与平均数差数的平方和的平均值称为方差,也称为变异数。
因此,总体方差定义公式为:
σ2=(Xi-μ)2Nμ是总体平均数
样本方差的定义公式为:
S2=(Xi-X)2N-1
计算方差时使用了平方,也就是夸大了数据和平均数的距离,因此需要将方差开方以还原其本来的差异,这就是标准差。
标准差(standard deviation,σ S)是表示一组数据中各个数值与平均数的离散趋势。具体一点说,标准差越大,说明各个数值彼此之间的差异就越大,各个数值距离平均数这个中心的离散趋势也越大。标准差越小,说明各个数值之间差异就小,各个数值与平均数的离散趋势小。
总体标准差计算公式为:
σ=(Xi-μ)2N
样本标准差计算公式为:
S=ni=1(xi-x)2n-1
 
其中xi——某一变量的各个取值;
 
x——某一变量的平均数;
 
n——数据的个数。
下面举一例子说明标准差分析的意义。例如,要调查居民人均月购买副食品的状况,从甲、乙两个街道各抽选5户调查,调查数据如下:
甲街道:75元、80元、82元、85元、78元
乙街道:90元、60元、100元、40元、110元
通过计算,这两个街道的居民人均月购买副食品都是80元。我们再来计算它们的标准差:
S甲=(xi-x)2n-1
 
=(75-80)2+(80-80)2+(82-80)2+(85-80)2+(78-80)25-1
 
=3.8
S乙=(xi-x)2n-1
 
=(90-80)2+(60-80)2+(100-80)2+(85-80)2+(78-80)25-1
 
=29.2
S乙>S甲
 
甲街道的抽样标准差为3.8,乙街道抽样的标准差为29.2,乙街道抽样标准差明显高于甲街道抽样标准差。这说明乙街道5户居民之间购买副食品额差异大,它们与平均数这一中心差距大,即离散趋势大。而甲街道5户居民之间购买副食品额差异较小,它们与平均数这一中心差距较小,即离散趋势也小。
方差和标准差是表示一组数据离散程度的最好指标,是最常用的差异量数。其特点有:
①反应灵敏,每个数据变化都应在方差上体现;
②计算严密;
③容易计算;
④适合代数运算;
⑤受抽样变动影响小;
⑥简单明了;
⑦容易受极端数据影响。
方差和标准差的作用主要有以下三方面:
①用于说明均值的代表性大小;
②反映现象的质量与风险;
③用于统计推断。
(4)离散系数。方差、标准差、全距都属于绝对离散量数,绝对离散量数的局限是只有当两种离散数量的单位相同时,才能比较其大小;当两种离散量数的单位不同时,就无法进行比较差异。这时可用离散系数比较。所谓离散系数又称变异系数,即标准差与算术平均数的百分比值。它是一个相对变异指标。变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。
C·V=Sx×100%
离散系数的最大功用是可以比较不同单位数据分布的差异程度。
例:某班级在一次考试中,语文成绩:标准差21分、平均分95分(满分150分),物理成绩:标准差18分,平均分72分(满分100分),试比较它们的离散程度。
解:语文CV=21/95×100=22.1;物理CV=17/72×100=25。语文成绩的离散程度小于物理。
3.数据分布形态——峰度和偏度分析对于一组数据,不仅要描述其集中趋势、离中趋势,而且也要描述其分布形态。这是因为一个总体如果均值相同,标准差相同,但也可能分布形态不同。另外,分布的形态有助于识别整个总体的数量特征。总体的分布形态可以从两个角度考虑,一是分布的对称程度,另一个是分布的高低。前者的测定参数称为偏度或偏斜度,后者的测定参数称为峰度。
(1)偏度。偏度(Skewness)是描述数据分布对称性的统计量 ,而且也是与正态分布的对称性相比较而得到的。如果分布的偏度等于0 ,则其数据分布的对称性与正态分布相同 ;如果偏度大于0,则其分布为正偏或右偏,即在峰的右边有大的偏差值,使右边出现一个拖得较远的尾巴;如果偏度小于 0,则为负偏或左偏,即在峰的左边有大的偏差值,使左边出现一个拖得较远的尾巴。
最常见的方法是计算偏度系数。它是以标准差为度量单位计量的众数与算术平均数的离差,用SK表示。
SK=X-M0σ
式中SK——偏度系数,其余符号同前。SK为无量纲的系数,通常取值在[-3,+3]之间。其绝对值大,表明偏斜程度大;反之,则表明偏斜程度小。
当分布呈右偏态时,X >M0,( X-M0)> 0,SK > 0,故也称正偏态;
当分布呈左偏态时,X <M0,( X-M0)< 0,SK < 0,故也称负偏态;
当X = M0,SK = 0,分布为对称分布。
(2)峰度。峰度(Kurtosis) 是描述某变量所有取值的分布形态陡缓程度的统计量,而峰度对陡缓程度的度量是与正态分布进行比较的结果。样本资料的峰度公式:
 
Kurtosis=n(n+1)(n-1)(n-2)(n-3)ni=1xi-xs4-3(n-1)2(n-2)(n-3)
如果峰度等于 0 ,其数据分布的陡缓程度与正态分布相同;峰度大于 0,其数据分布比正态分布更陡峭;峰度小于0,其数据分布比正态分布更平坦。
(五)位置量数——标准分数
在社会调查和测量后得到的分数,一般称为原始分。原始分存在两大缺陷。一是不能反映各分数在总体中的地位,同样是80分,可能在总体中名列前茅,也可能名附榜尾。二是不同类型或不同次测量的分数具有不同的价值,不能简单相加求其总和来确定位次。因此,仅仅用原始分的总分来判别水平的高低,显然是不够公正不够科学的。为了解决原始分的上述缺陷,就得引进地位量数。
地位量数是描述或确定某一个观测值在全体数据中所处位置的统计量数。常用的地位量数是标准分数(Standard Score,Z)。
标准分数又称Z分数,是以标准差为单位来表示一个分数在团体中所处位置的量数。所以也叫相对位置量数。比如Z 分数为 1.5 ,则其比平均数大 1.5 个标准差。
用公式表示:
Z=X-XS
 
其中X——各原始数值;
 
X——各原始数值的平均数;
 
S——标准差。
例如某单位各部门举办专业知识考试,择优选拔聘用。成绩统计结果为:财务部应试者分数的均值和标准差分别为78.53和9.43,销售部应试者分数的均值和标准差分别为70.19和7.00。
现知财务部小李成绩为90分,销售部小张成绩为82分,若要对小李和小张的成绩进行比较,哪位更优秀呢?
将分数标准化,再进行比较:
(90-78.53)/9.43=1.22
(82-70.19)/7=1.69
从标准分数来看,小张排的位置更靠前,小张更优秀。
在实际应用中,为了避免小数的不便,可以对标准分数进行线性转换:
T=10Z+50
比如某人在艾森克人格问卷的测量中,其精神质得分比同年龄人的平均成绩高2.0个标准差,则其换算后的标准分数为 70 分;如果另一人的测试分数正好等于平均数,则其标准分数为50。
标准分数不仅能说明原始分数在分布中的地位,而且因为它是以标准差为单位的等距量表,故经把原始分数转化为标准分数,可以在不同分布的各原始分数之间进行科学的比较,因此,标准分数比较多的是用于成绩评定和新员工录取、学生录取等工作上。
(六)相关系数
社会调查研究的是很多相关的事件,在研究具有相互关联的事件上,我们通常借助于相关分析和回归分析这两种统计方法,度量变量之间关联程度的方法叫相关分析。如果考虑的是两个变量之间关系时,称为简单相关;如果讨论一个变量与两个或多个其他变量的关系时,就称为复相关或偏相关,而回归分析则是根据已知的一个或一个以上变量(自变量)的值来估计另一个变量(因变量)的值,并且算出估计的误差。
两个变量之间不精确、不稳定的变化关系,称为相关关系。两个变量之间的变化关系,既表现在变化方向上,又表现在密切程度上。
为了确定相关变量之间的关系,首先应该收集一些数据,这些数据应该是成对的。例如,每人的身高和体重。然后在直角坐标系上描述这些点,这一组点集称为散点图。
为了研究父亲与成年儿子身高之间的关系,卡尔·皮尔逊测量了1 078对父子的身高。把1 078对数字表示在坐标上,如图,用水平轴X上的数代表父亲身高,垂直轴Y上的数代表儿子的身高,1 078个点所形成的图形是一个散点图。它的形状像一块橄榄状的云,中间的点密集,边沿的点稀少,其主要部分是一个椭圆。
 
用来描述两个变量相互之间变化方向及密切程度的统计指标称为相关系数,一般样本的相关系数用r表示。
相关系数r的值在-1和1之间,但可以是此范围内的任何值。正相关时,r值在0和1之间,散点云图是斜向上的,这时一个变量增加,另一个变量也增加;负相关时,r值在-1和0之间,散点云图是斜向下的,此时一个变量增加,另一个变量将减少。r的绝对值越接近1,两变量的关联程度越强,r的绝对值越接近0,两变量的关联程度越弱。
下面介绍两种基本相关系数及其计算方法。
1.积差相关(Productmoment Coefficient of Correlation,r)积差相关是英国统计学家皮尔逊(pearson)于20世纪初提出的一种计算相关的方法,因而被称为皮尔逊积差相关,也称为积矩相关(product moment correlation)。
积差相关适用于:
①两个变量都是连续数据;
②两变量总体都为正态分布;
③两变量之间为线性关系;
④成对数据,样本容量要大(n>30)。
用公式表示:
r=ni=1(xi-X)(yi-Y)ni=1(xi-X)2·ni=1(yi-Y)2
 
其中xi(i=1,2,…,n)是n个第一类变量;
 
yi(i=1,2,…,n)是n个第二类变量;
 
X是第一类变量的均数,Y是第二类变量的均数。
使用公式时,两类变量的对数n要超过30(n>30),否则计算它们的积差相关系数就失去有效意义。
例:某小学在统考中随机抽取30名考生的语文与数学成绩,试计算它们的相关系数。
语文成绩:60,62,53,57,62,59,48,41,46,58,51,55,78,74,60,62,53,57,62,59,48,41,46,58,51,55,78,74,60,62
数学成绩:62,80,77,65,64,67,53,58,67,65,68,68,69,58,88,62,80,77,67,65,61,58,65,68,68,69,58,88,62,80
代入计算公式,得r=0.32,说明30位考生的语文成绩与数学成绩呈普通相关。
2.等级相关系数(Rank Correlation,rR)在实际工作中,如果所掌握的资料不是用分数表示,而是用等级表示的,就需要用等级相关来计算相关系数。
用公式表示:
rR=1-6ni=1(di)2n(n2-1)
 
其中di——两类变量每对数据等级的差数;
 
n——变量的对数;
等级相关对n的多少不作要求。
例某校10名教师,教龄与教学能力评定等级如表132所示,试分析两者的相关程度。
 
表132教龄与教学能力评定等级
 
 
 
教学人员教龄教龄等级教学能力等级等级差数d差数平方d2
一310
二83
三29
四105
五68
六66
七122
八94
九57
十71
合计
计算时,先按教龄长短排出教龄等级,写在相应栏目内,最长为1级,余以此类推。教龄相同的,给予平行的等级,如序号“五”“六”两位教师都定级为6.5级(此时无7级)。表中的“等级差数d”等于“教龄等级”减去“教学能力等级”。详参表133:
 
 
 
表133
 
 
教学人员教龄教龄等级教学能力等级等级差数d差数平方d2
一3910-11
二84311
三210911
四1025-39
五66.58-1.52.25
六66.56-1.52.25
七1212-11
八934-11
九58711
十751416
合计33.50
代入公式,得r=0.80。由此可见,教龄与教学能力呈高度正相关。
(七)回归分析——一元线性回归
当我们知道了两个变量之间有直线相关关系,并且一个变量的变化会引起另一个变量的变化,这时,如果它们之间存在准确、严格的关系,它们的变化可用函数方程来表示,叫它们是函数关系,它们之间的关系式叫函数方程。但在实际生活当中,由于其他因素的干扰,许多双变量之间的关系并不是严格的函数关系,不能用函数方程反映,为了区别于两变量间的函数方程,我们称这种关系式为直线回归方程,这种关系为直线回归。
1.一元线性回归线性回归(linear regression):自变量与因变量之间呈线性关系(linear relationship)的回归关系。
一元线性回归是指只有一个自变量的线性回归,一元线性回归又称为简单线性回归(simple linear regression)。因此一元线性回归方程的一般形式是:
Y^=bYXX+aYX
 
a是回归直线在Y 轴上的截距,即X=0时的Y值;b为样本的回归系数,即回归直线的斜率,表示当X变动一个单位时,Y平均变动b个单位。如果a、b已知,代入上式,就可求得直线回归方程。
a=Y-bXb=(X-X)(Y-Y)(X-X)2
一元线性回归分析估计两个变量的关系。其中一个变量作为因变量或输出变量(y)。另一个变量作为自变量或预测变量、解释变量(x)。有时两个变量中哪一个是因变量(例如高度和重量)是不好区分的。在这种情况下,可能会使用相关分析。
2.相关与回归的区别与联系
(1)区别。①意义:相关反映两变量之间的双向关系,即在两个变量中,任何一个的变化都会引起另一个的变化,是一种双向变化的关系,没有主从之分。回归反映的是两个变量的依存关系,一个变量的改变会引起另一个变量的变化,是一种单向的关系。相关关系用相关系数来表示,而回归关系用数学模型来表示。②应用:研究两个变量的相互关系用相关分析,研究两个变量的依存关系用回归分析。③研究性质:相关是对两个变量之间的关系进行描述,看两个变量是否有关,关系是否密切,关系的性质是什么,是正相关还是负相关。回归是对两个变量做定量描述,研究两个变量的数量关系,已知一个变量值可以预测出另一个变量值,可以得到定量结果。④相关系数r与回归系数b 的绝对值反映的意义不同。r的绝对值越大,散点图中的点越趋向于一条直线,表明两变量的关系越密切,相关程度越高。b的绝对值越大,回归直线越陡,说明当X变化一个单位时,Y的平均变化就越大。反之也是一样。
(2)联系。①相关分析是回归分析的基础和前提(通过相关分析的结论,才能引入回归分析);②能进行回归分析的变量之间存在相关关系。所以,对于两组新数据(两个变量)可先做散点图,求出它们的相关系数,对于确有相关关系的变量再进行回归分析,求出回归方程。③相关系数r与回归系数b 的符号一致。r为正时,b也为正,表示两变量是正相关,是同向变化。r为负时,b也为负,表示两变量是负相关,是反向变化。r与b的假设检验结果一致,可用r的显著检验代替b的显著性检验。
3.应用直线相关与回归的注意事项
(1)实际意义。进行相关回归分析要有实际意义,不可把毫无关系的两个事物或现象用来作相关回归分析。例如,有人说,孩子长,公园里的小树也在长。求孩子和小树之间的相关关系就毫无意义,用孩子的身高推测小树的高度则更加荒谬。
(2)相关关系。相关关系不一定是因果关系,也可能是伴随关系,并不能证明事物间有内在联系,例如,有人发现,对于在校儿童,鞋的大小与阅读技能有很强的相关关系。然而,学会新词并不能使脚变大,而是涉及第三个因素——年龄。当儿童长大一些,他们的阅读能力会提高而且由于长大也穿不下原来的鞋。
(3)利用散点图。对于性质不明确的两组数据,可先做散点图,在图上看它们有无关系、关系的密切程度、是正相关还是负相关,然后再进行相关回归分析。
(4)变量范围。相关分析和回归方程仅适用于样本的原始数据范围之内,出了这个范围,我们不能得出两变量的相关关系和原来的回归关系。
二、比较分析
比较是对调查资料进行理论分析的最常用、最基本的方法。比较法是将不同的事物和现象进行对比,找出其异同点,从而分清事物和现象的特征及其相互联系的方法。所谓“不怕不识货,就怕货比货”。
比较多种多样:数量比较、质量比较、纵向比较、横向比较、形式比较、内容比较、同类比较、异类比较、结构比较、功能比较、理论与事实比较等。采取那种比较方法取决于研究的需要。
(1)横向比较:就是根据同一标准对同一时间的不同认识对象进行比较的方法;
(2)纵向比较:就是对同一认知对象在不同时期的特点进行比较,以发现其历史的变化趋势。因此它又叫历史比较。
横向比较和纵向比较各有其长短。横向比较的优点是现实性强,容易理解,便于掌握,它侧重从质与量上对认识对象加以区分;缺点是作为一种静态比较法,难以揭示事物的本质规律及发展趋势。纵向比较的长处在于能够揭示事物之间的有机联系,认识事物之间的发展趋势;但它往往对事物之间横向联系注意不够。因此,需要将横向比较与纵向比较相结合,以达到对事物的深入了解和认识。
进行比较研究,要特别注意事物的可比性。要使两个事物或两种现象具有可比性,关键是选择恰当的比较角度,建立起对双方都适用的比较标准。否则就无法进行比较。例如可以把合资企业和国有企业的经济效益进行比较,但不可以把企业的经济效益于政府的工作作风放在一起比较。因为经济效益与工作作风是两种不同的指标。
(一)类型比较——横向比较
类型比较就是对各种类型进行比较的方法。类型比较是一种横向比较。
类型比较研究方法包括两个步骤或两个层次,首先是建立或识别类型,然后是对不同类型进行比较,在比较中认识事物或社会现象的本质特征。
类型比较的最终目的是为了更深入地认识客观事物。
例如:毛泽东在《中国社会各阶级分析》一文中,把中国社会阶级区分为地主阶级、买办阶级、中产阶级、小资产阶级、半无产阶级、无产阶级和游民无产者,然后对他们的经济地位与政治态度进行了比较分析,在此基础上形成了谁是革命的敌人、谁是革命的朋友、应该依靠谁、团结谁、反对谁的理论认识,并据此制定出适合中国社会特点的新民主主义革命路线。
改革开放后,在调查中广泛运用了类型比较法进行研究。如农村改革前期的安徽模式与四川模式的比较,改革后期的苏南模式与温州模式的比较。通过比较积累经验,再向全国推广。
1.同类比较比较两种或两种以上同类事物而认识异同点的方法。同类相同点比较,可以找到事物发生发展的共同规律。同类相异点比较,可以找到事物发生发展的特殊性。如对我国社会经济发展水平不同的农村地区基础教育发展的比较研究。通过三个抽样县调查说明,虽然经济发展水平不同,但在普及九年制义务教育方面都采取了若干共同措施,也正是通过对不同地区普及义务教育的经验教训的比较分析,力图对促进农村地区基础教育发展作出若干概括性结论。
2.异类比较研究比较两种或两种以上性质相反的事物或一个事物的正反两方面,通过比较表面相异的两类对象以发现异中之同,找出其中的共同规律。这种比较,反差大、结果鲜明,有利于鉴别和分析。如有人对老子、赫拉克利特辩证思想的比较研究,发现二者在天道观、发展观、矛盾观等方面有惊人的相似之处,又有各自阐发的侧重和局限性,而该问题的研究,对探讨古代哲学的发展有重要意义。
(二)历史比较——纵向比较
是一种纵向比较,它是对不同历史时期的社会现象的异同点进行比较和分析,由此揭示社会现象的发展趋势或发展规律。
历史比较法常用于宏观社会研究,如历史阶段的划分。其目的在于通过对比,发现社会现象在历史演变过程的变化规律,从而获得对社会变迁的科学认识,建立科学的社会发展和社会变迁理论,以科学地解释人类社会。
在具体的社会调查研究中运用社会比较法,是将收集到的具体事实分为不同时期进行比较,并具体分析它们的差异,概括出一些本质差异,然后上升到某种社会历史理论的高度对这种差异作出说明和解释,或者提出一些新的理论观点。
三、类比法
类比法也叫“比较类推法”,是指由一类事物所具有的某种属性,可以推测与其类似的事物也应具有这种属性的推理方法。其结论必须由实验来检验,类比对象间共有的属性越多,则类比结论的可靠性越大。反之,结论的可靠性程度就会越小。此外,要注意的是类比前提中所根据的相同情况与推出的情况要带有本质性。如果把某个对象的特有情况或偶有情况硬类推到另一对象上,就会出现“类比不当”或“机械类比”的错误。
(一)类比的特征
类比推理是这样的一种推理,它把不同的两个(两类)对象进行比较,根据两个(两类)对象在一系列属性上的相似,而且已知其中的一个对象还具有其他的属性,由此推出另一个对象也具有相似的其他属性的结论。
类比推理的基本原理可以用下列模式来表示:
 A对象具有属性a、b、c,另有属性d,
 B对象具有属性a、b、c,
所以,B对象具有属性 d。
上述的“A”“B”是指不同的对象。可以指①指不同的个体对象;②指不同的两类对象;③指不同的领域。
类比的结论是或然的。类比的结论之所以具有或然性,主要是由于以下两方面的原因:
第一,是因为对象之间不仅具有相似性,而且具有差异性。就是说,A、B两对象尽管在一系列属性(a、 b、c)上是相似的,但由于它们是不同的两个对象,总还有某些属性是不同的。如果d属性恰好是 A对象异于 B对象的特殊性,那么,我们作出 B对象也具有d属性的结论,便是错误的。
第二,是对象中并存的许多属性,有些是对象的固有属性,有些是对象的偶有属性。
类比法的特点是“先比后推”。“比”是类比的基础,既要“比”共同点也要“比”不同点。对象之间的共同点是类比法是否能够施行的前提条件,没有共同点的对象之间是无法进行类比推理的。
(二)类比的类型
类比的出发点是对象之间的相似性;而相似对象又具有多种多样的属性,在这些属性之间又有这样和那样的关系。人们对这些关系的认识过程,是从简单到复杂的过程。随着对这些关系认识的不断深化,人们所运用的类比方法也就出现了不同的类型。
(1)性质类比。所谓性质类比,就是根据类比物的性质与应予解释的系统的性质之间的类似性所进行的类比。
性质类比是类比方法中比较简单的类型,这种类比仅以类比物与应予解释的系统之间的性质相似为依据,这种类似性还是比较肤浅的,还没有确定各相似性质之间的必然性联系。由此可推出:所得的结论具有很大的或然性。
(2)形式类比。形式类比是依据类比物与应予解释的系统两个领域的因果关系或规律性相似而进行的类比。
由于形式类比是以相似的因果关系或规律性为依据的,因此这种类比结论的可靠性程度就能大大地提高。
(3)综合类比。综合类比是在应用综合法建立数学模型的基础上,根据数学模型之间的相似性而进行的一种类比。
(三)类比法的一般应用
尽管类比推理的结论不是十分可靠的,但是它在研究活动中,却有着非常重大的意义:
(1)类比是提供一种发现事物规律和提出一种假设的重要方法。科学史上的重大发现,有许多是应用类比推理获得的。荷兰科学家惠更斯把光和声进行类比,根据光和声有许多相同的属性,而声是呈波动状态向外传播的,因此他推论光也以波动状态进行传播。总之,科学史上运用类比推理的例子是不胜枚举的。无数事例说明,类比推理是人们思维活动中的一种重要的思维形式。
(2)类比被用于解释新的理论和定义。当一新理论刚提出之时,必须通过类比用人们已熟悉的理论去说明新提出的理论和定义;新提出的理论必须与别的已知理论进行类比,它才能得以解释。
(3)类比与模拟实验也有密切关系。在客观条件受到限制而不能直接考察被研究对象时,往往可以依据类比而采用间接的模拟实验进行研究。
(四)类比法在商业预测领域的特殊般应用
许多事物的变化发展规律都带有某种相似性,尤其是同类事物之间。类比预测是根据类推性原理,把预测对象同其他类似事物进行对比分析,从而估计和推断预测对象未来发展与市场预测展变化趋势的一种预测方法。类比预测适用范围广,方法简便,论证性强。依据类比目标的不同,类比预测推断可以分为产品类推、地区类推、行业类推和局部总体类推。
1.产品类推产品类推是根据产品在功能、结构、原材料、规格等方面具有的相似性,推测产品市场的发展可能出现的某种相似性。如可以根据我国家用电冰箱的市场发展规律大致地推断家用空调的发展趋势。与性质相近相似产品的类比,特别适合于新产品开发方面的预测。如可以根据消费者在口味和香型方面的需求,类比推断卷烟制品香型的发展趋势,比如开发水果香型的卷烟等。
2.地区类推地区类推是依据其他地区(或国家)曾经发生过的事件进行类比推断。同一产品在不同地区或国家有领先或落后的发展状况,可以根据某一地区的市场状况类推另一地区的市场。如把预测对象与另一地区同类产品发展变化的过程或趋势相比较,找出相类似的变化规律,用来推测预测对象未来的发展趋势。下面用一个案例来说明该法的应用:
例如:某市下辖A1、A2、A3、A4四个区,各区人口及去年卷烟销量见表13 4,经过对A1区卷烟消费者的抽样调查,预测今年A1区的人均卷烟需求为7.8条/人,假设今年人口数不变,各区保持和去年同样的销售比率,请运用对比类推预测法,根据A1区情况预测各区今年的卷烟销售量。(保留3位小数)
 
表13 4某市去年四区卷烟销售量
 
 
 
区A1A2A3A4
实际销售量150185146228
人口/万人20252030
分析提示:
(1)确定预测目标。确定预测目标就是确定预测对象,以及预测的目的和要求。这里的预测目标是根据A1区今年的卷烟需求(7.8条/人),预测今年A2、A3、A4各区的卷烟销售量。
(2)因为四个区同属一市,可以认为四个区的卷烟需求变化具有相同趋势。可采用地区类推法,将A1区今年卷烟需求(7.8条/人)作为类推基准,预测A2 、A3、A4 区今年的卷烟需求,进而预测各区今年的卷烟销售量。
(3)具体类推计算如下:
①计算去年各区人均卷烟需求
A1区去年人均卷烟需求=150 / 20 = 7.5(条/人)
A2区去年人均卷烟需求=185 / 25 = 7.4(条/人)
A3区去年人均卷烟需求=146 / 20 = 7.3(条/人)
A4区去年人均卷烟需求=228 / 30 = 7.6(条/人)
不妨把A1区的去年人均卷烟需求视为1,则其余各区相对于A1区的去年人均卷烟需求相对值为:
A2区相对值=7.4 / 7.5 = 0.987
A3区相对值=7.3 / 7.5 = 0.973
A4区相对值=7.6 / 7.5 = 1.013
②类推计算今年各区人均卷烟需求
已知A1 区今年人均卷烟需求为7.8条/人,以此为类推基准,且其余各区相对值保持不变,则其余各区今年人均卷烟需求可类推得到:
A2区今年人均卷烟需求=7.8×.987 = 7.699(条/人)
A3 区今年人均卷烟需求=7.8×.973 = 7.589(条/人)
A4区今年人均卷烟需求=7.8×1.013 = 7.901(条/人)
③计算各区今年卷烟销售量预测值
A1区:20×7.8 = 156.0(万条)
A2区:25 ×7.699 = 192.475(万条)
A3区:20 × 7.589 = 151.78(万条)
A4区:30 ×7.901 = 237.03(万条)
3.行业类推行业类推是根据领先的行业市场状况类推滞后的行业市场,多用于新产品开发预测,以相近行业的类似产品的发展变化情况,来推断新产品的发展方向和变化趋势。
4.局部总体类推局部总体类推,即以局部推断总体。一般在应用上可以用某一个企业的普查资料或某一个地区的抽样调查资料为基础,进行分析、判断、预测和类推某一行业或整个市场的发展变化趋势。下面用一案例说明该法的应用:
例如,A市烟草公司所辖地区有750万人,为了预测明年全市卷烟销售量,公司的经济运行处选择辖区综合消费、经济发展处于全地区中等水平的B县进行调查统计。经调查,B县有100万人,预测明年全县销售卷烟770万条,请用对比类推法中的局部总体类推法,根据B 县情况预测A 市明年的卷烟销售量。
分析提示:
(1)确定预测目标。这里的预测目标是A市明年的卷烟销售量。
(2)收集整理资料,进行分析判断。根据调查,下辖的B 县综合消费、经济处于全地区中等水平,有100万人,预测明年全县销售卷烟770 万条,从而求得:
B 县明年人均卷烟消费量预测值=销售量÷人口数=770÷100 = 7.7 (条/人)
(3)运用局部总体类推法的原理,以明年B 县人均卷烟消费量作为A 市明年人均年卷烟销售水平,即明年A 市人均卷烟消费量为7.7 条,则可以预测
A 市明年的卷烟销售量:
A 市明年的卷烟销售量=A 市人均年卷烟销售量×人口数=7.7 ×750 = 5 775 (万条)
四、因果分析
(一)因果分析的含义和特点
因果分析,是一种探寻现象之间因果关系的方法。因果联系是客观事物之间普遍存在的一种现象。客观事物之间的因果联系具有如下一些特点:一是因果联系具有先后相继性,因果联系总是原因在前,结果在后。但是,两个先后相继的现象并不一定存在着因果联系。二是因果联系具有必然性,只要在相同的条件下,同样的原因会产生同样的结果。三是因果联系具有复杂性,有一因一果、一因多果、多因一果、多因多果等多种情况,因而认识现象间的因果联系是一个十分复杂的过程。
(二)因果分析的方法
客观事物之间存在这样一种关系:事物A是事物B的原因,事物B是事物A的结果。进一步说,事物A的变化引起事物B的变化,事物A由于事物B的变化而变化。人们称这种关系为因果关系,分析因果关系的方法称为因果分析方法,或因果关系分析方法。
因果关系是事物之间普遍存在的一种关系,正因为有因果关系的普遍性这个客观基础,因此因果分析法是我们在社会调查中一种常用的理论分析方法。形式逻辑和唯物辩证法是研究因果联系的最一般的方法。
1.形式逻辑因果分析法1872年,英国哲学家、逻辑学家穆勒总结了从洛克到他所在的时代以来的认识经验,提出了探寻因果关系的五种方法:求同法、求异法、求同求异法、共变法、剩余法水延凯.社会调查教程[M].4版.北京:中国人民大学,2007,6:355358.。
(1)求同法。首先列举这一现象出现的多个事例,然后分析每个事例的各种先行情况(或条件),如果在各种事例中只有一种先行情况是共同的,那么可以认为这一先行情况就是这一现象出现的原因。特点是“异中求同”,它所依据的主要方法是经验观察,因而其结论只能是一种或然性的结论,它不能保证结论的必然正确。为了提高结论的可靠程度,运用求同法时,应有足够多的事例,否则就不能使用求同法。
例如,某单位的三个仓库里都放有未熟的苹果,他们未做任何处理,一段时间后都自动变熟了。什么原因呢?他们对三个仓库的温度、湿度、通风等条件作了考察,发现这些条件都不相同,唯一相同的是都同时放有成熟的苹果,于是推断:成熟的苹果可能与生苹果变熟有因果联系,这个结论是运用求同法得出的。
求同法的公式是:
场合先行情况被研究现象
 
1A,B,Ca
 
2A,D,Ea
 
3A,F,Ga
 
所以A可能是a的原因
(2)求异法(差异法)。如果在考察某一被研究对象出现的事例与不出现的事例时,只有一种先行情况不同,其他先行情况都相同,并且当这种先行情况存在时,被研究现象就出现,当它不存在时,被研究现象就不出现,那么就可以认为这一先行情况是被研究现象出现的原因。特点是“同中求异”,由于它是从先行情况的有无两个方面进行考察的,因而较之求同法优越,其结论的可靠程度相对较高。但它的前提和结论的联系依旧是或然的,与求同法一样,有可能把真正的原因忽略掉。
例如,选两块相邻的土地,它们的土壤成分、地势高低等情况相同,在浇水、施肥、防治病虫害和田间管理等措施上也大体相同,不同的是一块田地选用优良麦种,另一块田地用的仍是普通麦种,结果选用优良麦种的那块田地收成好,另一块田地则收成不好。由此可以得到结论:选用优良麦种是麦田收成好的重要原因。
求异法的公式是:
场合先行情况 被研究现象
 
1A,B,C,D,Ea
 
2—,B,C,D,E—
 
所以A可能是a的原因
(3)求同求异法。如果在出现所研究的现象的若干场合(第一组)中,只有一个情况相同,而在所研究现象不出现的若干场合(第二组)中,却没有出现这个情况,其他情况不尽相同,那么,这个情况可能是所研究现象的原因。求同求异法是把求同法与求异法结合起来运用,其正反场合使用的事例越多越好,场合越多,可靠性也就越高。当然仍只具有或然性。
求同求异并用法的公式是:
正面场合先行情况被研究现象
 
1A,B,Ca
 
2A,D,Ea
 
3A,F,Ga
 

 
反面场合先行情况被研究现象
 
1—,B,M,N—
 
2—,C,Q,R—
 
3—,D,Q,P—
 
 
 
所以A 可能是a的原因
(4)共变法。在其他先行情况都相同、只有一种情况不同的条件下,当这一情况发生变化时,被研究现象也随之发生变化。那么可以认为这一先行情况是被研究现象的原因。其特点是在变化中求因。共变法比求同法和求异法有更多的优点:共变法不但能探寻原因,还能找出因果的数量关系;共变法较求异法更简单,只要共变,便可得出结论,不必像求异法那样要从无到有,比较有、无两个方面。但是,但共变关系不一定是因果关系共变法的结论也是或然性的。
共变法的公式是:
场合先行情况研究现象
 
1A1,B,C,Da1
 
2A2,B,C,Da2
 
3A3,B,C,Da3
 

 
所以A 可能是a的原因
(5)剩余法。是找出某一被研究对象的一组可能的原因,一一研究后,除了一个外,其他情况都不是被研究现象的原因,于是剩下的原因就是引起被研究现象的可能原因。剩余法的特点是“从余果求余因”,剩余法的结论也只具有或然性。
剩余法的公式是:
被研究的复合现象a,b,c,d的复合原因是A,B,C,D。
已知B是b的原因
已知C是c的原因
已知D是d的原因
所以A可能是a的原因
上述五种方法都是探索因果联系的有效方法,但他们的结论都只具有或然性。五种方法实际运用时,往往相互补充,交互使用。
2. 唯物辩证法的因果分析因果联系在时间顺序上,总是原因在先,结果在后,而不会出现相反的情况。但是,先后相随的联系并不一定都是因果联系。例如,白天黑夜先后交替、春夏秋冬前后相随就不是因果联系,地球自转和围绕太阳公转才是它们相继出现的真正原因。这说明,先后联系仅仅是因果联系的必要条件,而不是因果联系的充分必要条件。
唯物辩证法认为,世界上的一切现象都是由某种或某些现象所引起的,因果联系的本质就是引起和被引起的联系。其中,引起某一现象的现象叫原因,而被某种现象引起的现象叫结果。这种引起和被引起的联系,才是因果联系的充分必要条件。
在唯物辩证法看来, 要判明社会现象之间的因果联系,除了要揭示社会现象之间引起和被引起的联系外,还应该把握以下几个要点:
(1)因果联系是有条件的、相对的;
(2)因果联系是特指的、对应的;
(3)因果联系是对称的、相当的,即只有特定性质和规模的原因,才能引起特定性质和规模的结果;反之,特定性质和规模的结果,也只能被特定性质和规模的原因所引起;
(4)因果联系是多样的、特殊的。
一般地说,因果联系有以下几种基本类型:
①一因多果,同因异果,即一种原因同时引起多种结果,同一原因在不同条件下引起不同结果。
②一果多因,同果异因,即一种结果由多种原因引起,同一结果在不同条件下由不同原因引起。
③多因多果,复合因果,即原因和结果都不是单一的,而是复合的。
在分析因果联系时,不仅要注意社会现象之间引起和被引起的关系,而且要注意分析不同事物、不同条件下因果联系的多样性和特殊性。只有实事求是地分析、揭示各种各样因果联系的不同特点,才能得出符合实际的科学结论。
五、结构功能分析
结构功能分析法,就是运用系统论关于结构与功能相互关系的原理来分析社会现象的思维方法。结构功能分析法的主要内容是:结构分析法、功能分析法,以及黑箱方法、灰箱方法和白箱方法。
(一)结构功能理论的基本观点
系统结构,是指系统内部诸要素之间的联系方式;系统功能,则是指系统与外部环境相互联系、相互作用的能力。
结构功能理论认为,任何社会事物都是由一定组成部分或要素构成的,这些部分或要素组成了一个社会系统,它们之间相对稳定的联系就是这一系统的结构。每一系统要存在和发展下去,就必须满足一些基本的条件或需求,这些条件或需求是由系统的某一特定部分来满足的,换句话说,系统组成部分担负着特定的社会功能。在此分析基础之上,结构功能理论认为每一社会现象的产生、发展和变化,都是与它担负的社会功能紧密相关的。
结构与功能的相互关系是:结构说明系统内部的联系和作用,功能说明系统外部的联系和作用;一方面结构决定功能,有什么样的结构就有什么样的功能,结构的改变也必然引起功能的改变,结构的有序化也促进了功能的有序化。另一方面,功能也制约、影响结构的变化。事物原有功能的强化、削弱、丧失以及某种新功能的产生,会导致事物原有结构发生变化。一个和尚、两个和尚、三个和尚的道理可以清晰地说明之间的转化。
一个系统总是处于动态平衡过程中,如果结构在内外因素的作用下发生失调,也会刺激结构自身重新调整。社会系统结构的改变必然引起社会功能的改变,社会系统结构的有序化则促进功能的有序化。进行结构功能分析,应该是动态的而不是静态的。
结构分析法,就是通过剖析系统内在结构来认识系统特性及其本质的思维方法。例如人口结构的研究,所使用的思维方法都是结构分析法。这说明,结构分析法具有广泛适用性和普遍指导意义。为了弥补结构分析法的不足,随着系统论、信息论、控制论的发展,功能分析法就得到了日益广泛的重视和应用。
功能分析法,就是通过系统与环境之间“输入”和“输出”的关系来判断系统内部状况及其特性的思维方法。所谓功能就是把特定的“输入”转化为特定的“输出”的能力。通过对这种转化能力的分析,就可以对系统内部结构及其特性形成一定的认识。
结构分析法,通常称为“内描述方法”,它是一种静态研究方法;功能分析法,通常称为“外描述方法”,它是一种动态研究方法。这两种方法,可以分别使用,也可以结合起来使用。只有既对系统进行静态“内描述”研究,又对系统与环境的关系进行动态“外描述”研究,并把两者结合起来的方法,才能算是完整的结构功能分析法。
(二)结构功能分析的主要内容
功能分析的关键,主要包括以下几个方面的内容:
(1)系统结构和功能的承载物。系统结构和功能的承载物,也就是分析对象。同时,还应该进一步明确是就分析对象的哪些方面进行分析。
(2)系统的内部结构和功能。系统的内部结构是指系统内部各组成要素间在形式上的排列和比例。内部功能分析的内容包括三方面:一是内部功能关系的性质,即各组成要素之间是相互影响、相互作用,还是某一因素影响和作用于另一因素;二是内部功能建立与存在的必要条件,即在满足什么样的条件时,各要素间的相互影响和作用才能存在和建立起来;三是满足内部功能的机制,即促使各要素之间发生相互影响和相互作用的手段和方法。
(3)系统整体和各组成部分的特征。进行结构功能分析,不仅要分析系统每一部分的特点以及它对整个系统和其他部分的作用和影响;而且需要分析系统的整体特征,但整体特征并不等同于各个组成部分的特征的总和。
(4)系统的外部结构和功能。系统外部结构和功能分析,主要包括三部分的内容:一是系统在其外部环境中所处的位置;二是它对外部环境的影响和作用;三是系统外部功能的性质。
(三)结构功能分析的一般步骤
在调查资料的理论分析中运用结构功能分析方法,一般按下列步骤进行:
第一步,将所研究的现象置于一定的社会系统之中,说明这一系统的内部结构与外部结构,分析这一现象在社会系统中的地位和作用,分析它对社会运行和社会发展具有何种功能。
第二步,从性质上和数量上分析这一现象与其他现象的相互联系、相互影响和相互制约的关系。
第三步,结合各种分析,对所研究现象作出说明和解释。包括说明和解释所研究现象是如何产生的,是必然的还是偶然的,所研究现象与社会结构的哪些部分“配套”等。
六、归纳、演绎推理
(一)归纳推理
归纳是由个别、特殊到一般的思维方法。归纳推理的方法是,首先产生一系个别的前提,然后把这些前提与其他前提结合在一起,以形成结论。这些个别的前提可以从观察、实验、调查中获得。
例如某市在卷烟消费品牌调查表明,在500个被调查者中,有200人购买A牌卷烟。根据这200个个别的发现,可以得出下面的结论:大约有40%的消费者购买A牌卷烟。
在归纳推理法中,任何结论都是从观察、实验或调查的事实中得出的。社会或市场调查中通过对大量个体的调查和研究得出一般性结论的方法,就是归纳推理方法。
归纳法可分为完全归纳法、不完全归纳法。
完全归纳法就是根据某类事物中每个对象都具有(或不具有)某种属性,从而概括出该类事物的全部对象都具有(或不具有)某种属性的方法。
运用归纳法,有时不可能将全部对象列举出来,所列举的作为前提的事例只是一类事物里的一部分对象,这就是不完全归纳法。它又分为简单枚举法和科学归纳法两种形式。
简单枚举法是根据某一属性的重复出现,又没有遇到相反的事例而推论出该类事物都具有(或不具有)某种属性的方法。简单枚举法的结论容易犯“轻率概括”“以偏概全”的错误。为了提高其可靠性,应尽可能多地占有材料,同时注意搜集可能出现的反面事例。
科学归纳法是一种建立在对事物发展的内在联系和规律性认识的基础上进行的归纳。是根据某类事物中的部分对象与某种属性之间所产生的某种联系而推出结论的不完全归纳法。科学归纳法,不仅使人们的认识由个别扩展到一般,而且使人们既知其然又知其所以然,它的结论是带必然性的。因此,它在调查资料的理论分析中运用得较为广泛。
如,我们发现不同地区、不同国家中大量农村人口向城市集中的现象资料,就要进一步研究在这种现象背后,隐藏着什么原因。当我们通过研究,认识到工业化的发展要求为之服务的第三产业的发展,工业的集中性要求有一种能够满足这种需求的社区形式时,我们就可以科学地归纳出,随着工业化水平的提高,城市化是不可避免的必然趋势。
(二)演绎推理
演绎推理方法是从一般的前提推出个别结论的方法。在资料的理论分析中,可以利用已经获得的一般知识,去指导对同类的新的个别事物的认识。演绎推理一般包含两个前提,一个前提代表一般原理,叫大前提;一个前提代表某种事实同一般原理的关系,叫小前提。由大前提、小前提到结论,是用一般的原理推断特殊的事实。
例如烟草含有害物质(大前提),烤烟是烟草(小前提),烤烟含有害物质(结论)。演绎推理过程包括一系列的语句,其中最后一句是结论,它是从前提逻辑地推理出来的。前提的正确性决定结论的正确性。
例如存款利率下降时,居民储蓄存款会减少(大前提),2009年2月,存款利率降低(观察到的事实,小前提),因此,银行存款额将会减少(结论)。
例如某市40%的消费者购买A牌卷烟(大前提),预计明年该市卷烟消费量为100万大箱(事实预测,小前提),明年该市A牌卷烟销售量可能是40万大箱(结论)。在上述两个例子中,结论是从大前提和小前提逻辑推理出来的。
但实际结果常常与上面的结论有一些差别,有时甚至差别很大。例如,虽然存款利率下降,但人们对未来预期不乐观,在医疗、保险、教育、住房等方面需要很大的支出,因此,银行的存款可能不会下降,反而会上升。又如,由于A 牌卷烟竞争对手实力的增强、卷烟质量的提高、产品价格的下降,结果使得在100万大箱的卷烟消费量中,A牌卷烟消费量只有30万大箱。因此,尽管演绎推理法可用在资料分析中,但必须明白其使用的前提常常是较脆弱的,不能作为制定经营决策的唯一参考依据。
归纳法和演绎常是相互作用的。演绎方法中的前提常是从归纳推理中得出的。比如通过归纳推理得出结论“春天是旅游旺季”可以作为演绎推理的前提,因为这个归纳结论是通过观察数年来每年各季节旅游人数而得出的。
在使用推理方法时,要建立适当的证据,使从这些证据推导出的结论更富有逻辑性。这种逻辑过程不仅对研究者是明显的,对任何其他人也应是明显的。演绎推理方法中的前提必须是有效的,而在归纳推理方法中的前提则需要充分的依据。
【案例引入】
 
SIM手机描述性统计分析关于描述性统计分析:http://www.ltesting.net/TestTech/PT/200702/1557.htm.
为简化起见,我们只分析SIM手机用户满意调查中的两个变量:“总体感知质量”和“总体满意度”变量。
(1)数据的频数分析
用SPSS软件的频数分析可以很容易地画出两个变量的频数图:
 
两个变量的频数图表明:大部分被调查者对SIM手机的质量评价较高,总体感觉比较满意,打分在8~10分。
(2)数据的集中趋势分析
利用SPSS的描述性统计分析,计算SIM手机“总体感知质量”和“总体满意度”的平均值、中位数和众数:
 
 
总体感知质量总体满意度
人数200200
平均数7.117.43
中数88
众数88
共有200个(N)被调查者参与了SIM手机调查;总体感知质量均值(Mean)7.11分、中位数(Median)8分、众数(Mode)8分;总体满意度均值7.43分、中位数8分、众数8分,与前面的频数分析结果一致。
(3)数据的离散程度和分布分析
同样利用SPSS软件的描述性统计分析,可以得出SIM手机的离散程度和分布指标:
 
总体感知质量总体满意度
人数200200
标准差2.362.29
方差5.565.25
偏度-0.961-0.988
峰度0.3580.437
 “总体感知质量”变量的标准差(Std. Deviation) 2.36、方差(Variance) 5.56;“总体满意度”标准差2.29、方差5.25,说明不同样本对两个变量打分的差异程度不大,或者说不同样本对SIM手机评价的差异不大。“总体感知质量”变量的偏度(Skewness)-0.961、峰度(Kurtosis)0.358;“总体满意度”变量偏度-0.988、峰度0.437,说明数据不符合正态分布。
【拓展训练】
围绕选题对审核整理后的调查资料进行理论分析。
 
 

关于我们|帮助中心|广告服务|友情链接|版权申明|在线客服|返回顶部|管理登陆

版权所有 © 2012-2018 南通三角洲文化发展有限公司   网址:http://www.chinawmw.net/    苏ICP备12017549号
建议使用1024*768分辨率及IE6.0以上浏览器对本站进行浏览
在线咨询:    QQ 2692605222   Email:bryshj@chinawmw.net

严正声明:中国文秘教育网(www.chinawmw.net)是原创作品的自由交流平台,欢迎会员踊跃投稿,拒绝平庸之作,严格遵守学术道德,禁止抄袭和复制他人文稿,如有被本网接受录入非其所有的原创作品,或作品内容违反有关规定,一经发现取消本站会员资格,并在本网站通告处理。本网不承担任何责任,但保证在接到投诉并经验证属实后,于第一时间内删除该作品。

中国文秘教育网(www.chinawmw.net)的作品源自文秘教育界一群顶尖级文秘教育名家、博士、教授、文秘专业教学名师及优秀文秘学生、秘书行业名家和一线秘书提供的高质量原创稿源,仅供个人学习、研究、探讨之用,严禁其他用途或商业传播,若因此造成损失,中国文秘教育网在保留追究用户的法律责任的前提下终止对用户提供的所有服务,并且没收相关账号内的点数及会员资格。

中国文秘教育网(www.chinawmw.net)将努力成为自觉遵守学术道德的示范网站。

谢谢合作!

Welcome To www.chinawmw.net!中国文秘教育网是创造资源财富,实现资源价值,增强个人才能的好地方!

苏公网安备 32060202000162号