统计学原理总论、统计调查、统计整理

统计有时指统计工作,即统计实践活动,是对社会经济现象的数量方面进行搜集、整理和分析的全过程;统计有时指统计资料,即通过统计工作过程所取得各项数据资料和与之相关的其他实际资料;统计有时指统计科学,即关于认识客观现象数量特征和数量关系的原理原则和方式方法的科学。

统计的三种涵义是密切联系的。统计工作和统计资料是统计活动和统计成果的关系,统计学和统计工作是理论和实践的关系。

社会经济统计学的研究对象是社会经济现象总体的数量特征和数量关系,通过这些数量方面的研究反映社会经济现象发展变化的规律性。统计学和统计工作是理论和实践的关系,它们所要认识的研究对象是一致的。

统计总体是根据统计研究的任务目的所确定的研究事物的全体,是客观存在的具有共同性质的个体所构成的整体。

在一次特定范围、目的的统计研究中,统计总体与总体单位是不容混淆的,二者的含义是确切的,是包含与被包含的关系。但是随着统计研究任务、目的及范围的变化,统计总体和总体单位可以相互转化。

统计总体同时具有大量性、同质性、变异性等特点。大量性是指构成总体的总体单位数要足够的多,总体应由大量的总体单位所构成,大量性是对统计总体的基本要求;同质性是指总体中各单位至少有一个或一个以上不变标志,即至少有一个具有某一共同标志表现的标志,使它们可以结合起来构成总体,同质性是构成统计总体的前提条件;变异性就是指总体中各单位至少有一个或一个以上变异标志,即至少有一个不同标志表现的标志,作为所要研究问题的对象。变异性是统计研究的重点。

标志是说明总体单位所共同具有的属性和特征的名称。标志有品质标志和数量标志之分。品质标志说明总体单位的属性特征,无法量化,如职工的性别、文化程度,企业的经济成分,产品品牌等。数量标志说明总体单位的数量特征,能够量化,如职工的工龄、工资水平,企业的职工数、总产值、总产量、劳动生产率等。

总体单位与统计标志是有区别的。总体单位是统计标志的直接承担者,是载体;统计标志依附于总体单位并说明总体单位的属性和特征。依附于某个总体单位的标志可以有多个。

标志表现即标志特征在各单位的具体表现。如果说标志是统计所要调查的项目,那么标志表现是调查所得结果,标志的实际体现。

标志表现有品质标志表现和数量标志表现之分。品质标志表现只能用文字表述,因此不能转化为统计指标,但对其对应的单位进行总计时就形成统计指标。数量标志表现是一具体数值,也称标志值。

就一个品质标志或数量标志而言,其具体表现可能多种多样,不能将标志与标志表现混为一谈。如对三个工人的月工资计算平均数,只能说是对三个标志表现或三个标志值(变量值)计算平均数,不能说对三个数量标志计算平均数,因为数量标志只有一个,即工人“月工资”。

如果某一标志的具体表现在总体各单位相同,则称该标志为不变标志;如果某一标志的具体表现在各单位不尽相同,则称该标志为可变标志。可变标志的标志表现由一种状态变到另一种状态,统计上把这种现象或过程称变异。变异是一种普遍现象,有变异才有必要进行统计。

变量按其数值是否连续可分为连续性变量和离散性变量。连续性变量的数值是连续不断的,任意两个变量值之间可以做无数种分割,如工业总产值、商品销售额、身高、体重等,既可用小数表示,也可用整数表示;离散变量的取值可以按一定次序一一列举,如工厂数、工人数、机器台数等,变量值通常用整数表示。

正确理解统计指标时应注意:①统计指标反映现象总体的数量特征;②一个完整的统计指标应该由总体范围、时间、地点、指标数值和数值单位等内容构成。

② 指标具有可量性,无论是数量指标还是质量指标,都能用数值表示,而标志不一定。数量标志具有可量性,品质标志不具有可量性。

数量指标是反映现象总规模水平或工作总量的指标,也称总量指标,一般通过数量标志值直接汇总而来,用绝对数表示,指标数值均有单位;质量指标是反映现象总体相对水平或工作质量的统计指标,又分为相对指标和平均指标,分别用相对数和平均数表示,它们通常是由两个总量指标对比派生出来的,反映现象之间内在联系和对比关系。

数量指标和质量指标的关系表现在:数量指标是计算质量指标的基础,质量指标往往是相应的数量指标进行对比的结果。

统计指标体系是各种互相联系的指标群构成的整体,用以说明所研究的社会经济现象各方面互相依从和互相制约的关系。一个指标的作用总是有限的,它只能反映现象总体的某一侧面,只有使用指标体系才能反映现象总体全貌。

统计调查是按照预定的统计任务,运用科学的方法,有组织有计划地向客观实际搜集资料的过程。统计调查既是对现象总体认识的开始,也是进行资料整理和分析的基础环节。

统计调查既是对现象总体认识的开始,也是进行资料整理和分析的基础环节。统计调查的基本任务是取得反映社会经济现象总体全部或部分单位以数字资料为主体的信息。

统计调查方案是调查工作有计划、有组织、有系统进行的保证。统计调查方案应确定的内容有:调查目的、调查对象、调查项目、调查表、调查时间和调查时限、调查的组织工作。

确定调查目的是任何一项统计调查方案首先要解决的问题。不同的调查目的需要不同的调查资料,不同的调查资料又有不同的搜集方法。调查目的明确了,搜集资料的范围和方法也就确定下来了。

调查对象即统计总体,是根据调查目的所确定的研究事物的全体。统计总体这一概念在统计调查阶段称调查对象。

在确定调查对象时,还必须确定调查单位和报告单位。调查单位也就是总体单位,它是调查对象的组成要素,即调查对象所包含的具体单位。调查对象和调查单位的概念不是固定不变的,随着调查目的的不同二者可以互相变换。

报告单位也称填报单位,也是调查对象的组成要素。它是提交调查资料的单位,一般是基层企事业组织。

调查单位是调查资料的直接承担者,报告单位是调查资料的提交者,二者有时一致,有时不一致。如工业企业生产经营情况调查,每一工业企业既是调查单位,又是报告单位;工业企业职工收入状况调查,每一职工是调查单位,每一工业企业是报告单位。

确定调查项目时,首先应注意所选择的项目能够取得确切资料,其次注意所选择的项目应有确切的涵义和统一解释,另外要注意各项目之间的联系和衔接,便于核对和分析。

调查表有单一表和一览表两种形式。单一表是一个调查单位填写一份表格,可以容纳较多的项目。一览表是许多调查单位共同填写一份表格,在调查项目不多时较为简便,且便于合计和核对差错。为了正确填写调查表,须附有填表说明和项目解释。

调查时间指调查资料所属时间。如果调查的是时期现象,调查时间是资料所反映的起讫时间,也称客观时间。如果调查的是时点现象,调查时间是统一规定的标准时点。调查时限是进行调查工作的期限,包括搜集资料和报送资料的整个工作所需要的时间,也称主观时间。如某管理局要求所属企业在1996年1月底上报95年工业总产值资料,则调查时间是一年,调查时限是一个月;又如某管理局要求所属企业在96年1月10日上报95年产成品库存资料,则调查时间是标准时间1995年12月31日,调查期限是10天。

统计报表是国家统计系统和专业部门为了定期取得系统、全面的统计资料而采用的一种搜集资料的方式,目的在于掌握经常变动的、对国民经济有重大意义的指标的统计资料。专门调查是为了了解和研究某种情况或问题而专门组织的统计调查,包括抽样调查、普查、重点调查和典型调查等几种调查方法。

全面调查是对构成调查对象的所有单位进行逐一的、无一遗漏的调查,包括全面统计报表和普查;非全面调查是对调查对象中的一部分单位进行调查,包括非全面统计报表、抽样调查、重点调查和典型调查。

连续调查是指对研究对象的变化进行连续不断的登记,如工业企业总产值、产品产量、原材料消耗量等,在观察期内连续登记。连续调查所得资料是现象在一段时间内的总量。不连续调查是指间隔一段相当长的时间对研究对象某一时刻的资料进行登记。如人口数、机器设备台数等资料短期内变化不大,没有必要连续登记资料。不连续调查所得资料体现现象在某一瞬间所具有的水平。

直接调查又称直接观察,由调查人员到现场对调查单位直接查看、测量和计量;凭证调查是以各种原始和核算凭证为调查资料来源,依照统一的表格形式和要求,按照隶属关系,逐级向有关部门提供资料的方法;采访调查是通过指派调查员对被调查者询问、采访,提出所要了解的问题,借以搜集资料;问卷调查是以问卷形式提问。

所谓经常性调查是指调查周期在一年以内的调查,间隔超过一年的为一次性调查。这种划分和调查对象没有关系,不要把经常性调查误以为是全面调查,也不要误以为经常性调查就是调查时期现象,而一次性调查就是调查时点现象。

常用的统计调查方法有统计报表、普查、抽样调查、重点调查、典型调查等,它们各有其特点。1994年全国统计工作会议提出要建立以必要的周期性普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和少量的全面报表综合运用的统计调查方法体系。

统计报表是按国家统一规定的表式,统一的指标项目,统一的报送时间,自下而上逐级定期提供基本统计资料的调查方式方法。我国大多数统计报表要求调查对象全部单位填报,属于全面调查范畴,所以又称全面统计报表。

目前我国统计报表,是由国家统计报表、业务部门统计报表和地方统计报表组成,其中国家统计报表是统计报表体系的基本部分。

普查是专门组织的不连续性全面调查。主要调查一定时点状况的社会经济现象的总量,搜集那些不能够或者不适宜用定期全面报表搜集的统计资料,以搞清重要的国情国力。

普查的组织形式有两种:一是组织专门的普查机构,配备一定数量的普查人员,对调查单位直接进行登记;另一种是利用普查单位的原始记录和核算资料,颁发一定的调查表格由调查单位自填上报。

普查按资料汇总的特点分为一般普查和快速普查。前者逐级上报资料,后者越过中间环节,由基层单位将资料直接报送给最高领导机关。

普查和全面统计报表都属于全面调查,但二者并不能互相代替。普查属于不连续调查,调查内容主要是反映国情国力方面的基本统计资料;而全面统计报表属于连续调查,调查内容主要是需要经常掌握的各种统计资料。全面统计报表要经常填报,因此报表内容固定,调查项目较少;而普查是专门组织的一次性调查,在调查时可以包括更多的单位、分组更细、项目更多。因此,有些社会经济现象不可能也不需要进行经常调查,但又需要掌握比较全面、详细的资料时,就可通过普查来解决。普查花费的人力、物力和时间较多,不宜经常组织,取得经常性的统计资料还需要靠全面统计报表。

抽样调查的特点: ① 既是非全面调查,又要达到对总体数量特征的认识; ② 按随机原则去抽取调查单位。

抽样调查的作用:一是能够解决全面调查无法或难以解决的问题;二是可以补充和订正全面调查的结果,三是可用于生产过程中产品质量的检查和控制,四是可用于对总体的某种假设进行检验。

重点调查的关键是选择好重点单位。所谓重点单位,是从标志量的方面而言的,尽管这些单位在全部单位中只是一部分,但这些单位的某一主要标志量占总体单位标志总量的绝重。对这些单位进行调查,就可以了解调查对象的基本情况。

重点调查中重点单位的选择着眼于标志量的比重,因而重点单位的选择具有客观性。当调查目的是掌握现象的基本情况,而部分单位又能比较集中地反映所研究的项目和指标时,可用重点调查。重点调查可以定期进行,也可以不定期进行,重点调查实际上是范围比较小的全面调查, 它的目的是 反映现象总体的基本情况。

抽样调查和重点调查都是专门组织的非全面调查,具有调查单位少,省时省力的特点,在选取调查单位时不受主观因素的影响。但二者之间有明显的区别:首先是调查单位的意义和取得方式不同,重点调查是选择为数不多但标志量占总体标志总量绝重的单位进行调查;抽样调查中的样本单位是按照随机原则从研究总体中抽取的、具有较高代表性。其次,二者研究目的不同。重点调查是为了了解现象总体的基本情况,但不能推断总体总量;抽样调查的目的在于以样本量来推断总体总量。再次,适用场合不同。重点调查适用于部分单位能比较集中地反映所研究的项目或指标的场合;抽样调查最适合于不能或很难进行全面调查,而又需要全面数值的场合,在能进行全面调查的场合也有独到的作用。

典型调查是根据调查的任务目的,对所研究的现象总体进行初步分析的基础上,有意识的选择若干具有代表性的单位进行调查,借以认识事物发展变化的规律。

典型调查的特点一是深入细致的调查,既可以搜集数字资料,又可以搜集不能用数字反映的实际情况;二是调查单位是有意识的选择出来的若干有代表性的单位,它更多地取决于调查者的主观判断和决策。

典型调查和重点调查相比,前者调查单位的选择取决于调查者的主观判断,后者调查单位的选择具有客观性;前者在一定条件下可以用典型单位的量推断总体总量,后者不具备用重点单位的量推断总体总量的条件。

不同的统计调查的方式方法,各有其特点和作用。在实际工作中,并非单用一种方式方法,而是多种方式方法的结合运用。这是因为: ① 国民经济和社会发展情况复杂,国民经济门类众多,必须应用多种多样的统计调查方法,才能搜集到丰富的统计资料; ② 任何一种统计调查方法,都有它的优越性与局限性,各有不同的实施条件,只用一种统计调查方法,不能满足多种需要。

根据统计研究的任务与要求,对统计调查所搜集到的原始资料进行分组、汇总,使其条理化、系统化的工作过程称统计整理。统计整理包括对原始资料和次级资料的整理。

通过统计调查所取得的总体各单位的资料是零星的,分散的,只能说明总体单位的情况,而不能反映总体特征。统计整理对调查资料进行科学加工,使之系统化,成为说明总体特征的综合资料,实现了由反映总体单位特征的标志向反映总体综合数量特征的统计指标的转化,是从对社会经济现象个体量的观察到对社会经济现象总体量的认识的连接点,是人们对社会经济现象从感性认识到理性认识的过渡阶段。统计整理在整个统计工作中发挥着承上启下的作用。

分组是根据研究任务的要求,对调查所得的原始资料,确定哪些分组或分类。统计分组是统计整理的关键。

汇总是在统计分组的基础上,把总体单位各种标志的标志值汇总起来,汇总主要有手工汇总和电子计算机汇总。

4、统计整理的内容和步骤:(1)确定应整理的指标和确定应分的组;(2)对各项指标进行汇总,确定各组和总体的单位数和标志总量;(3)用统计表现分组、汇总的结果。

根据统计研究任务的要求和研究现象总体的内在特点,把现象总体按某一标志划分为若干性质不同但又有联系的几个部分称统计分组。

总体的变异性是统计分组的客观依据。统计分组是总体内进行的一种定性分类,它把总体划分为一个个性质不同的范围更小的总体。

①统计分组按其任务和作用不同,分为类型分组、结构分组和分析分组。类型分组的目的是划分经济类型,结构分类的目的是研究同质总体的构成,分析分组的目的是研究现象总体内部诸标志间的依从和制约关系。

②统计分组按分组标志的多少分为简单分组和复合分组。简单分组是将总体按一个标志进行分组,复合分组是将总体按两个或两个以上的标志重叠起来进行分组。

③统计分组按分组标志的性质分为品质分组和变量分组。品质分组是将总体按品质标志进行分组,如企业按经济成分、地理位置分组,职工按性别、文化程度分组等;变量分组是将总体按数量标志进行分组,如企业按职工人数、劳动生产率分组,职工按工龄、工资分组等。

统计分组后所形成的一系列互相联系、互相补充的组的整体称分组体系。分组体系有平行分组体系和复合分组体系两种。平行分组体系是选择两个或两个以上的标志对总体进行一次次简单分组后所形成的体系;复合分组体系就是复合分组后形成的体系。

分组标志的选择是统计分组的关键。分组标志,即将同质总体区分为不同组的标准或依据。分组标志一旦选定,就必然突出了总体在该标志下的性质差别,其他的差别看不见了。分组标志选择不当,不但无法显示现象的根本特征,甚至会混淆事物的性质,歪曲社会经济的真实情况。

正确选择分组标志,必须根据统计研究的任务目的,抓住反映现象本质区别和内在联系的标志作为分组标志。

品质标志分组一般较简单,分组标志一旦确定,组数、组名、组与组之间的界限也就确定。有些复杂的品质标志分组可根据统一规定的划分标准和分类目录进行。

按数量标志分组的目的并不是单纯确定各组在数量上的差别,而是要通过数量上的变化来区分各组的不同类型和性质。数量标志分组方法从以下几个方面来说明:

对离散变量,如果变量值的变动幅度小,就可以一个变量值对应一组,称单项式分组。如居民家庭按儿童数或人口数分组,均可采用单项式分组。

离散变量如果变量值的变动幅度很大,变量值的个数很多,则把整个变量值依次划分为几个区间,各个变量值则按其大小确定所归并的区间,区间的距离称为组距,这样的分组称为组距式分组。

也就是说,离散变量根据情况既可用单项式分组,也可用组距式分组。在组距式分组中,相邻组既可以有确定的上下限,也可将相邻组的组限重叠。

连续变量由于不能一一列举其变量值,只能采用组距式的分组方式,且相邻的组限必须重叠。如以总产值、商品销售额、劳动生产率、工资等为标志进行分组,就只能是相邻组限重叠的组距式分组。

在相邻组组限重叠的组距式分组中,若某单位的标志值正好等于相邻两组的上下限的数值时,一般把此值归并到作为下限的那一组(适用于连续变量和离散变量)。

组距式分组使资料的真实性受到一定程度的损害。组距式分组的假定条件是:变量在各组内的分布都是均匀的(即各组标志值呈线性变化)。

通过组距式分组以后,把各组内部各单位的次要差异抽象去了,而把各组之间的主要差异突出出来,这样,各组分配的规律性可以更容易显示出来。根据这个道理,如组距太小,分组过细,容易将属于同类的单位划分到不同的组,因而显示不出现象类型的特点;但如果组距太大,组数太少,会把不同性质的单位归并到同一组中,失去区分事物的界限,达不到正确反映客观事实的目的。因此,组距的大小、组数的确定应根据研究对象的经济内容和标志值的分散程度等因素,不可强求一致。

等距分组是各组保持相等的组距,也就是说各组标志值的变动都限于相同的范围。不等距分组即各组组距不相等的分组。

统计分组时采用等距分组还是不等距分组,取决于研究对象的性质特点。在标志值变动比较均匀的情况下宜采用等距分组。等距分组便于各组单位数和标志值直接比较,也便于计算各项综合指标。在标志值变动很不均匀的情况下宜采用不等距分组。不等距分组有时更能说明现象的本质特征。

组距两端的数值称组限。其中,每组的起点数值称为下限,每组的终点数值称为上限。上限和下限的差称组距,表示各组标志值变动的范围。

组中值是上下限之间的中点数值,以代表各组标志值的一般水平。组中值并不是各组标志值的平均数,各组标志数的平均数在统计分组后很难计算出来,就常以组中值近似代替。组中值仅存在于组距式分组数列中,单项式分组中不存在组中值。

组中值的计算是有假定条件的,即假定各组标志值的变化是均匀的(与组距式分组的假定条件相同)。一般情况下,组中值=(上限+下限)÷2

对于第一组是 “多少以下”,最后一组是“多少以上”的开口组,组中值的计算可参照邻组的组距来决定。即:缺下限开口组组中值=上限—1/2邻组组距,缺上限开口组组中值=下限+1/2邻组组距。

在统计分组的基础上,列出各组对应的单位数,形成总体单位数在各个组的分布,称统计分布,又称分配数列或次数分布。分配数列包括两个要素:总体按某标志所分的组和各组对应的单位数(频数)

分配数列包括品质分配数列和变量分配数列,分别由品质标志分组和数量标志分组形成。变量数列又有单项式数列和组距式数列,分别由单项式分组和组距式分组形成。

统计分组后各组对应的单位数称频数,也叫次数;各组单位数占总体单位总数的比重称频率。各组的频率大于0,所有组的频率总和等于1。

在变量分配数列中,频数(频率)表明对应组标志值的作用程度。频数(频率)数值越大表明该组标志值对于总体水平所起的作用也越大,反之,频数(频率)数值越小,表明该组标志值对于总体水平所起的作用越小。

有时为了更简便地概括总体各单位的分布特征,还需要编制累计频数数列和累计频率数列。累计有向上累计和向下累计的方法。向上累计是指将各组频数和频率由变量值低的组向变量值高的组累计,表明在这些数值以下所有数值所占的比重;向下累计是指将各组频数和频率由变量值高的组向变量值低的组累计,表明在这些数值以上所有数值所占的比重。

①钟型分布 特征是“两头大,中间小”,即靠近中间的变量值分布的次数多,靠近两边的变量分布次数少,形若古钟。

②U型分布 其特征与钟型分布正相反,靠近中间的变量值分布的次数少,靠近两端的变量值分布次数多,形成“两头大,中间小”的U字型分布。如人口死亡现象按年龄分布便是如此。

④洛伦兹分布 洛伦兹曲线专门用以检定社会收入分配的平等程度。洛伦兹曲线拓展可运用于其他社会经济现象,研究总体各单位标志分布集中状况或平均性。洛伦兹曲线又称集中曲线,其运作的条件是:现象总体各组频率与相应的各组标志总量的比重。

只有把得到的原始资料按其数值大小重新排列顺序,才能看出变量分布的集中趋势和特点,为确定全距、组距和组数作准备。

全距是变量值中最大值和最小值的差数。确定全距,主要是确定变量值的变动范围和变动幅度。如果是变动幅度不大的离散变量,即可编制单项式变量数列,如果是变量幅度较大的离散变量或者是连续变量,就要编制组距式变量数列。

组距的大小和组数的多少,是互为条件和互相制约的。当全距一定时,组距大,组数就少;组距小,组数就多。在实际应用中,组距应是整数,最好是5或10的整倍数。在确定组距时,必须考虑原始资料的分布状况和集中程度,注意组距的同质性,尤其是对带有根本性的质量界限,绝不能混淆,否则就失去分组的意义。

组限要根据变量的性质来确定。如果变量值相对集中,无特大或特小的极端数值时,则采用闭口式,使最小组和最大组也都有下限和上限;反之,如果变量值相对比较分散,则采用开口式,使最小组只有上限(用“XX以下”表示),最大组只有下限(用“XX以上表示)。如果是离散型变量,可根据具体情况采用不重叠组限或重叠组限的表示方法,而连续型变量则只能用重叠组限来表示。

在采用闭口式时,应做到最小组的下限低于最小变量值,最大组的上限高于最大变量值,但不要过于悬殊。

经过统计分组,明确了全距、组距、组数和组限及组限表示方法以后,就可以把变量值归类排列,最后把各组单位数经综合后填入相应的各组次数栏中。

统计表是纵横交叉的线条所绘制表现统计资料的一种表格形式。广义统计表包括统计工作各阶段所使用的一切表格。

从形式上看,统计表是由总标题,横行标题、纵栏标题和指标数值四部分组成;从内容上看,统计表是由主词和宾词两部分构成。主词是统计表要说明的总体或总体分成的多个组,宾词是说明主词的统计指标。

统计有时指统计工作,即统计实践活动,是对社会经济现象的数量方面进行搜集、整理和分析的全过程;统计有时指统计资料,即通过统计工作过程所取得各项数据资料和与之相关的其他实际资料;统计有时指统计科学,即关于认识客观现象数量特征和数量关系的原理原则和方式方法的科学。

统计的三种涵义是密切联系的。统计工作和统计资料是统计活动和统计成果的关系,统计学和统计工作是理论和实践的关系。

社会经济统计学的研究对象是社会经济现象总体的数量特征和数量关系,通过这些数量方面的研究反映社会经济现象发展变化的规律性。统计学和统计工作是理论和实践的关系,它们所要认识的研究对象是一致的。

统计总体是根据统计研究的任务目的所确定的研究事物的全体,是客观存在的具有共同性质的个体所构成的整体。

在一次特定范围、目的的统计研究中,统计总体与总体单位是不容混淆的,二者的含义是确切的,是包含与被包含的关系。但是随着统计研究任务、目的及范围的变化,统计总体和总体单位可以相互转化。

统计总体同时具有大量性、同质性、变异性等特点。大量性是指构成总体的总体单位数要足够的多,总体应由大量的总体单位所构成,大量性是对统计总体的基本要求;同质性是指总体中各单位至少有一个或一个以上不变标志,即至少有一个具有某一共同标志表现的标志,使它们可以结合起来构成总体,同质性是构成统计总体的前提条件;变异性就是指总体中各单位至少有一个或一个以上变异标志,即至少有一个不同标志表现的标志,作为所要研究问题的对象。变异性是统计研究的重点。

标志是说明总体单位所共同具有的属性和特征的名称。标志有品质标志和数量标志之分。品质标志说明总体单位的属性特征,无法量化,如职工的性别、文化程度,企业的经济成分,产品品牌等。数量标志说明总体单位的数量特征,能够量化,如职工的工龄、工资水平,企业的职工数、总产值、总产量、劳动生产率等。

总体单位与统计标志是有区别的。总体单位是统计标志的直接承担者,是载体;统计标志依附于总体单位并说明总体单位的属性和特征。依附于某个总体单位的标志可以有多个。

标志表现即标志特征在各单位的具体表现。如果说标志是统计所要调查的项目,那么标志表现是调查所得结果,标志的实际体现。

标志表现有品质标志表现和数量标志表现之分。品质标志表现只能用文字表述,因此不能转化为统计指标,但对其对应的单位进行总计时就形成统计指标。数量标志表现是一具体数值,也称标志值。

就一个品质标志或数量标志而言,其具体表现可能多种多样,不能将标志与标志表现混为一谈。如对三个工人的月工资计算平均数,只能说是对三个标志表现或三个标志值(变量值)计算平均数,不能说对三个数量标志计算平均数,因为数量标志只有一个,即工人“月工资”。

如果某一标志的具体表现在总体各单位相同,则称该标志为不变标志;如果某一标志的具体表现在各单位不尽相同,则称该标志为可变标志。可变标志的标志表现由一种状态变到另一种状态,统计上把这种现象或过程称变异。变异是一种普遍现象,有变异才有必要进行统计。

变量按其数值是否连续可分为连续性变量和离散性变量。连续性变量的数值是连续不断的,任意两个变量值之间可以做无数种分割,如工业总产值、商品销售额、身高、体重等,既可用小数表示,也可用整数表示;离散变量的取值可以按一定次序一一列举,如工厂数、工人数、机器台数等,变量值通常用整数表示。

正确理解统计指标时应注意:①统计指标反映现象总体的数量特征;②一个完整的统计指标应该由总体范围、时间、地点、指标数值和数值单位等内容构成。

② 指标具有可量性,无论是数量指标还是质量指标,都能用数值表示,而标志不一定。数量标志具有可量性,品质标志不具有可量性。

数量指标是反映现象总规模水平或工作总量的指标,也称总量指标,一般通过数量标志值直接汇总而来,用绝对数表示,指标数值均有单位;质量指标是反映现象总体相对水平或工作质量的统计指标,又分为相对指标和平均指标,分别用相对数和平均数表示,它们通常是由两个总量指标对比派生出来的,反映现象之间内在联系和对比关系。

数量指标和质量指标的关系表现在:数量指标是计算质量指标的基础,质量指标往往是相应的数量指标进行对比的结果。

统计指标体系是各种互相联系的指标群构成的整体,用以说明所研究的社会经济现象各方面互相依从和互相制约的关系。一个指标的作用总是有限的,它只能反映现象总体的某一侧面,只有使用指标体系才能反映现象总体全貌。

统计调查是按照预定的统计任务,运用科学的方法,有组织有计划地向客观实际搜集资料的过程。统计调查既是对现象总体认识的开始,也是进行资料整理和分析的基础环节。

统计调查既是对现象总体认识的开始,也是进行资料整理和分析的基础环节。统计调查的基本任务是取得反映社会经济现象总体全部或部分单位以数字资料为主体的信息。

统计调查方案是调查工作有计划、有组织、有系统进行的保证。统计调查方案应确定的内容有:调查目的、调查对象、调查项目、调查表、调查时间和调查时限、调查的组织工作。

确定调查目的是任何一项统计调查方案首先要解决的问题。不同的调查目的需要不同的调查资料,不同的调查资料又有不同的搜集方法。调查目的明确了,搜集资料的范围和方法也就确定下来了。

调查对象即统计总体,是根据调查目的所确定的研究事物的全体。统计总体这一概念在统计调查阶段称调查对象。

在确定调查对象时,还必须确定调查单位和报告单位。调查单位也就是总体单位,它是调查对象的组成要素,即调查对象所包含的具体单位。调查对象和调查单位的概念不是固定不变的,随着调查目的的不同二者可以互相变换。

报告单位也称填报单位,也是调查对象的组成要素。它是提交调查资料的单位,一般是基层企事业组织。

调查单位是调查资料的直接承担者,报告单位是调查资料的提交者,二者有时一致,有时不一致。如工业企业生产经营情况调查,每一工业企业既是调查单位,又是报告单位;工业企业职工收入状况调查,每一职工是调查单位,每一工业企业是报告单位。

确定调查项目时,首先应注意所选择的项目能够取得确切资料,其次注意所选择的项目应有确切的涵义和统一解释,另外要注意各项目之间的联系和衔接,便于核对和分析。

调查表有单一表和一览表两种形式。单一表是一个调查单位填写一份表格,可以容纳较多的项目。一览表是许多调查单位共同填写一份表格,在调查项目不多时较为简便,且便于合计和核对差错。为了正确填写调查表,须附有填表说明和项目解释。

调查时间指调查资料所属时间。如果调查的是时期现象,调查时间是资料所反映的起讫时间,也称客观时间。如果调查的是时点现象,调查时间是统一规定的标准时点。调查时限是进行调查工作的期限,包括搜集资料和报送资料的整个工作所需要的时间,也称主观时间。如某管理局要求所属企业在1996年1月底上报95年工业总产值资料,则调查时间是一年,调查时限是一个月;又如某管理局要求所属企业在96年1月10日上报95年产成品库存资料,则调查时间是标准时间1995年12月31日,调查期限是10天。

统计报表是国家统计系统和专业部门为了定期取得系统、全面的统计资料而采用的一种搜集资料的方式,目的在于掌握经常变动的、对国民经济有重大意义的指标的统计资料。专门调查是为了了解和研究某种情况或问题而专门组织的统计调查,包括抽样调查、普查、重点调查和典型调查等几种调查方法。

全面调查是对构成调查对象的所有单位进行逐一的、无一遗漏的调查,包括全面统计报表和普查;非全面调查是对调查对象中的一部分单位进行调查,包括非全面统计报表、抽样调查、重点调查和典型调查。

连续调查是指对研究对象的变化进行连续不断的登记,如工业企业总产值、产品产量、原材料消耗量等,在观察期内连续登记。连续调查所得资料是现象在一段时间内的总量。不连续调查是指间隔一段相当长的时间对研究对象某一时刻的资料进行登记。如人口数、机器设备台数等资料短期内变化不大,没有必要连续登记资料。不连续调查所得资料体现现象在某一瞬间所具有的水平。

直接调查又称直接观察,由调查人员到现场对调查单位直接查看、测量和计量;凭证调查是以各种原始和核算凭证为调查资料来源,依照统一的表格形式和要求,按照隶属关系,逐级向有关部门提供资料的方法;采访调查是通过指派调查员对被调查者询问、采访,提出所要了解的问题,借以搜集资料;问卷调查是以问卷形式提问。

所谓经常性调查是指调查周期在一年以内的调查,间隔超过一年的为一次性调查。这种划分和调查对象没有关系,不要把经常性调查误以为是全面调查,也不要误以为经常性调查就是调查时期现象,而一次性调查就是调查时点现象。

常用的统计调查方法有统计报表、普查、抽样调查、重点调查、典型调查等,它们各有其特点。1994年全国统计工作会议提出要建立以必要的周期性普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和少量的全面报表综合运用的统计调查方法体系。

统计报表是按国家统一规定的表式,统一的指标项目,统一的报送时间,自下而上逐级定期提供基本统计资料的调查方式方法。我国大多数统计报表要求调查对象全部单位填报,属于全面调查范畴,所以又称全面统计报表。

目前我国统计报表,是由国家统计报表、业务部门统计报表和地方统计报表组成,其中国家统计报表是统计报表体系的基本部分。

普查是专门组织的不连续性全面调查。主要调查一定时点状况的社会经济现象的总量,搜集那些不能够或者不适宜用定期全面报表搜集的统计资料,以搞清重要的国情国力。

普查的组织形式有两种:一是组织专门的普查机构,配备一定数量的普查人员,对调查单位直接进行登记;另一种是利用普查单位的原始记录和核算资料,颁发一定的调查表格由调查单位自填上报。

普查按资料汇总的特点分为一般普查和快速普查。前者逐级上报资料,后者越过中间环节,由基层单位将资料直接报送给最高领导机关。

普查和全面统计报表都属于全面调查,但二者并不能互相代替。普查属于不连续调查,调查内容主要是反映国情国力方面的基本统计资料;而全面统计报表属于连续调查,调查内容主要是需要经常掌握的各种统计资料。全面统计报表要经常填报,因此报表内容固定,调查项目较少;而普查是专门组织的一次性调查,在调查时可以包括更多的单位、分组更细、项目更多。因此,有些社会经济现象不可能也不需要进行经常调查,但又需要掌握比较全面、详细的资料时,就可通过普查来解决。普查花费的人力、物力和时间较多,不宜经常组织,取得经常性的统计资料还需要靠全面统计报表。

抽样调查的特点: ① 既是非全面调查,又要达到对总体数量特征的认识; ② 按随机原则去抽取调查单位。

抽样调查的作用:一是能够解决全面调查无法或难以解决的问题;二是可以补充和订正全面调查的结果,三是可用于生产过程中产品质量的检查和控制,四是可用于对总体的某种假设进行检验。

重点调查的关键是选择好重点单位。所谓重点单位,是从标志量的方面而言的,尽管这些单位在全部单位中只是一部分,但这些单位的某一主要标志量占总体单位标志总量的绝重。对这些单位进行调查,就可以了解调查对象的基本情况。

重点调查中重点单位的选择着眼于标志量的比重,因而重点单位的选择具有客观性。当调查目的是掌握现象的基本情况,而部分单位又能比较集中地反映所研究的项目和指标时,可用重点调查。重点调查可以定期进行,也可以不定期进行,重点调查实际上是范围比较小的全面调查, 它的目的是 反映现象总体的基本情况。

抽样调查和重点调查都是专门组织的非全面调查,具有调查单位少,省时省力的特点,在选取调查单位时不受主观因素的影响。但二者之间有明显的区别:首先是调查单位的意义和取得方式不同,重点调查是选择为数不多但标志量占总体标志总量绝重的单位进行调查;抽样调查中的样本单位是按照随机原则从研究总体中抽取的、具有较高代表性。其次,二者研究目的不同。重点调查是为了了解现象总体的基本情况,但不能推断总体总量;抽样调查的目的在于以样本量来推断总体总量。再次,适用场合不同。重点调查适用于部分单位能比较集中地反映所研究的项目或指标的场合;抽样调查最适合于不能或很难进行全面调查,而又需要全面数值的场合,在能进行全面调查的场合也有独到的作用。

典型调查是根据调查的任务目的,对所研究的现象总体进行初步分析的基础上,有意识的选择若干具有代表性的单位进行调查,借以认识事物发展变化的规律。

典型调查的特点一是深入细致的调查,既可以搜集数字资料,又可以搜集不能用数字反映的实际情况;二是调查单位是有意识的选择出来的若干有代表性的单位,它更多地取决于调查者的主观判断和决策。

典型调查和重点调查相比,前者调查单位的选择取决于调查者的主观判断,后者调查单位的选择具有客观性;前者在一定条件下可以用典型单位的量推断总体总量,后者不具备用重点单位的量推断总体总量的条件。

不同的统计调查的方式方法,各有其特点和作用。在实际工作中,并非单用一种方式方法,而是多种方式方法的结合运用。这是因为: ① 国民经济和社会发展情况复杂,国民经济门类众多,必须应用多种多样的统计调查方法,才能搜集到丰富的统计资料; ② 任何一种统计调查方法,都有它的优越性与局限性,各有不同的实施条件,只用一种统计调查方法,不能满足多种需要。

根据统计研究的任务与要求,对统计调查所搜集到的原始资料进行分组、汇总,使其条理化、系统化的工作过程称统计整理。统计整理包括对原始资料和次级资料的整理。

通过统计调查所取得的总体各单位的资料是零星的,分散的,只能说明总体单位的情况,而不能反映总体特征。统计整理对调查资料进行科学加工,使之系统化,成为说明总体特征的综合资料,实现了由反映总体单位特征的标志向反映总体综合数量特征的统计指标的转化,是从对社会经济现象个体量的观察到对社会经济现象总体量的认识的连接点,是人们对社会经济现象从感性认识到理性认识的过渡阶段。统计整理在整个统计工作中发挥着承上启下的作用。

分组是根据研究任务的要求,对调查所得的原始资料,确定哪些分组或分类。统计分组是统计整理的关键。

汇总是在统计分组的基础上,把总体单位各种标志的标志值汇总起来,汇总主要有手工汇总和电子计算机汇总。

4、统计整理的内容和步骤:(1)确定应整理的指标和确定应分的组;(2)对各项指标进行汇总,确定各组和总体的单位数和标志总量;(3)用统计表现分组、汇总的结果。

根据统计研究任务的要求和研究现象总体的内在特点,把现象总体按某一标志划分为若干性质不同但又有联系的几个部分称统计分组。

总体的变异性是统计分组的客观依据。统计分组是总体内进行的一种定性分类,它把总体划分为一个个性质不同的范围更小的总体。

①统计分组按其任务和作用不同,分为类型分组、结构分组和分析分组。类型分组的目的是划分经济类型,结构分类的目的是研究同质总体的构成,分析分组的目的是研究现象总体内部诸标志间的依从和制约关系。

②统计分组按分组标志的多少分为简单分组和复合分组。简单分组是将总体按一个标志进行分组,复合分组是将总体按两个或两个以上的标志重叠起来进行分组。

③统计分组按分组标志的性质分为品质分组和变量分组。品质分组是将总体按品质标志进行分组,如企业按经济成分、地理位置分组,职工按性别、文化程度分组等;变量分组是将总体按数量标志进行分组,如企业按职工人数、劳动生产率分组,职工按工龄、工资分组等。

统计分组后所形成的一系列互相联系、互相补充的组的整体称分组体系。分组体系有平行分组体系和复合分组体系两种。平行分组体系是选择两个或两个以上的标志对总体进行一次次简单分组后所形成的体系;复合分组体系就是复合分组后形成的体系。

分组标志的选择是统计分组的关键。分组标志,即将同质总体区分为不同组的标准或依据。分组标志一旦选定,就必然突出了总体在该标志下的性质差别,其他的差别看不见了。分组标志选择不当,不但无法显示现象的根本特征,甚至会混淆事物的性质,歪曲社会经济的真实情况。

正确选择分组标志,必须根据统计研究的任务目的,抓住反映现象本质区别和内在联系的标志作为分组标志。

品质标志分组一般较简单,分组标志一旦确定,组数、组名、组与组之间的界限也就确定。有些复杂的品质标志分组可根据统一规定的划分标准和分类目录进行。

按数量标志分组的目的并不是单纯确定各组在数量上的差别,而是要通过数量上的变化来区分各组的不同类型和性质。数量标志分组方法从以下几个方面来说明:

对离散变量,如果变量值的变动幅度小,就可以一个变量值对应一组,称单项式分组。如居民家庭按儿童数或人口数分组,均可采用单项式分组。

离散变量如果变量值的变动幅度很大,变量值的个数很多,则把整个变量值依次划分为几个区间,各个变量值则按其大小确定所归并的区间,区间的距离称为组距,这样的分组称为组距式分组。

也就是说,离散变量根据情况既可用单项式分组,也可用组距式分组。在组距式分组中,相邻组既可以有确定的上下限,也可将相邻组的组限重叠。

连续变量由于不能一一列举其变量值,只能采用组距式的分组方式,且相邻的组限必须重叠。如以总产值、商品销售额、劳动生产率、工资等为标志进行分组,就只能是相邻组限重叠的组距式分组。

在相邻组组限重叠的组距式分组中,若某单位的标志值正好等于相邻两组的上下限的数值时,一般把此值归并到作为下限的那一组(适用于连续变量和离散变量)。

组距式分组使资料的真实性受到一定程度的损害。组距式分组的假定条件是:变量在各组内的分布都是均匀的(即各组标志值呈线性变化)。

通过组距式分组以后,把各组内部各单位的次要差异抽象去了,而把各组之间的主要差异突出出来,这样,各组分配的规律性可以更容易显示出来。根据这个道理,如组距太小,分组过细,容易将属于同类的单位划分到不同的组,因而显示不出现象类型的特点;但如果组距太大,组数太少,会把不同性质的单位归并到同一组中,失去区分事物的界限,达不到正确反映客观事实的目的。因此,组距的大小、组数的确定应根据研究对象的经济内容和标志值的分散程度等因素,不可强求一致。

等距分组是各组保持相等的组距,也就是说各组标志值的变动都限于相同的范围。不等距分组即各组组距不相等的分组。

统计分组时采用等距分组还是不等距分组,取决于研究对象的性质特点。在标志值变动比较均匀的情况下宜采用等距分组。等距分组便于各组单位数和标志值直接比较,也便于计算各项综合指标。在标志值变动很不均匀的情况下宜采用不等距分组。不等距分组有时更能说明现象的本质特征。

组距两端的数值称组限。其中,每组的起点数值称为下限,每组的终点数值称为上限。上限和下限的差称组距,表示各组标志值变动的范围。

组中值是上下限之间的中点数值,以代表各组标志值的一般水平。组中值并不是各组标志值的平均数,各组标志数的平均数在统计分组后很难计算出来,就常以组中值近似代替。组中值仅存在于组距式分组数列中,单项式分组中不存在组中值。

组中值的计算是有假定条件的,即假定各组标志值的变化是均匀的(与组距式分组的假定条件相同)。一般情况下,组中值=(上限+下限)÷2

对于第一组是 “多少以下”,最后一组是“多少以上”的开口组,组中值的计算可参照邻组的组距来决定。即:缺下限开口组组中值=上限—1/2邻组组距,缺上限开口组组中值=下限+1/2邻组组距。

在统计分组的基础上,列出各组对应的单位数,形成总体单位数在各个组的分布,称统计分布,又称分配数列或次数分布。分配数列包括两个要素:总体按某标志所分的组和各组对应的单位数(频数)

分配数列包括品质分配数列和变量分配数列,分别由品质标志分组和数量标志分组形成。变量数列又有单项式数列和组距式数列,分别由单项式分组和组距式分组形成。

统计分组后各组对应的单位数称频数,也叫次数;各组单位数占总体单位总数的比重称频率。各组的频率大于0,所有组的频率总和等于1。

在变量分配数列中,频数(频率)表明对应组标志值的作用程度。频数(频率)数值越大表明该组标志值对于总体水平所起的作用也越大,反之,频数(频率)数值越小,表明该组标志值对于总体水平所起的作用越小。

有时为了更简便地概括总体各单位的分布特征,还需要编制累计频数数列和累计频率数列。累计有向上累计和向下累计的方法。向上累计是指将各组频数和频率由变量值低的组向变量值高的组累计,表明在这些数值以下所有数值所占的比重;向下累计是指将各组频数和频率由变量值高的组向变量值低的组累计,表明在这些数值以上所有数值所占的比重。

①钟型分布 特征是“两头大,中间小”,即靠近中间的变量值分布的次数多,靠近两边的变量分布次数少,形若古钟。

②U型分布 其特征与钟型分布正相反,靠近中间的变量值分布的次数少,靠近两端的变量值分布次数多,形成“两头大,中间小”的U字型分布。如人口死亡现象按年龄分布便是如此。

④洛伦兹分布 洛伦兹曲线专门用以检定社会收入分配的平等程度。洛伦兹曲线拓展可运用于其他社会经济现象,研究总体各单位标志分布集中状况或平均性。洛伦兹曲线又称集中曲线,其运作的条件是:现象总体各组频率与相应的各组标志总量的比重。

只有把得到的原始资料按其数值大小重新排列顺序,才能看出变量分布的集中趋势和特点,为确定全距、组距和组数作准备。

全距是变量值中最大值和最小值的差数。确定全距,主要是确定变量值的变动范围和变动幅度。如果是变动幅度不大的离散变量,即可编制单项式变量数列,如果是变量幅度较大的离散变量或者是连续变量,就要编制组距式变量数列。

组距的大小和组数的多少,是互为条件和互相制约的。当全距一定时,组距大,组数就少;组距小,组数就多。在实际应用中,组距应是整数,最好是5或10的整倍数。在确定组距时,必须考虑原始资料的分布状况和集中程度,注意组距的同质性,尤其是对带有根本性的质量界限,绝不能混淆,否则就失去分组的意义。

组限要根据变量的性质来确定。如果变量值相对集中,无特大或特小的极端数值时,则采用闭口式,使最小组和最大组也都有下限和上限;反之,如果变量值相对比较分散,则采用开口式,使最小组只有上限(用“XX以下”表示),最大组只有下限(用“XX以上表示)。如果是离散型变量,可根据具体情况采用不重叠组限或重叠组限的表示方法,而连续型变量则只能用重叠组限来表示。

在采用闭口式时,应做到最小组的下限低于最小变量值,最大组的上限高于最大变量值,但不要过于悬殊。

经过统计分组,明确了全距、组距、组数和组限及组限表示方法以后,就可以把变量值归类排列,最后把各组单位数经综合后填入相应的各组次数栏中。

统计表是纵横交叉的线条所绘制表现统计资料的一种表格形式。广义统计表包括统计工作各阶段所使用的一切表格。

从形式上看,统计表是由总标题,横行标题、纵栏标题和指标数值四部分组成;从内容上看,统计表是由主词和宾词两部分构成。主词是统计表要说明的总体或总体分成的多个组,宾词是说明主词的统计指标。