
1.关于统计的知识,200字
条形统计图是用一个单位长度表示一定的数量,根据数量的多少画成长短不同的直条,然后把这些直条按一定的顺序排列起来。从条形统计图中很容易看出各种数量的多少。条形统计图一般简称条形图,也叫长条图或直条图。条形统计图是用条形的长短来代表数量的大小,便于比较。条形统计图又分为条形统计图和复式条形统计图,复式条形统计图由多种数据组成,用不同的颜色标出。
频率分布直方图:在直角坐标系中,横轴表示样本数据,纵轴表示频率与组距的比值,将频率分布表中各组频率的大小用相应矩形面积的大小来表示,由此画成的统计图叫做频率分布直方图。(在图中,各个长方形的面积等于相应各组的频率的数值,所有小矩形面积和为1)
把全体样本分成的组的个数称为 组数。每一组两个端点的差称为组距。落在不同小组中的数据个数为该组的 频数。各组的频数之和等于这组数据的总数。频数与数据总数的比为频率(总频率=各组频率之和,且它的值为1)。频率大小反映了各组频数在数据总数中所占的份量。
2.关于统计方面的知识中位数(Median)统计学名词。
将数据排序后,位置在最中间的数值。即将数据分成两部分,一部分大于该数值,一部分小于该数值。
中位数的位置:当样本数为奇数时,中位数=(N+1)/2 ; 当样本数为偶数时,中位数为N/2与1+N/2的均值 众数(Mode)统计学名词,在统计分布上具有明显集中趋势点的数值,代表数据的一般水平(众数可以不存在或多于一个)。 修正定义:是一组数据中出现次数最多的那个数值,就是众数,有时众数在一组数中有好几个。
用M表示。 理性理解:简单的说,就是一组数据中占比例最多的那个数。
用众数代表一组数据,可靠性较差,不过,众数不受极端数据的影响,并且求法简便。在一组数据中,如果个别数据有很大的变动,选择中位数表示这组数据的“集中趋势”就比较适合。
条形统计图是用一个单位长度表示一定的数量,根据数量的多少画成长短不同的直条,然后把这些直条按一定的顺序排列起来。从条形统计图中很容易看出各种数量的多少。
条形统计图一般简称条形图,也叫长条图或直条图。条形统计图是用条形的长短来代表数量的大小,便于比较。
条形统计图又分为条形统计图和复式条形统计图,复式条形统计图由多种数据组成,用不同的颜色标出。 频率分布直方图:在直角坐标系中,横轴表示样本数据,纵轴表示频率与组距的比值,将频率分布表中各组频率的大小用相应矩形面积的大小来表示,由此画成的统计图叫做频率分布直方图。
(在图中,各个长方形的面积等于相应各组的频率的数值,所有小矩形面积和为1) 把全体样本分成的组的个数称为 组数。每一组两个端点的差称为组距。
落在不同小组中的数据个数为该组的 频数。各组的频数之和等于这组数据的总数。
频数与数据总数的比为频率(总频率=各组频率之和,且它的值为1)。频率大小反映了各组频数在数据总数中所占的份量。
3.统计基础知识统计总体和总体单位
(1)统计总体:根据一定的目的和要求,统计所需要研究的客观事物的全体,称为统计总体,简称总体。
统计总体形成的三个条件:
第一,客观性;总体和总体单位必须是客观存在的,可以观察和计量的;
第二,同质性;组成总体的所有个体必须是在某些性质上是相同的;
第三.差异性;构成总体的各单位除了同质性一面还必须有差异性一面,否则就是需要统计研究了。
统计总体按总体单位是否有限分为两种:有限总体和无限总体。一个统计总体所包括的单位数如果是有限的,称为有限总体。如果是无限的,称为无限总体。
(2)总体单位:组成总体的每一个事物,称为总体单位,简称个体。
统计总体和总体单位是多种多样的。且统计总体与总体单位不是固定不变的,总体与总体单体具有相对性,随着研究任务的改变而改变。这与研究目的和要求有关。
例如:要了解某一地区国有工业企业的生产经营情况(研究目的),总体是该地区的全部国有工业企业,每一个国有工业企业是总体单位。要了解某一国有企业职工工资情况(研究目的范围变小),总体是该企业所有职工,总体单位是每一位职工。比如,我们在网上看到,某地区电力系统职工的查表员工年薪达到12万,我们可以研究一下该电力企业职工的工资情况,总体就是该电力企业的所有职工,总体单位就是每一位职工。
标志与指标
(1)标志:是说明总体单位特征的名称。
标志按其 品质标志:表明总体单位的属性特征,不能用数量表示。主要用作分组的依据。
表现形式有 数量标志:表明总体单位的数量特征,可以用数量表示。可进行计算。
(2)指标:两种理解和使用方法。
一种是认为统计指标是反映总体现象数量特征的概念。适用于统计理论与统计设计。
另一种认为统计指标是反映总体现象数量特征的概念和具体数值。适用于实际统计工作。
(3)指标与标志的区别:
①指标是说明总体特征的,而标志是说明单体单位特征的;
②标志有不能用数值表示的品质标志和能用数值表示的数量标志两种,而指标都必须是能用数值表示的;
(4)指标与标志的联系:
①有许多统计指标的数值是直接从总体单位的数量标志值汇总而来的;
②指标与数量标志之间存在着转化的关系。
统计总体:就是根据一定的目的和要求所确定的研究事物的全体,它是由客观存在的、具有某种共同性质的许多个别事物构成的整体。
总体单位:是指构成总体的个体单位,它是总体的基本单位。
单位标志:简称标志,是指总体总体中各单位所具有的属性和特征。
标志:分为品质标志和数量标志。
总体 和总体单位是互为存在条件的连接在一起的,没有总体单位,总体也不存在,没有总体,也就无法确i定总体单位。
4.统计学的基本常识统计学是一门研究随机现象,以推断为特征的方法论科学,“由部分推及全体”的思想贯穿于统计学的始终。
具体地说,它是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。 用统计来认识事物的步骤是:研究设计—>抽样调查—>统计推断—>结论。
这里,研究设计就是制定调查研究和实验研究的计划,抽样调查是搜集资料的过程,统计推断是分析资料的过程。显然统计的主要功能是推断,而推断的方法是一种不完全归纳法,因为是用部分资料来推断总体。
增加定义:是关于收集、整理、分析和解释统计数据的科学,是一门认识方法论性质的科学,其目的是探索数据内在的数量规律性,以达到对客观事物的科学认识。 统计学是收集、分析、表述和解释数据的科学。
5.统计学内容统计学是一门研究各种随机现象的本质与内在规律性,对各种类型数据进行综合处理及统计推断的学科。
随着人类社会各种体系的日益庞大、复杂、精密,计算机 的广泛使用,统计学的重要性显得越来越大。统计学曾被评为20世纪给人类生活带来重大影响的二十项新技术之一,它的应用遍及所有科学技术领域、工农业生产 和国民经济的各个部门,是工农业生产和科学技术深层次、高层次管理的重要工具。
例如,可以通过统计方法进行气象、水文以及地震预报的研究;在研制新产品 时,利用统计学的知识进行试验设计和数据处理,以寻求最佳的生产方案;在自动控制中给出数学模型以便通过计算机控制工业生产等。另外,统计方法的应用一般 不需要增加投资、添置设备,只需很小的成本。
正因为应用广、成本低的特点,统计学近年的发展越来越快,各个部门和企业对统计学人才的需求越来越大。不过上 面所说的都只是理工科方面应用的“理学统计学”。
在社会科学方面,也出现了人口统计学、心理统计学等统计学的分支学科。但统计学最为重要的还是在经济方面 的应用,可以说是经济研究中最为客观、最为重要的工具。
金融、证券、保险等会经常用到统计学的知识。例如在证券投资中对于一个股票的分析,就需要用统计学 的方法处理股票的历史数据;又如在保险业中的精算师,就要具备非常深厚的统计学功底。
由目前的社会情况看,将来统计学人才的培养,将会由原来的“理学统计 学人才”向“经济类统计学人才”发展。 统计学作为数学中的一个重要的分支,所学的很多课程是以数学为基础。
特别是“理学统计学”,数学课程可 以说是主要课程,纯理论学习不少;即使是“经济统计学”,相对于其他的经济管理类专业,难度也很大,对学生的数学基础要求很高。在高中的学习中,对数学有 很强烈的兴趣,并有很好潜质的考生,适合于选择统计学专业作为自己大学报考的专业。
统计学里将会有很多诸如古典概率之类引起你兴趣的东西。另一方面,由于 行业收入差距过大的原因,以往的学生不太愿意报考统计学专业。
但随着经济统计学的出现,统计学的毕业生将会有很好的收入。实践也证明,很多的金融部门和单 位,对统计学专业人才的需求,甚至已经超过了一些热门的经济学专业。
所以,如果只是因为担心出路而不选统计学的考生,大可以摒弃原来的观点,这方面的顾虑 可以完全消除。 统计学应用性强,本身虽然只是一种工具,一件武器,但是它的适用范围非常广。
正是因为这个特点,使得统计专业培养的人才往往具 备很强的适应能力,与数学类专业毕业生一样,逻辑思维能力很强,并且自学能力突出。这些能力对于事业的成功可以说是至关重要的。
毕业生的去向有政府统计部 门,银行、证券公司、保险公司等金融机构,信息咨询公司等。虽然专业的应用性很强,但学习中,还是以理论学习为主,正因如此,在很多院校,本专业继续深造 的机会很多,如攻读研究生,将来在工作中会有更多的竞争优势。
6.如何学习统计基础知识与统计实务统计总体和总体单位
(1)统计总体:根据一定的目的和要求,统计所需要研究的客观事物的全体,称为统计总体,简称总体。
统计总体形成的三个条件:
第一,客观性;总体和总体单位必须是客观存在的,可以观察和计量的;
第二,同质性;组成总体的所有个体必须是在某些性质上是相同的;
第三.差异性;构成总体的各单位除了同质性一面还必须有差异性一面,否则就是需要统计研究了。
统计总体按总体单位是否有限分为两种:有限总体和无限总体。一个统计总体所包括的单位数如果是有限的,称为有限总体。如果是无限的,称为无限总体。
(2)总体单位:组成总体的每一个事物,称为总体单位,简称个体。
统计总体和总体单位是多种多样的。且统计总体与总体单位不是固定不变的,总体与总体单体具有相对性,随着研究任务的改变而改变。这与研究目的和要求有关。
例如:要了解某一地区国有工业企业的生产经营情况(研究目的),总体是该地区的全部国有工业企业,每一个国有工业企业是总体单位。要了解某一国有企业职工工资情况(研究目的范围变小),总体是该企业所有职工,总体单位是每一位职工。比如,我们在网上看到,某地区电力系统职工的查表员工年薪达到12万,我们可以研究一下该电力企业职工的工资情况,总体就是该电力企业的所有职工,总体单位就是每一位职工。
标志与指标
(1)标志:是说明总体单位特征的名称。
标志按其品质标志:表明总体单位的属性特征,不能用数量表示。主要用作分组的依据。
表现形式有数量标志:表明总体单位的数量特征,可以用数量表示。可进行计算。
(2)指标:两种理解和使用方法。
一种是认为统计指标是反映总体现象数量特征的概念。适用于统计理论与统计设计。
另一种认为统计指标是反映总体现象数量特征的概念和具体数值。适用于实际统计工作。
(3)指标与标志的区别:
①指标是说明总体特征的,而标志是说明单体单位特征的;
②标志有不能用数值表示的品质标志和能用数值表示的数量标志两种,而指标都必须是能用数值表示的;
(4)指标与标志的联系:
①有许多统计指标的数值是直接从总体单位的数量标志值汇总而来的;
②指标与数量标志之间存在着转化的关系。
统计总体:就是根据一定的目的和要求所确定的研究事物的全体,它是由客观存在的、具有某种共同性质的许多个别事物构成的整体。
总体单位:是指构成总体的个体单位,它是总体的基本单位。
单位标志:简称标志,是指总体总体中各单位所具有的属性和特征。
标志:分为品质标志和数量标志。
总体和总体单位是互为存在条件的连接在一起的,没有总体单位,总体也不存在,没有总体,也就无法确i定总体单位。
7.统计学 概念1、同质(homogeneity)与变异(variation)严格地讲,同质是指被研究指标的影响因素完全相同。
但在医学研究中,有些影响因素往往是难以控制的(如遗传、营养等),甚至是未知的。所以,在统计学中常把同质理解为对研究指标影响较大的、可以控制的主要因素尽可能相同。
例如研究儿童的身高时,要求性别、年龄、民族、地区等影响身高较大的、易控制的因素要相同,而不易控制的遗传、营养等影响因素可以忽略。同质基础上的个体差异称为变异。
如同性别、同年龄、同民族、同地区的健康儿童的身高、体重不尽相同。事实上,客观世界充满了变异,生物医学领域更是如此。
哪里有变异,哪里就需要统计学。若所研究的同质群体中所有个体一模一样,只需观察任一个体即可,无须进行统计研究。
2、总体(population)与样本(sample)任何统计研究都必须首先确定观察单位(observed unit),亦称个体(individual)。观察单位是统计研究中最基本的单位,可以是一个人、一个家庭、一个地区、一个样品、一个采样点等。
总体是根据研究目的确定的同质观察单位的全体,或者说,是同质的所有观察单位某种观察值(变量值)的集合。例如欲研究山东省2002年7岁健康男孩的身高,那么,观察对象是山东省2002年的7岁健康男孩,观察单位是每个7岁健康男孩,变量是身高,变量值(观察值)是身高测量值,则山东省2002年全体7岁健康男孩的身高值构成一个总体。
它的同质基础是同地区、同年份、同性别、同为健康儿童。总体又分为有限总体(finite population)和无限总体(infinite population)。
有限总体是指在某特定的时间与空间范围内,同质研究对象的所有观察单位的某变量值的个数为有限个,如上例;无限总体是抽象的,无时间和空间的限制,观察单位数是无限的,如研究碘盐对缺碘性甲状腺病的防治效果,该总体的同质基础是缺碘性甲状腺病患者,同用碘盐防治;该总体应包括已使用和设想使用碘盐防治的所有缺碘性甲状腺病患者的防治效果,没有时间和空间范围的限制,因而观察单位数无限,该总体为无限总体。在实际工作中,所要研究的总体无论是有限的还是无限的,通常都是采用抽样研究。
样本是按照随机化原则,从总体中抽取的有代表性的部分观察单位的变量值的集合。如从上例的有限总体(山东省2002年7岁健康男孩)中,按照随机化原则抽取100名7岁健康男孩,他们的身高值即为样本。
从总体中抽取样本的过程为抽样,抽样方法有多种,详见第14章。抽样研究的目的是用样本信息推断总体特征。
统计学好比是总体与样本间的桥梁,能帮助人们设计与实施如何从总体中科学地抽取样本,使样本中的观察单位数(亦称样本含量,sample size)恰当,信息丰富,代表性好;能帮助人们挖掘样本中的信息,推断总体的规律性。3、资料(data)与变量(variable)及其分类总体确定之后,研究者应对每个观察单位的某项特征进行测量或观察,特征称为变量。
如“身高”、“体重”、“性别”、“血型”、“疗效”等。变量的测定值或观察值称为变量值(value of variable)或观察值(observed value),亦称为资料。
按变量的值是定量的还是定性的,可将变量分为以下类型,变量的类型不同,其分布规律亦不同,对它们采用的统计分析方法也不同。在处理资料之前,首先要分清变量类型。
1)数值变量(numerical variable):其变量值是定量的,表现为数值大小,可经测量取得数值,多有度量衡单位。如身高(cm)、体重(kg)、血压(mmHg kPa)、脉搏(次/min)和白细胞计数(*10 9 /L)等。
这种由数值变量的测量值构成的资料称为数值变量资料,亦称为定量资料(quantitative data)。大多数的数值变量为连续型变量,如身高、体重、血压等;而有的数值变量的测定值只能是正整数,如脉搏、白细胞计数等,在医学统计学中把它们也视为连续型变量。
2)分类变量(catagorical variable):其变量值是定性的,表现为互不相容的类别或属性。分类变量可分为无序变量和有序变量两类:(1)无序分类变量(unordered categorical variable)是指所分类别或属性之间无程度和顺序的差别。
它又可分为①二项分类,如性别(男、女),药物反应(阴性和阳性)等;②多项分类,如血型(O、A、B、AB),职业(工、农、商、学、兵)等。对于无序分类变量的分析,应先按类别分组,清点各组的观察单位数,编制分类变量的频数表,所得资料为无序分类资料,亦称计数资料。
(2)有序分类变量(ordinal categorical variable)各类别之间有程度的差别。如尿糖化验结果按-、±、+、++、+++分类;疗效按治愈、显效、好转、无效分类。
对于有序分类变量,应先按等级顺序分组,清点各组的观察单位个数,编制有序变量(各等级)的频数表,所得资料称为等级资料。变量类型不是一成不变的,根据研究目的的需要,各类变量之间可以进行转化。
例如血红蛋白量(g/L)原属数值变量,若按血红蛋白正常与偏低分为两类时,可按二项分类资料分析;若按重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高分为五个等级时,可按等级资料分析。有。






