您好、欢迎来到现金彩票网!
当前位置:2019欢乐棋牌 > 置信测度 >

应用统计学总结

发布时间:2019-06-15 20:29 来源:未知 编辑:admin

  一.统计学性质统计学: 收集、分析、表述和解释数据的科学 1.数据搜集:取得数据;2.数据分析:分析 数据;3.数据表述:图表展示数据;4.数据解释:结果的说明 (一)现代统计学的性质可归纳为如下几个方面: 1.统计学是方法论科学,而不是实质性科学 它研究的是事物普遍存在的数量关系的计量和数量分析的方法,并通过数量分析来认识 特定事物的内在规律性,但不是研究规律本身。 2.统计学的应用范围不局限于社会科学,也不局限于自然科学。 由于其方法来自于社会科学也来自于自然科学,所以它可以用于社会现象也可以用于自 然现象,即统计学是一种通用的方法论科学。同时统计学也不是依服于实质性科学而存在的 方法论,它是独立的方法论科学。 3.统计学的研究对象既包括确定性现象的总体数量关系,也包括随机现象的总体数量关系,即 统计学是研究各类事物总体数据的方法论科学。 统计学是为探索事物数量所反映的客观规律性,而对事物总体的大量数据进行收集、整 理和分析研究的方法论科学。它以大量的客观事物的量化描述、特征推算及关系分析为其主 要研究对象。 (二)描述统计学与推断统计学: 描述统计学(Descriptive Statistics)研究如何取得反映客观现象的数据,并通过图表形式对所 收集的数据进行加工处理和显示,进而通过综合概括与分析得出反映客观现象的规律性数量 特征。内容包括统计数据的收集方法、数据的加工处理方法、数据的显示方法、数据分布特 征的概括与分析方法等。 推断统计学(1nferential Statistics)则是研究如何根据样本数据去推断总体数量特征的方法, 它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推 描述统计学和推断统计学的划分,一方面反映了统计方法发展的前后两个阶段,同时也反映了应用统计方法探索客观事物数量规律性的不同过程。 统计研究过程的起点是统计数据,终点是探索出客观现象内在的数量规律性。在这一过程 中,如果搜集到的是总体数据(如普查数据),则经过描述统计之后就可以达到认识总体数量 规律性的目的了;如果所获得的只是研究总体的一部分数据(样本数据),要找到总体的数量 规律性,则必须应用概率论的理论并根据样本信息对总体进行科学的推断。 显然,描述统计和推断统计是统计方法的两个组成部分。描述统计是整个统计学的基础, 推断统计则是现代统计学的主要内容。 统计数据对现象进行测量的结果;不是指单个的数字,而是由多个数据构成的数据集;不仅仅是指数 字,它可以是数字的,也可以是文字的 分类:按计量 分类数据(categoricaldata) 顺序数据(rankdata) 数值型数据(metricdata) 结果表现为具体的数值,对事物的精确测度按收集方法 观测的数据(observationaldata) 试验的数据(experimentaldata) :在试验中控制试验对象而收集到的数据 按时间状况 时间序列数据(timeseries data) 描述现象随时间变化的情况2.截面数据(cross-sectional data) 在用样本数据进行统计推断时所产生的误差(样本统计量与相应总体参数之间的偏差)b、由于抽样的随机性所带来的误差 调查过程中由于调查者和被调查者的人为因素所造成的误差(除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异) b、理论上可以消除 抽样误差可计算和控制b、非抽样误差的控制:调查员的挑选;调查员的培训;督导员的调查专业水平:调查过程控 制(调查结果进行检验、评估;现场调查人员进行奖惩的制度) (4)统计数据质量的要求; 集中趋势:表明同类现象在一定时间、地点条件下,所达到的一般水平与大量单位的综合数量特征,有以下3 个特点: 计量单位与标志值的计量单位一致。集中趋势 低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据 集中趋势的作用: 计算和估算其他重要的经济指标(二)离中趋势: 不同类型的数据有不同的离散程度测度值离中趋势度量的目的: 描述总体内部差异程度;衡量和比较均值指标的代表性高低;为抽选样本单位数提供依据 区别与联系: 区别:集中趋势是对频数分布资料的集中状况和平均水平的综合测度;是一组数据向其中心 值靠拢的倾向和程度;测度集中趋势就是寻找数据水平的代表值或中心值。离中趋势是对频 数分布资料的差异程度和离散程度的测度,用来衡量集中趋势所测数据的代表性,或者反应 变量值的稳定性与均匀性;是用来描述总体内部差异程度及衡量和比较均值指标的代表性高 低。偏度是用来反应变量数列分布偏斜程度的指标,有对称分布和非对称分布,非对称分布 也即为偏态分布,包括左偏分布和右偏分布。峰度是用来反应变量数列曲线顶端尖峭或扁平 程度的指标。 联系:为了反面描述研究对象的情况,仅仅用集中趋势方法来测度集中性和共性是不够的, 还要用离散趋势方法来测度其离散性和差异性,因此,而这需要结合使用。集中趋势和离中 趋势是变量数列分布的两个重要特征,但要全面了解变量数列分布的特点,还需要知道数列 的形状是否对称、偏斜程度以及分布的扁平程度等。偏度和峰度就是从分布特征作进一步的 描述。 缺点:没有给出估计值接近总体参数程度的信息,它与真挚的误差、估计可靠性怎么样无法知道。区间估计可以弥补这种不足。 区间估计在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样 误差而得到的。 根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量。 将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 常用的置信水平值有99%, 95%, 90%;相应的 为0.01,0.05,0.10 用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值,我们只能是希望这个区间是大量包含总体参数真值的 区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个 置信区间的表述: 总体参数的真值是固定的,而用样本构造的区间则是不固定的,因此置信区间是一个随机区间,它会因样本的不同而变化,而且不是所有的区间都包含总体参数 实际估计时往往只抽取一个样本,此时所构造的是与该样本相联系的一定置信水平(比如95%)下的置信区间。我们只能希望这个区间是大量包含总体参数真值的区间中的一 个,但它也可能是少数几个不包含参数真值的区间中的一个 当抽取了一个具体的样本,用该样本所构造的区间是一个特定的常数区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值,因为它可能是包含总体均值的 区间中的一个,也可能是未包含总体均值的那一个 一个特定的区间总是“包含”或“绝对不包含”参数的真值,不存在“以多大的概率包含总体参数”的问题 置信水平只是告诉我们在多次估计得到的区间中大概有多少个区间包含了参数的真值,而不是针对所抽取的这个样本所构建的区间而言的 使用一个较大的置信水平会得到一个比较宽的置信区间,而使用一个较大的样本则会得到一个较准确(较窄)的区间。直观地说,较宽的区间会有更大的可能性包含参数 区间估计总是要给结论留点儿余地影响置信区间宽度的因素: 1.总体数据的离散程度,用 来测度;2.样本容量;3.置信水平 参数估计标准:无偏性:估计量抽样分布的数学期望等于被估计的总体参数 有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效 一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数 假设检验(一)概念 先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程 逻辑上运用反证法,统计上依据小概率原理什么小概率? 小概率由研究者事先确定怎样通过假设检验去掉偶然性 利用P 值进行检验就可以去掉偶然性。因为P 值告诉我们在某个总体的许多样本中,某一 类数据出现的经常程度,P 值是当原假设正确的情况下,得到所观测的数据的概率。如果原假 设是正确的,P 值若很小,则告诉我饿们得到这样的观测数据是多么的不可能,相当不可能得 到的数据,就是原假设不对的合理证据,偶然性也就消除了。 (二)原假设 表示为H1

http://nicolashsiung.com/zhixincedu/21.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有