统计学

统计学笔记:第一章 统计学绪论

统计学第一章: 导论

统计学:收集、分析和解释数据的科学;

  1. 数据收集: 取得数据
  2. 数据处理:图表展示数据
  3. 数据分析: 分析数据
  4. 数据解释: 结果的说明

统计数据的分类

按照采用的尺度的不同

分类数据: 只能归于某一类别的非数字型数据,它是对事物进行分类的结果,表现为类别,是用文字来表示

顺序数据: 只能归于某一有序类别的非数字型数据

数字数据: 按照数字尺度测量的观察值,其结果 表现为具体的数值。

分类数据和统计数据说明的是事物的品质特征,通常是用文字来表述,其结果均表现为类别,也可称为定性数据或品质数据;

数值型数据说明的是现象的数量特征,通常是用数值来表现的,也可称为定量数据或数量数据。

按统计数据的收集方法

观测数据:通过调查或观测而收集的数据,特征是在没有对事物进行人为的控制条件下得到;

实验数据:通过在实验中控制实验对象而收集到的数据

按被描述的现象和时间的关系

截面数据: 在相同或近似的时间点上收集的数据,这类数据通常是在不同的空间上获得的,用于描述现象在某一时间的变化情况。

时间序列数据:在不同的时间收集到的数据,这类数据是按照时间顺序收集到的,用于描述现象随时间变化的情况

总结

区分数据类型是非常重要的,因为对不同类型的数据,需要采用不同的统计方法来处理和分析。

对分类数据,通常计算出各组的频率或频数,计算其众数和异众比率,进行列联表分析和x2检验等;

对顺序数据,可以计算其中位数和四分位差,计算等级相关系数等;

对数值型数据,可以用更多的统计方法进行分析,如计算各种统计量,进行参数估计和检验等;


总体和样本

总体(population)

1、所研究的全部个体(数据)的集合,其中的每一个元素都成为个体

2、分为有限总体和无限总体

​ 有限总体的范围能够明确确定,且元素的数据是有限的

​ 无限总体所包括的元素是无限的,不可数 3、总体分为有限总体和无限总体是为了判别在抽样中每次抽取是否独立。对于无限总体,每次抽取一个单位并不影响下一次的抽样结果,而对于有限总体,上一次的抽样一定会影响下一次的抽样结果,因此是不独立的

样本

1、从总体中抽取的一部分元素的集合

2、构成样本的元素的数据成为样本容量

3、抽样的目的是为了根据样本提供的信息推断总体特征

参数和统计量

参数(parameter):

1、用来描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值

2、所关心的参数主要有总体均值μ、标准差σ、总体比例π等

3、总体参数通常用希腊字母表示

4、由于总体数据通常是不知道的,所以参数是一个未知常数。因此,才需要进行抽样,根据样本计算出某些值去估计总体参数

统计量(statistic)

1、用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数

2、所关心的杨桐统计量有样本均值x、样本标准差s、样本比例p等

3、样本统计量通常用小写英文字母来表示

4、抽样的目的就是要根据样本统计量去估计总体参数


变量

说明现象的某种特征的概念.变量的具体表现称为变量值,即数据。

按照变量的可计量尺度

1、分类变量(categorical variable): 说明事物类别的名称

2、顺序变量(rank variable):说明事物有序类别的名称

3、数值型变量(metric variable):说明事物数字特征的名称

​ a 离散变量:只能去可数值的变量,它只能去有限个值,而且其取值都以整位数断开,可以一一列举

​ b 连续变量: 可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举

按照变量所描述现象的确定性分类

随机变量

非随机变量

按照变量的来源

经验变量 : 描述的是周围环境可以观察到的事物

理论变量 : 统计学家用数学方法所构造出来的一些变量

典型统计软件

SAS :商业分析

SPSS :商业分析

MINITAB

STATISTICA

EXCEL

R

Eviews


2018-04-30

(0)

本文由 SilenceLee的学习笔记 作者:silencelee 发表,转载请注明来源!

热评文章

发表评论

解决 : *
19 − 3 =