样本均值 :反映数据集中趋势的指标

更新时间:2023-11-01 20:44

样本均值(sample 平均数)又叫样本均数,是指在一组数据中所有数据之和再除以数据的个数。它是反映数据集中趋势的一项指标。样本均值是由一个或多个随机变数中得到的统计量,当考虑单一随机变量时,样本均值为一个标量,即随机变数观测值的算术平均。若涉及多个随机变量,则样本均值是一个向量,包含了每个随机变量取样后得到的算术平均数。

概述

样本(sample)是指从总体中抽出的一部分个体,其所包含个体数目称为样本容量或含量,用符号N或n表示。总体(种群)是指具有某一特性的一类事物的全体,即性质相同个体的总和。样本是总体的一部分,用于提供总体信息以进行统计推断。例如,由于资源限制,无法对全国人口进行普查,但可以通过抽样调查获取所需信息。抽样是从总体中抽取样本的过程。

抽样方式

简单随机抽样是最常用的抽样方式,它确保总体中每个个体都有同等机会被选入样本。样本的平均值称为样本均值,样本偏离样本均值的平方的平均值称为样本方差。在数理统计学中,样本均值常用于估计总体均值,样本方差用于估计总体方差。

定义和性质

样本均值不仅是随机变量观测值的算术平均,而且是随机向量期望的无偏估计。随机向量是一个列向量,其每个元素为一个随机变量。样本均值的计算涉及所有观测值,因此与每次观测值相关。样本均值本身也是一个随机变量,具有自己的分布。对于每个随机变量,样本均值的分布的均值等于总体均值,其方差等于总体方差除以样本大小。

方差

样本均值是总体均值的有效且无偏的估计量。不同的样本可能会产生不同的样本均值,因此样本均值也有其自身的分布。对于第j个随机变量,其样本均值的分布的均值等于总体均值,方差等于总体方差除以样本大小。

影响因素

1、可接受的抽样风险可接受的抽样风险与样本规模成反比,注册会计师愿意接受的抽样风险越低,样本规模越大。

2、可容忍误差

(1)控制测试中,是注册会计师能够接受的最大偏差数量,如果偏差超过这一数量则减少或取消对内部控制程序的信赖。

(2)细节测试中,它指注册会计师确定的认定层次的重要性水平,可容忍误差越小,为实现同样的保证程度所需的样本规模越大。

3、预计总体误差

在既定的可容忍误差下,当预计总体误差增加时,所需的样本规模更大。

4、总体变异性

总体变异性是指总体的某一特征在各项目之间的差异程度。控制测试中,注册会计师在确定样本规模时一般不考虑总体变异性。在细节测试中,总体项目的变异性越低,通常样本规模越小。

5、总体规模

除非总体非常小,一般而言总体规模对样本规模的影响几乎为零。

免责声明
隐私政策
用户协议
目录 22
0{{catalogNumber[index]}}. {{item.title}}
{{item.title}}
友情链接: