当前位置:网站首页>总体标准差和样本标准差
总体标准差和样本标准差
2022-06-23 00:39:00 【littleBlackT】
总体方差 和 样本方差(sample variance)
设X为服从分布F的随机变量,如果 是随机变量X的期望值平均数 ()
随机变量X或者分布F的方差(英语:Variance)为:
但在一般情况下,对总体的每一个个体都进行观察或试验是不可能的。因此,必须对总体进行抽样观察 (采样) 。由于我们是利用抽样来对总体的分布进行推断, 所以抽样必须是随机的,抽样值应视为一组随机变量。由于抽样的目的是为了对总体的分布进行统计推断,为了使抽取的样本能很好地反映总体信息,必须考虑抽样方法。最常用的一种抽样方法叫作 "简单随机抽样",得到的样本称为简单随机样本,它要求抽取的样本满足以下两点:
代表性: 中每一个与所考察的总体有相同的分布; 独立性: 是相互独立的随机变量。
这样的样本叫做独立同分布(independent and identically distributed)样本,简称i.i.d.样本
在实践中采样得到i.i.d.样本之后,可以用样本方差 来近似总体方差 :
从自由度的角度理解
統計學上的自由度(degree of freedom, df),是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数称为该统计量的自由度。
在一组样本数据的均值确定后,如果知道了其中n-1个数的值,第n个数的值也就确定了。这里,均值就相当于一个 限制条件,由于加了这个限制条件,估计总体方差的自由度为 而不再是 。
也就是说,我们用样本均值来估计总体的期望值 的时候产生了一个限制条件使得剩余数据的自由度减小了。 假如仍然用作为分母的话,得到的方差的估计就会偏小,我们称之为biased sample variance(有偏样本方差)
从严谨的推导来理解
考虑一组样本数据
也就是说,数学推导可以证明的期望值并不等于,而是和它相差一个因子 ,换句话说,用作为分母会导致低估方差
所以我们需要对它进行修正得到无偏差的样本方差(Unbiased sample variance)
写在后面的话
这个问题反直觉的点就在于,为什么取样本计算方差的时候,分母得是而不是,我给出了两种比较初等的理解方式,个人认为,在理解过程中最重要的点是,区分什么是估计的,什么是真实的,比如说 就是用来估计 的
Reference:
https://www.jianshu.com/p/18aaa7b1cb09
https://www.zhihu.com/question/20099757?sort=created
https://www.zhihu.com/question/22983179
https://chinois.jinzhao.wiki/zh-hans/%E6%A8%99%E6%BA%96%E5%B7%AE
https://en.wikipedia.org/wiki/Variance
边栏推荐
- Shell view help
- Flink synchronizes MySQL data to es
- 通过天天基金投资基金安全吗?我打算开户买基金
- Which platform is safer to buy stocks on?
- LINQ query
- [machine learning watermelon book] update challenge [Day1]: 1.1 INTRODUCTION
- EasyCVR使用RTMP推流时不显示界面如何解决?
- Dual cross domain: access allow origin header contains multiple values "*, *", but only one is allowed
- SFOD:无源域适配升级优化,让检测模型更容易适应新数据
- 黄金etf持仓量如何算
猜你喜欢

数据库中数据的储存结构和方式是什么?

OSPF综合实验

3DMAX modeling notes (I): introducing 3DMAX and creating the first model Hello World

BGP联邦综合实验

cadence SPB17.4 - allegro - 優化指定單條電氣線折線連接角度 - 折線轉圓弧

Cadence spb17.4 - Allegro - optimize and specify the polyline connection angle of a single electrical line - polyline to arc

How to calculate the position of gold ETF

What is the storage structure and mode of data in the database?

Installing MySQL for Linux

图神经网络有哪些用途和应用?
随机推荐
Development status of full color LED display
二叉树转字符串及字符串转二叉树
層次選擇器
SAP ui5 application development tutorial 103 - how to consume third-party libraries in SAP ui5 applications
Wallys/DR7915-wifi6-MT7915-MT7975-2T2R-support-OpenWRT-802.11AX-supporting-MiniPCIe
Shell 查看帮助
图神经网络有哪些用途和应用?
Add / get and delete cookies
百度交易中台之钱包系统架构浅析
Installing MySQL for Linux
SAP mm me27 create intra company sto order
Learn the specific technical learning experience of designing reusable software from the three levels of class, API and framework
How to calculate the position of gold ETF
How about China International Futures Co., Ltd.? Is it a regular futures company? Is it safe to open an account online?
你踩过这些坑吗?谨慎在时间类型列上创建索引
打新债属于什么理财产品?
leetcode 91. Decode ways (medium)
MySQL-Seconds_ behind_ Master accuracy error
Js--- SVG to png
Real topic of the 2020 Landbridge cup provincial competition - go square (dp/dfs)