当前位置:网站首页>总体标准差和样本标准差
总体标准差和样本标准差
2022-06-23 00:39:00 【littleBlackT】
总体方差 和 样本方差(sample variance)
设X为服从分布F的随机变量,如果 是随机变量X的期望值平均数 ()
随机变量X或者分布F的方差(英语:Variance)为:
但在一般情况下,对总体的每一个个体都进行观察或试验是不可能的。因此,必须对总体进行抽样观察 (采样) 。由于我们是利用抽样来对总体的分布进行推断, 所以抽样必须是随机的,抽样值应视为一组随机变量。由于抽样的目的是为了对总体的分布进行统计推断,为了使抽取的样本能很好地反映总体信息,必须考虑抽样方法。最常用的一种抽样方法叫作 "简单随机抽样",得到的样本称为简单随机样本,它要求抽取的样本满足以下两点:
代表性: 中每一个与所考察的总体有相同的分布; 独立性: 是相互独立的随机变量。
这样的样本叫做独立同分布(independent and identically distributed)样本,简称i.i.d.样本
在实践中采样得到i.i.d.样本之后,可以用样本方差 来近似总体方差 :
从自由度的角度理解
統計學上的自由度(degree of freedom, df),是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数称为该统计量的自由度。
在一组样本数据的均值确定后,如果知道了其中n-1个数的值,第n个数的值也就确定了。这里,均值就相当于一个 限制条件,由于加了这个限制条件,估计总体方差的自由度为 而不再是 。
也就是说,我们用样本均值来估计总体的期望值 的时候产生了一个限制条件使得剩余数据的自由度减小了。 假如仍然用作为分母的话,得到的方差的估计就会偏小,我们称之为biased sample variance(有偏样本方差)
从严谨的推导来理解
考虑一组样本数据
也就是说,数学推导可以证明的期望值并不等于,而是和它相差一个因子 ,换句话说,用作为分母会导致低估方差
所以我们需要对它进行修正得到无偏差的样本方差(Unbiased sample variance)
写在后面的话
这个问题反直觉的点就在于,为什么取样本计算方差的时候,分母得是而不是,我给出了两种比较初等的理解方式,个人认为,在理解过程中最重要的点是,区分什么是估计的,什么是真实的,比如说 就是用来估计 的
Reference:
https://www.jianshu.com/p/18aaa7b1cb09
https://www.zhihu.com/question/20099757?sort=created
https://www.zhihu.com/question/22983179
https://chinois.jinzhao.wiki/zh-hans/%E6%A8%99%E6%BA%96%E5%B7%AE
https://en.wikipedia.org/wiki/Variance
边栏推荐
- OpenCvSharp (C# OpenCV) 微信QRCode解码功能使用介绍(附源码)
- SAP ui5 application development tutorial 103 - how to consume third-party libraries in SAP ui5 applications
- Typecho imite le modèle de thème du blog Lu songsongsong / modèle de thème du blog d'information technologique
- Some thoughts about the technology of test / development programmers are very advanced, and they can't go on
- SAP ui5 application development tutorial 102 - detailed explanation of the print function of SAP ui5 applications
- Does qiniu school belong to a securities company? Is it safe to open an account?
- Typecho imitation of Lu Songsong's blog theme template / Technology Information blog theme template
- [UVM] don't say that your VIP can't use ral model
- 打新债到底靠不靠谱呀?是不是安全的?
- E-R diagram
猜你喜欢

JMeter associated login 302 type interface

Daily question brushing record (I)

three. JS simulated driving tour art exhibition hall - creating super camera controller

07 project cost management

Sfod: passive domain adaptation and upgrade optimization, making the detection model easier to adapt to new data

基于深度学习的视觉目标检测技术综述

SAP mm transaction code vl04 create outbound delivery for sto

TiDB VS MySQL

3DMAX modeling notes (I): introducing 3DMAX and creating the first model Hello World

How about precious metal spot silver?
随机推荐
Because I said: volatile is a lightweight synchronized, the interviewer asked me to go back and wait for the notice!
MySQL - SQL execution process
OSPF experiment in mGRE environment
Is it safe to invest in funds through daily funds? I intend to open an account to buy funds
How to get started with machine learning?
Shell 日志与打印输出
C language student achievement ranking system
你好,启牛商学院商学院赠送的证券账户安全吗?我该怎么开安全的股票账户来炒股
JMeter associated login 302 type interface
Typecho仿卢松松博客主题模板/科技资讯博客主题模板
E-R diagram
Tidb monitoring upgrade: a long way to solve panic
BGP federal comprehensive experiment
Daily question brushing record (I)
Shell logs and printouts
3DMAX modeling notes (I): introducing 3DMAX and creating the first model Hello World
使用aggregation API扩展你的kubernetes API
Xiaobai operates win10 to expand Disk C (allocate disk D memory to Disk C) and the test is valid for many times
【滑动窗口】leetcode992. Subarrays with K Different Integers
Add expiration time for localstorage