当前位置:网站首页>统计学之样本和总体的关系: 样本成功比例+中心极限定理(样本均值)
统计学之样本和总体的关系: 样本成功比例+中心极限定理(样本均值)
2022-07-24 05:16:00 【xupeggy163】
中心极限定理
如何计算样本中成功占比的概率?
到底算的是什么?
概括的说,即,已知总体中成功元素占比及样本大小,推算出样本达到某指定成功占比的概率
分解概念1: 什么叫总体中成功元素占比?
举例说明:
- 假设总体为1000糖球,其中红色糖球的占比30%,此处30%为成功元素占比
- 假设总体为1000道题目,其中答对题目的占比为25%, 此处25%为成功元素占比。
分解概念2: 什么是样本大小呢?
比如1000粒糖球中取100粒样本,100粒糖球就是这个样本的大小。
分解概念3: 推算出样本达到某指定成功占比的概率,这句话是什么意思呢?
- 比如我们要求推算100粒糖球中(总体1000粒)红色糖球占比20%的概率。其中,20%为指定样本成功占比。100为样本大小。
- 再例如,我们要求推算200道题目中(总体1000道题)答对50%的概率。其中,50%为指定样本成功占比,200为样本大小。
思路与计算公式
- 关于这类模式的计算我们需要从题目中提炼下面三个要素:
- n - 已知样本数目
- p - 已知总体成功暂避
- x - 指定样本成功占比
- 求样本中某个成功占比的概率 P s P_s Ps
根据以上信息,计算样本均值和方差:
均值: E ( P s ) = p E(P_s)=p E(Ps)=p
方差: V a r ( P s ) = p q n ( q = 1 − p ) Var(P_s)=\frac{pq}{n} (q=1-p) Var(Ps)=npq(q=1−p)确定 P s P_s Ps的分布
当n很大时(所谓很大,即n>30), P s P_s Ps近似如下正态分布:
P s ∽ N ( p , p q n ) P_s \backsim N\Big(p,\frac{pq}{n}\Big) Ps∽N(p,npq)计算正态分布
不要忘记连续修正= ± 1 2 n \pm\frac{1}{2n} ±2n1, 什么时候用连续修正呢?
当总体是二项式分布的时候,且用正态分布来模拟二项式分布的计算的时候,需要连续修正。原因是,二项式分布是离散分布,正态分布是连续分布。连续修正就是为了弥补离散分布转连续分布的误差。
x ′ = x ± 1 2 n x' = x \pm\frac{1}{2n} x′=x±2n1
z = x ′ − μ σ z=\frac{x'-\mu}{\sigma} z=σx′−μ
应用实例:
总体中有25%红色糖球,取样本100粒糖球,求样本中出现 ≥ \geq ≥ 40%红色糖球的概率
从上面的信息我们能得知如下信息:
- p = 25% 红球占比
- n = 100 , 样本大小
- q = 1-p = 75%, 非红球占比
- x = 40% , 指定样本中红球占比
- 修正值=- 1 2 n = − 0.005 \frac{1}{2n}=-0.005 2n1=−0.005
当求概率>=40%,我们使用负修正值
根据上面的信息,计算标准分,然后查询正态分布表,即可得出样本中红球比例达到40%以上的概率。此处省略具体计算。
如何计算样本均值的概率?
说明
已知总体均值、方差及样本大小,推算样本中的均值达到某一数值的概率
思路与计算公式
计算样本的均值和方差:
假设总体的均值为 μ \mu μ, 方差为 σ 2 \sigma^2 σ2, 那么样本的均值和方差分别为:
E ( x ‾ ) = μ V a r ( x ‾ ) = σ 2 n E(\overline x)=\mu\\ Var(\overline x)=\frac{\sigma^2}{n} E(x)=μVar(x)=nσ2分析样本的分布形态
如果从一个非正态分布的总体X中取出一个样本,且样本很大,则 X ‾ \overline X X 的分布近似为正态分布。使用中心极限定理:
X ‾ ∽ N ( μ , σ 2 n ) \underline X \backsim N(\mu,\frac{\sigma^2}{n}) X∽N(μ,nσ2)
应用实例
每袋糖球的均值为10, 方差为1,抽取30袋糖球,样本均值小于等于8.5的概率是多少?
这道题是求样本均值<8.5的概率?
应用中心极限定理
X ‾ ∽ N ( μ , σ 2 n ) μ = 10 , σ 2 = 1 X ‾ ∽ N ( 10 , 0.0333 ) \overline X \backsim N(\mu,\frac{\sigma^2}{n})\\ \mu=10,\sigma^2=1\\ \overline X \backsim N(10,0.0333) X∽N(μ,nσ2)μ=10,σ2=1X∽N(10,0.0333)
计算标准值
P ( x ‾ < 8.5 ) P(\overline x <8.5) P(x<8.5) 的数值是多少呢?通过计算标准分及查询正态分布表得出结果。
z = x − μ σ = 8.5 − 10 0.0333 = − 8.22 z=\frac{x-\mu}{\sigma}=\frac{8.5-10}{\sqrt{0.0333}}=-8.22 z=σx−μ=0.03338.5−10=−8.22
P ( Z < z ) = P ( Z < − 8.22 ) P(Z<z)=P(Z<-8.22) P(Z<z)=P(Z<−8.22)
总结
已知总体成功率,求样本成功率等于某特定值得概率
已知总体均值,求样本均值等于某特定的概率
边栏推荐
- 【sklearn】PCA
- 1、基于增量式生成遮挡与对抗抑制的行人再识别
- I'm interested in reading efficient reading - the most cost-effective self investment
- The fourth job: about the usage of cat, grep, cut, sort, uniq, VIM, TR and other commands
- T 11-20
- 线程的介绍
- MySQL connection
- 泛型和注解
- Scikit learn -- steps of machine learning application development
- 【常用技巧】
猜你喜欢

熊市抄底指南

Wang Qing, director of cloud infrastructure software research and development of Intel (China): Intel's technology development and prospects in cloud native

Bear market bottoming Guide

Beginners' preparation for the Blue Bridge Cup (University Programming learning history records, topic ideas for students who need to prepare for the Blue Bridge Cup)

Image to image translation with conditional advantageous networks paper notes

【sklearn】PCA

Binary SCA fingerprint extraction black Technology: go language Reverse Technology

Hcip-- review the homework for the next day
![[database connection] - excerpt from training](/img/7d/334b4b7f0f6e1de228c4ecb1e600a3.png)
[database connection] - excerpt from training
![Embedded system transplantation [3] - uboot burning and use](/img/36/69daec5f1fe41bd3d0433d60816bba.png)
Embedded system transplantation [3] - uboot burning and use
随机推荐
熊市抄底指南
Fiddler抓包工具的使用
[Basic 6] - encapsulation and inheritance of classes, objects and classes
Tips for using BeanShell built-in variable prev
Codeforce:d2. remove the substring (hard version) [greedy string + subsequence]
Smart pointer, lvalue reference, lvalue reference, lambda expression
编译型语言和解释型语言的区别
[basic 7] - exceptions, capture and customize exceptions
Bear market bottoming Guide
jdbc封装一个父类减少代码重复
Read "effective managers - Drucker"
【Pytorch】Dataset_DataLoader
【dp】数字三角形
)的低字节来反馈给应用层或者成多种格式文档:
【常用技巧】
AttributeError: ‘NoneType‘ object has no attribute ‘shape‘
13. Write a program, in which a user-defined function is used to judge whether an integer is a prime number. The main function inputs a number and outputs whether it is a prime number.
Ren Xudong, chief open source liaison officer of Huawei: deeply cultivate basic software open source and jointly build the root technology of the digital world
Heavy! The 2022 China open source development blue book was officially released
反射的介绍