当前位置:网站首页>数据分析知识点搜集(纯粹的搜集)
数据分析知识点搜集(纯粹的搜集)
2022-08-03 22:53:00 【二思后行】
A/B Testing
A/B 测试是促进业务持续增长的最实用、最有效的方式。
主要是实验组和对照组的对比,观察(A/B差别的显著性)是否符合统计上的显著和业务上的显著。
产品迭代流程
产品 / 业务迭代的流程大概分为 3 步:
- 具体的业务问题催生出迭代的想法,比如出现业务问题后,团队会提出具体的迭代方案;
- 团队论证方案的可行性和效果;
- 论证完成后,具体实施迭代方案。
棣莫弗—拉普拉斯中心极限定理
棣莫弗—拉普拉斯中心极限定理(De Moivre-Laplace),即二项分布以正态分布为其极限分布定律。
中心 极限定理
不管是什么概率分布,只要样本数据量足够大,样本 统计量近似服从 正态分布
中心极限定理在A/B测试中的应用
中心极限定理是概率论中最重要的一类定理,它支撑着和置信区间相关的T检验和假设检验的计算公式和相关理论。如果没有这个定理,之后的推导公式都是不成立的。
事实上,以上对于中心极限定理的两种解读,在不同的场景下都可以对A/B测试的指标置信区间判定起到一定作用。
- 对于属于正态分布的指标数据,我们可以很快捷地对它进行下一步假设检验,并推算出对应的置信区间;
- 而对于那些不属于正态分布的数据,根据中心极限定理,在样本容量很大(>30)时,总体参数的抽样分布是趋向于正态分布的,最终都可以依据正态分布的检验公式对它进行下一步分析。
幂律分布
统计物理学家习惯于把服从幂律分布的现象称为无标度现象,即,系统中个体的尺度相差悬殊,缺乏一个优选的规模。可以说,凡有生命的地方,有进化,有竞争的地方都会出现不同程度的无标度现象。
指标的统计属性
- 均值类的指标,比如用户的平均使用时长、平均购买金额、平均购买频率,等等。
- 概率类的指标,比如用户点击的概率(点击率)、转化的概率(转化率)、购买的概率(购买率),等等。
在数量足够大时,均值类指标服从正态分布;概率类指标本质上服从二项分布,但当数量足够大时,也服从正态分布。
假设检验
Null Hypothesis
Alternative Hypothesis
- 零假设是,实验组和对照组的点击率是相同的。
- 备择假设是,实验组和对照组的点击率是不同的。
在 A/B 测试的实践中,更推荐使用双尾检验。
T检验和Z检验
根本是,方差是否知道。
不知道,就用样本反差估计总体方差,然后用t检验,但是在现在的大数据时代,基本上只要样本量>30就可以认为Z和T检验是一样的。

第一类错误 a
假阳性概率
误诊
第二类错误 b
假阴性概率
漏诊
把握度power
1-b = 不漏的概率
P值
当零假设成立,观测到对照组和实验组不同的概率。
边栏推荐
- 【MySQL进阶】数据库与表的创建和管理
- noip preliminary round
- UVa 1025 - A Spy in the Metro (White Book)
- utils timer
- Testng listener
- What is Adobe?
- Cisco ike2 IPSec configuration
- Unity2021发布WebGL雾效消失问题
- On the Qixi Festival of 2022, I will offer 7 exquisite confession codes, and at the same time teach you to quickly change the source code for your own use
- 重发布实验报告
猜你喜欢

Boss: There are too many systems in the company, can you realize account interoperability?

Pytest学习-setup/teardown

Cisco ike2 IPSec configuration

Diazo Biotin-PEG3-DBCO | Diazo Compound Modified Biotin-Tripolyethylene Glycol-Dibenzocyclooctyne

直播预告 | 构建业务智联,快速拥抱财务数字化转型

2022-08-03 Oracle executes slow SQL-Q17 comparison

complete binary tree problem

Zilliz 2023 秋季校园招聘正式启动!

win10系统下yolov5-V6.1版本的tensorrt部署细节教程及bug修改

Cisco ike2 IPSec配置
随机推荐
目标检测技术研究现状及发展趋势
代码随想录笔记_动态规划_416分割等和子集
utils 定时器
With 4 years of work experience, the 5 communication methods between multi-threads can't be said, can you believe it?
Testng监听器
What is Adobe?
【day6】类与对象、封装、构造方法
【RYU】rest_router.py源码解析
2022-08-02 mysql/stonedb slow SQL-Q18 - memory usage surge analysis
Zilliz 2023 秋季校园招聘正式启动!
二叉搜索树解决落叶问题
The principle and use of AOSP CameraLatencyHistogram
Basic Concepts of Graphs
LabVIEW code generation error 61056
UVa 10003 - Cutting Sticks(白书,区间DP)
设置工作模式与环境(下):探查和收集信息
On the Qixi Festival of 2022, I will offer 7 exquisite confession codes, and at the same time teach you to quickly change the source code for your own use
如何基于WPF写一款数据库文档管理工具(二)
FinClip最易用的智能电视小程序
Code Casual Recording Notes_Dynamic Programming_416 Segmentation and Subsetting
