Skip to content

Commit

Permalink
👋geektime docs
Browse files Browse the repository at this point in the history
  • Loading branch information
zkep committed Feb 23, 2025
1 parent 0df4c8a commit a549a89
Show file tree
Hide file tree
Showing 9,297 changed files with 38,791 additions and 38,791 deletions.
The diff you're trying to view is too large. We only load the first 3000 changed files.
Original file line number Diff line number Diff line change
Expand Up @@ -191,14 +191,14 @@ $$

欢迎在留言区写下你的思考和想法,我们可以一起交流讨论。如果你觉得有所收获,欢迎你把课程分享给你的同事或朋友,一起共同进步!
<div><strong>精选留言(15)</strong></div><ul>
<li><span>启</span> 👍(14) 💬(1)<div>老师,如果一个AB实验的评价指标为用户日均app使用时长,AB两组各1w个用户,实验时长一个月。
<li><span>启</span> 👍(14) 💬(1)<p>老师,如果一个AB实验的评价指标为用户日均app使用时长,AB两组各1w个用户,实验时长一个月。
假设检验的目的是验证AB两组最终的差异delta是实验本身带来的差异,而不是抽样造成的差异。基于这个场景,我有两个问题:
1. 两组的差异delta理论上有可能来源于3个地方:用户抽样误差(只抽取了1w个用户,而没有抽取无限多用户);实验本身带来的差异;实验日期抽样误差(只实验了30天,而没有实验无限多天)。一般的AB实验中我们只考虑了前两个因素,那么对于实验日期抽样误差这个因素应该如何考虑?
2. 假设我把全国所有的用户分成AB两组做实验,是否可以将一组内所有用户一天的平均值当作一个样本进行检验?也就是说,如果实验持续30天,那么最终A组有30个样本,B组有30个样本</div>2021-02-08</li><br/><li><span>Kaye</span> 👍(10) 💬(1)<div>希望老师推荐一些AB测试的论文</div>2020-12-03</li><br/><li><span>何涛(Louis)</span> 👍(5) 💬(1)<div>想问问张老师有没有推荐的参考读物或者网站?多谢!</div>2020-12-03</li><br/><li><span>牛奶</span> 👍(4) 💬(1)<div>这其实是均值类变量的特性:当样本量足够大时,均值类变量会趋近于正态分布。这背后的理论基础,就是中心极限定理———这个“样本量”足够大的标准是30个,如果用上面的那个例子,一万个用户一个月内每日的平均使用app时长,这个30指的是要有一万个用户(抽样超过30个)还是说每个用户的数据要超过30个(一个月每天的使用时长,刚好30个)?</div>2021-05-18</li><br/><li><span>Geek_8c33f8</span> 👍(4) 💬(1)<div>老师好,
2. 假设我把全国所有的用户分成AB两组做实验,是否可以将一组内所有用户一天的平均值当作一个样本进行检验?也就是说,如果实验持续30天,那么最终A组有30个样本,B组有30个样本</p>2021-02-08</li><br/><li><span>Kaye</span> 👍(10) 💬(1)<p>希望老师推荐一些AB测试的论文</p>2020-12-03</li><br/><li><span>何涛(Louis)</span> 👍(5) 💬(1)<p>想问问张老师有没有推荐的参考读物或者网站?多谢!</p>2020-12-03</li><br/><li><span>牛奶</span> 👍(4) 💬(1)<p>这其实是均值类变量的特性:当样本量足够大时,均值类变量会趋近于正态分布。这背后的理论基础,就是中心极限定理———这个“样本量”足够大的标准是30个,如果用上面的那个例子,一万个用户一个月内每日的平均使用app时长,这个30指的是要有一万个用户(抽样超过30个)还是说每个用户的数据要超过30个(一个月每天的使用时长,刚好30个)?</p>2021-05-18</li><br/><li><span>Geek_8c33f8</span> 👍(4) 💬(1)<p>老师好,
关于“概率类指标,能否使用t检验?”这个问题,
如果核心指标是比例,能都用这个比例指标(A除以B计算后的指标值)再去计算整体的均值?这样理解是不是概率类&#47;比例类指标是不是也可以使用T检验呢</div>2021-03-22</li><br/><li><span>蚂蚁内推+v</span> 👍(3) 💬(1)<div>老师,直观理解,下载率不应该是一个连续型随机变量吗?为什么会服从二项分布?</div>2020-12-26</li><br/><li><span>Jabin</span> 👍(3) 💬(1)<div>老师,之后的实战课程是会把源数据及代码贴出来的吧</div>2020-12-06</li><br/><li><span>Tasty Joy</span> 👍(2) 💬(2)<div>在案例中,NP=样本大小*百分之10,为什么是10%呢?案例中哪里可以看出来。P不是代表概率的平均值吗?那么概率的平均值怎么算?</div>2021-02-05</li><br/><li><span>贤者时间</span> 👍(2) 💬(6)<div>请问老师:
如果核心指标是比例,能都用这个比例指标(A除以B计算后的指标值)再去计算整体的均值?这样理解是不是概率类&#47;比例类指标是不是也可以使用T检验呢</p>2021-03-22</li><br/><li><span>蚂蚁内推+v</span> 👍(3) 💬(1)<p>老师,直观理解,下载率不应该是一个连续型随机变量吗?为什么会服从二项分布?</p>2020-12-26</li><br/><li><span>Jabin</span> 👍(3) 💬(1)<p>老师,之后的实战课程是会把源数据及代码贴出来的吧</p>2020-12-06</li><br/><li><span>Tasty Joy</span> 👍(2) 💬(2)<p>在案例中,NP=样本大小*百分之10,为什么是10%呢?案例中哪里可以看出来。P不是代表概率的平均值吗?那么概率的平均值怎么算?</p>2021-02-05</li><br/><li><span>贤者时间</span> 👍(2) 💬(6)<p>请问老师:
均值类指标服从正态分布的例子是不是有点问题呢?
“我们再用一个社交 App 业务指标的例子,来强化下对正态分布的理解。现在有一个社交 App,我们想要了解用户日均使用时间 t 的概率分布。”
按照我对中心极限定理的理解,这个例子似乎应该这么解释:该APP的全量用户的平均日均使用时长是t,当对全量用户抽样出N个用户,再求其均值T,这个T才符合正态分布,其均值是t。
根据我的经验,app的用户使用时长通常来说不可能是正态分布,通常是幂律分布。。所以想跟老师探讨一下,这个例子的阐述是不是有些问题呢?</div>2020-12-22</li><br/><li><span>牛奶</span> 👍(1) 💬(1)<div>通过数据分析发现,每分钟平均有 10 个人会看到广告,下载率集中分布在 0-30% 之间。-----这部分内容有些没有明白。虽然说“单个二元事件的结果,只能是发生或者不发生”,然后为了分析需要把数据进行一定程度的聚合,这次分析选择按分钟聚合;然后实际拥有“一个月的用户及下载数据,一个月一共有 43200 分钟,所以一共有 43200 个数据点”,是如何计算出来“每分钟平均有 10 个人会看到广告,下载率集中分布在 0-30% 之间”?尤其是集中在0-30%?不是很懂,希望老师可以辛苦解答</div>2021-05-19</li><br/><li><span>何晓虎</span> 👍(0) 💬(1)<div>那个点击率的测试,样本量如果是10的话,那么43200这个数字的意义是什么?</div>2021-08-19</li><br/><li><span>Td</span> 👍(0) 💬(1)<div>老师请问“概率在某种程度上也是平均值”这个应该怎么去理解呢?</div>2021-07-27</li><br/><li><span>Leung-鱼蛋</span> 👍(0) 💬(1)<div>大学学习的概率课程已经还给老师了😂</div>2021-07-12</li><br/><li><span>梦倚栏杆</span> 👍(0) 💬(1)<div>看着每一个熟悉有陌生的名词:好像还有珀松分布吧,大学时代的统计学全还给老师了,坦白说理论基础还是没看懂。</div>2021-06-22</li><br/><li><span>Geek_30a04e</span> 👍(0) 💬(1)<div>老师,怎么没有视频教学呢,语音对我这种基础性较差的不是很友好</div>2021-05-21</li><br/>
根据我的经验,app的用户使用时长通常来说不可能是正态分布,通常是幂律分布。。所以想跟老师探讨一下,这个例子的阐述是不是有些问题呢?</p>2020-12-22</li><br/><li><span>牛奶</span> 👍(1) 💬(1)<p>通过数据分析发现,每分钟平均有 10 个人会看到广告,下载率集中分布在 0-30% 之间。-----这部分内容有些没有明白。虽然说“单个二元事件的结果,只能是发生或者不发生”,然后为了分析需要把数据进行一定程度的聚合,这次分析选择按分钟聚合;然后实际拥有“一个月的用户及下载数据,一个月一共有 43200 分钟,所以一共有 43200 个数据点”,是如何计算出来“每分钟平均有 10 个人会看到广告,下载率集中分布在 0-30% 之间”?尤其是集中在0-30%?不是很懂,希望老师可以辛苦解答</p>2021-05-19</li><br/><li><span>何晓虎</span> 👍(0) 💬(1)<p>那个点击率的测试,样本量如果是10的话,那么43200这个数字的意义是什么?</p>2021-08-19</li><br/><li><span>Td</span> 👍(0) 💬(1)<p>老师请问“概率在某种程度上也是平均值”这个应该怎么去理解呢?</p>2021-07-27</li><br/><li><span>Leung-鱼蛋</span> 👍(0) 💬(1)<p>大学学习的概率课程已经还给老师了😂</p>2021-07-12</li><br/><li><span>梦倚栏杆</span> 👍(0) 💬(1)<p>看着每一个熟悉有陌生的名词:好像还有珀松分布吧,大学时代的统计学全还给老师了,坦白说理论基础还是没看懂。</p>2021-06-22</li><br/><li><span>Geek_30a04e</span> 👍(0) 💬(1)<p>老师,怎么没有视频教学呢,语音对我这种基础性较差的不是很友好</p>2021-05-21</li><br/>
</ul>
Original file line number Diff line number Diff line change
Expand Up @@ -204,20 +204,20 @@ prop.test(x = c(2440, 2089), n = c(43578, 43524), alternative = "two.sided", con

欢迎在留言区写下你的思考和想法,我们可以一起交流讨论。如果你觉得有所收获,欢迎你把课程分享给你的同事或朋友,一起共同进步!
<div><strong>精选留言(15)</strong></div><ul>
<li><span>孙小军</span> 👍(13) 💬(18)<div>关于对p值的理解,想请问老师:
<li><span>孙小军</span> 👍(13) 💬(18)<p>关于对p值的理解,想请问老师:

“当我们在 A&#47;B 测试中观测到“实验组和对照组指标不同”的概率(P 值)很大,比如 70%,那么在零假设成立时,我们观测到这个事件还是很有可能的。“ 不太理解这句,零假设成立的意思是实验组和对照组指标相同,但是观测得到两组的指标不同的概率是70%,这时为什么要接受零假设呢?</div>2020-12-24</li><br/><li><span>豆丁儿</span> 👍(2) 💬(1)<div>过来查缺补漏的,老师很专业,讲的很清楚</div>2021-04-06</li><br/><li><span>Dan</span> 👍(2) 💬(2)<div>老師您好,双尾检验可以帮助我们全面考虑变化带来的正、负面结果,那如何檢驗是正面還負面結果?一般來說來我們希望實驗組(Ex:新的推薦演算法)的結果比較好,為何AB test不常使用单尾检验?</div>2021-03-25</li><br/><li><span>西西</span> 👍(2) 💬(1)<div>如果不只两个实验可以用t或z检验吗?一个对照组两个实验组,用实验组分别和对照组做假设检验吗?</div>2020-12-16</li><br/><li><span>Geek_63ee39</span> 👍(1) 💬(5)<div>请问老师,原文中提到:“二项分布的总体方差的计算不需要知道总体中各个数据的值,可以通过样本数据求得总体方差”。比如“对某一内容曝光50次,其点击次数“这个随机变量服从二项分布,做了一次试验,观测到有5个人点击,那么总体方差等于多少,怎么计算?</div>2021-01-16</li><br/><li><span>皓昊</span> 👍(1) 💬(2)<div>老师,采用python 进行置信区间法检验,得到ci_low,ci_upp两个参数,这两个参数都是区间值,如下。这两个参数的区间该怎么理解呢。
“当我们在 A&#47;B 测试中观测到“实验组和对照组指标不同”的概率(P 值)很大,比如 70%,那么在零假设成立时,我们观测到这个事件还是很有可能的。“ 不太理解这句,零假设成立的意思是实验组和对照组指标相同,但是观测得到两组的指标不同的概率是70%,这时为什么要接受零假设呢?</p>2020-12-24</li><br/><li><span>豆丁儿</span> 👍(2) 💬(1)<p>过来查缺补漏的,老师很专业,讲的很清楚</p>2021-04-06</li><br/><li><span>Dan</span> 👍(2) 💬(2)<p>老師您好,双尾检验可以帮助我们全面考虑变化带来的正、负面结果,那如何檢驗是正面還負面結果?一般來說來我們希望實驗組(Ex:新的推薦演算法)的結果比較好,為何AB test不常使用单尾检验?</p>2021-03-25</li><br/><li><span>西西</span> 👍(2) 💬(1)<p>如果不只两个实验可以用t或z检验吗?一个对照组两个实验组,用实验组分别和对照组做假设检验吗?</p>2020-12-16</li><br/><li><span>Geek_63ee39</span> 👍(1) 💬(5)<p>请问老师,原文中提到:“二项分布的总体方差的计算不需要知道总体中各个数据的值,可以通过样本数据求得总体方差”。比如“对某一内容曝光50次,其点击次数“这个随机变量服从二项分布,做了一次试验,观测到有5个人点击,那么总体方差等于多少,怎么计算?</p>2021-01-16</li><br/><li><span>皓昊</span> 👍(1) 💬(2)<p>老师,采用python 进行置信区间法检验,得到ci_low,ci_upp两个参数,这两个参数都是区间值,如下。这两个参数的区间该怎么理解呢。

ci_low,ci_upp=proportion_confint(counts,nobs,alpha=0.05,method=&#39;normal&#39;)
print(&#39;ci_low:{0},ci_upp:{1}&#39;.format(ci_low,ci_upp))
ci_low:[0.053833 0.04707099],ci_upp:[0.05815011 0.05117941]</div>2020-12-13</li><br/><li><span>Geek_0e2f02</span> 👍(1) 💬(1)<div>t检验就是小样本情况下的z检验,能用Z检验的地方都可以用t检验,可以这么理解吗,老师</div>2020-12-13</li><br/><li><span>Kendal</span> 👍(1) 💬(3)<div>后面会讲如何控制 alpha和beta么?比如不是常见的5%,20%。是通过样本数量来控制么?</div>2020-12-10</li><br/><li><span>Shehla</span> 👍(1) 💬(1)<div>非常好,逻辑清晰,地铁上听着也很方便,感谢</div>2020-12-10</li><br/><li><span>不知太平</span> 👍(0) 💬(2)<div>老师,你好。我工作中在做AB测试的时候,定的目标是实验组比对照组目标转化率高30%,实际发现30%这个数字是否合理很难确定。是不是说如果用假设检验验证的话,就不用定这个数值,只需要判断两组是否显著不同,如果是,且实验组转化率比对照组高,就可以认为实验组成功了?</div>2021-08-11</li><br/><li><span>API接口调用工程师</span> 👍(19) 💬(0)<div>是这样的 我认为作者应该把因果关系转换过来说。
ci_low:[0.053833 0.04707099],ci_upp:[0.05815011 0.05117941]</p>2020-12-13</li><br/><li><span>Geek_0e2f02</span> 👍(1) 💬(1)<p>t检验就是小样本情况下的z检验,能用Z检验的地方都可以用t检验,可以这么理解吗,老师</p>2020-12-13</li><br/><li><span>Kendal</span> 👍(1) 💬(3)<p>后面会讲如何控制 alpha和beta么?比如不是常见的5%,20%。是通过样本数量来控制么?</p>2020-12-10</li><br/><li><span>Shehla</span> 👍(1) 💬(1)<p>非常好,逻辑清晰,地铁上听着也很方便,感谢</p>2020-12-10</li><br/><li><span>不知太平</span> 👍(0) 💬(2)<p>老师,你好。我工作中在做AB测试的时候,定的目标是实验组比对照组目标转化率高30%,实际发现30%这个数字是否合理很难确定。是不是说如果用假设检验验证的话,就不用定这个数值,只需要判断两组是否显著不同,如果是,且实验组转化率比对照组高,就可以认为实验组成功了?</p>2021-08-11</li><br/><li><span>API接口调用工程师</span> 👍(19) 💬(0)<p>是这样的 我认为作者应该把因果关系转换过来说。
我们在现实生活中已经观测到了A,B两种事物的样本统计值有一定差异,我们可以把这个事件命名为C。
但我们不知道他们所属于的总体是否有差异。
在这样的情况下,我们可以提出两种假设。
H0:总体是没有差别的 H1:总体是有差别的
那么p值计算的是 p(C|H0),即零假设成立时发生事件C的概率大小。现在我们已经知道C是一个已经发生的事件,如果我们计算出来的条件概率p(C|H0)=0.01,是说明这个事件是一件非常小概率的事件,不太可能发生的,我们此时应该拒绝原假设H0这种条件,认为C不是在这种条件下发生的。
引用:en.wikipedia.org&#47;wiki&#47;P-value</div>2021-10-18</li><br/><li><span>蝈蝈</span> 👍(2) 💬(0)<div>老师你好,在推荐算法的那个例子中,使用AB测试只能检验两个算法是否相同,如果最终推断结论是两个算法不同,那么如何判断哪个更好呢?直接根据点击率大小进行判断吗?</div>2022-04-16</li><br/><li><span>Geek_7d7659</span> 👍(0) 💬(0)<div>请教老师两个问题
引用:en.wikipedia.org&#47;wiki&#47;P-value</p>2021-10-18</li><br/><li><span>蝈蝈</span> 👍(2) 💬(0)<p>老师你好,在推荐算法的那个例子中,使用AB测试只能检验两个算法是否相同,如果最终推断结论是两个算法不同,那么如何判断哪个更好呢?直接根据点击率大小进行判断吗?</p>2022-04-16</li><br/><li><span>Geek_7d7659</span> 👍(0) 💬(0)<p>请教老师两个问题
1、核心指标人均收入,如果是AAB 或AABB 或ABBB实验,也是用T检验方法吗?
2、P和置信区间,如果P小于0.05 那么通过置信区间检验时也一定是显著吗?(想了解P值和区间区间在显著性判断时是否一定得到相同结论)</div>2025-02-15</li><br/><li><span>Geek_7d7659</span> 👍(0) 💬(0)<div>请教老师两个问题:
1、上面提到双样本检验,如果时看核心指标人均收入,实验方式为AAB 或AABB 或ABBB实验时,也是用T检验吗?</div>2025-02-15</li><br/><li><span>张沛</span> 👍(0) 💬(0)<div>T校验和Z校验的一些定义都没交代,就给出使用场景,看的是云里雾里,感觉组织顺序还是需要照顾下新手</div>2025-01-26</li><br/>
2、P和置信区间,如果P小于0.05 那么通过置信区间检验时也一定是显著吗?(想了解P值和区间区间在显著性判断时是否一定得到相同结论)</p>2025-02-15</li><br/><li><span>Geek_7d7659</span> 👍(0) 💬(0)<p>请教老师两个问题:
1、上面提到双样本检验,如果时看核心指标人均收入,实验方式为AAB 或AABB 或ABBB实验时,也是用T检验吗?</p>2025-02-15</li><br/><li><span>张沛</span> 👍(0) 💬(0)<p>T校验和Z校验的一些定义都没交代,就给出使用场景,看的是云里雾里,感觉组织顺序还是需要照顾下新手</p>2025-01-26</li><br/>
</ul>
Loading

0 comments on commit a549a89

Please sign in to comment.