指数分布到底怎么描述“寿命”的问题?详解泊松分布和指数分布!【未央の学习随想】

เนื้อหาวิดีโอต้นฉบับขยายวิดีโอ
  • 未央的学习随想栏目介绍
  • 讲解博松分布与指数分布公式的来源与意义
  • 通过二项分布探究博松分布与指数分布
  • 讨论参数与概率的关系
  • 了解博松过程与电子元件故障的实例
  • 理解指数分布的无记忆性质

各位同学大家好,这里是未央的学习随想栏目。
本期视频我们来给大家讲解博松分布指数分布公式的来源与意义。

同学们在学习概率论时,会接触到这两种随机变量的分布规律,但是课本上只给出了他们各自的分布率或密度含书和简单的用途。
至于为什么能这么用,为什么公式就长这个样子?一概没有说。
下面我们就从我们最熟悉也最常用的分布,二项分布出发,来探究博松分布、指数分布的实际意义。

首先我们来看博松分布。
课本上直接给出了像如图所示的这样的公式,大家都很熟悉了。
并且博松分布是二项分布在N区无穷时的极限,这个结论大家也不陌生。
但我们不知道的是,这个分布率究竟是怎么来的呢?
为什么它就可以表示这个概率呢?为什么它的参数就是这个期望呢?

我们在这里简单的举个例子。
比如说某游戏内的摇钱数每小时产生元宝数量的期望值为10。
那么在某一小时内,它产生X个元宝的概率是多少呢?显然它并不可能是PX等于1,产生元宝的个数总是会浮动的。
那么X等于9的概率是多少呢?X等于11呢?这样的变量就服从博松分布。

我们来考虑一些更数学的问题。
虽然说时间是个连续的量,但是在某个时间段内观察某件事,观察结果应当是离散的,发生了,或者没有发生。
假如玩家观察一次摇钱数,发现它产生了元宝的概率为P,那么如果玩家比较懒,一分钟来看一次这个P应该是多少呢?
实际上是一个二项分布,对吧?一小时内,玩家应该会观察60次,而结果已经知道了,观察到金元宝的次数X期望应当是10。

虽然我们还没有学到下一章的内容,但是凭借高中知识,大家也知道,服从二项分布的随机变量X的期望值为Lambda等于NP,因此Lambda等于10,N等于60,P应该是六分之一。
那么假如玩家观察得更勤快一点,它每半分钟就看一次,那么就观察了N等于120次。
此时这个概率P应当同步的减小到十二分之一,否则它一小时下来能看到产生了20个金元宝,游戏公司亏麻了。

我们再将它观察的时间间隔缩小,一直缩到无穷小,那么其实就是观察次数N无穷大。
此时P也应该跟着无穷小,但是仍然保持NP等于10不变,也就是观察到事件发生的次数期望总是不变的。

从观察有限次到观察无限次,我们把离散的,在这段时间上观察N次,推广到了连续的,在这段时间上一直观察。
博松分布中的某段时间内事件发生的次数,就浮出水面来了。
下面我们来看看分布率是怎么来的。

刚才我们已经提到,博松分布是二项分布的极限,因此我们让二项分布的N去无穷即可,
但是根据上面的分析,这个式子中的P也是变化的,那两个变量怎么办呢?
其实大家应该都知道了,因为Lambda等于NP是横定的,
于是P等于Lambda比N,这样变了就统一了。

统一变量以后就可以求解这个极限了,我们将变量N都放在一起,长数K都放在一起,
然后长数就可以提到外面。再把指数中的长数和变量拆开,这样极限号里就有三个部分。
这三个部分的极限我想大家都会求吧,不会的去向你的高速上老师请教一下,我们求出来的结果就是博松分布的表达式了。
这样我们之前的疑惑就都解决了,由于博松分布是二项分布的极限,因此当N很大,P比较小时,可以取Lambda等于NP,用博松分布来近似二项分布的值。

了解了博松分布以后,我们就可以来探究指数分布了。
我们先给出大家一个结论,指数分布是从博松分布推导而来的,这又是为什么呢?
我们先来回想博松分布的内容。博松分布描述的是,一段时间内某事件发生次数为X的概率。
它的参数Lambda是这段时间内,这件事件发生次数的期望。

但是博松分布有一个限制,事件发生的时间段必须对应期望次数所在的时间段。
比如说这里,我根据以往的经验知道,一年内某工厂的电子元件发生故障的个数期望值为10个,那么根据博松分布,我只能推知一年内故障个数为X个的概率。
但如果我想知道半年内故障X个的概率呢?四分之一年内呢?一个月内呢?
请通过博松分布就无法获取了。

我们将博松分布加以推广,得到了一种名为博松过程的分布率
它里面多了一个参数T,表示T倍的单位时间内,事件X的发生概率。
这里所谓的单位时间,指的是期望Lambda所在的单位时间。

比如说我这里的Lambda等于10的时间是一年,那么T就指的是T倍的一年。
大家也可以理解为,一个单位时间内故障的期望为Lambda个,那么T一个单位时间内故障的期望就为T倍的Lambda个。

需要特别说明的是,这种扩展需要建立在,观察到这些电子元件故障与否,相互独立的前提下。
假如这个例子换成,一天内某生物群落死亡的生物个数为10只。
那么大家就会觉得,两天内生物群落死亡的生物个数期望为20只,非常合理。

但是如果我说,一年内某批电子元件故障个数为10个,那么两年内故障期望为20个,大家可能会觉得很奇怪,
难道不是时间越长,故障应该越多吗?所以我这里特意使用了某工厂运营一年,电子元件故障的个数,这样的限定条件,
而不是使用某批电子元件一年,就是为了保证他们之间是相互独立的。

就像生物群落中的生物,自然出生又自然死亡,显然他们并不会突然一起出生了,又突然一起死亡了,
因此每年的死亡期望都基本是一致的。
那么对于一个工厂的电子元件来讲,他们有的先投入使用,有的后投入使用,有的先故障,有的后故障,有的先被换新,有的后被换新。
总而言之,每年工厂都要拆下来10个左右的零件,丢掉换成新的,这样他们就是相互独立的。

如果我说,使用一批电子元件,大家估计会默认他们是一起开始使用的,
那么第一年坏了10个,可能第二年就全坏完了。所以大家要理解这个博松过程,是从什么样的角度去研究事件的。
它并不关心电子元件中的某个个体如何,而是对于一个大范围内的各自独立的电子元件进行普遍而持续观察的结果。

总而言之,现在我们可以得到在一年内工厂有NT个原件故障的概率了。
下面是我们推导环节中最重要的一步,在T时间内没有原件故障,等价于NT等于0的概率,
又等价于在T时间以后才有原件故障。大家细细琢磨这件事,
我们将离散的随机变量NT等于0,转换到了连续的变量T时间以后,这里NT等于0,表示的是没有原件故障,而T时间以后对应的是有原件故障。

我们要新建立一个随机变量来表述这件事了。很显然的,这个随机变量应当是连续性的,
表示T时间时有原件故障,这不是我们所谓的电子元件的寿命吗?
看来我们要求解的目标就是外业的分布了,于是外大于T,就表示T时间后有原件故障,而NT等于0,
表示T时间内没有原件故障,显然他们是一回事。

有同学问,我得到这个东西就能够确定外业的分布了吗?这样暂时还不行,但有了外大于T,
难道不能得到外小于等于T吗?用一减去就可以了。我想答案已经呼之欲出了,如果大家前面学的扎实,
一眼就能看出来,这就是外业的分布函数啊。
有了分布函数,自然就可以通过求导得到概率密度了,答案就是我们的指数分布

这样我们就知道了,指数分布为什么能表示所谓寿命,所以即便量取之在某个区间,意思就是在这个区间的时间内有原件故障。
我们给大家画了一个指数函数的分布图像,Px大于T,表示T时间以后才会有原件故障的概率,那么它的概率就是图中深蓝色的面积。
但是我在这里还给它除了一个全世界的概率,相当于是除了个一。
我为什么要这样做呢?大家接着往下看。

现在图中深蓝色的面积是Px大于S加T,可以认为是我选取了一个基准时间S,在S时间的基础上又经过了T,
在S加T时间后才有原件故障的概率。
那么图中的这个条件概率,我想大家应该都是会算的,只不过因为X大于S加T时,X必然已经大于S了,所以就没写它。

我们可以由几何意义来直观的解释这个条件概率。
大家学习条件概率的计算时,应该都听说过缩减样本空间法吧。
就是说在附加条件的限制下,我们的样本空间或者说全世界被缩小了。

这里的X大于S就是附加条件,它把我们原来的全世界缩减到现在,图中的浅蓝色区域那么大。
因此,在X大于S的条件下,X大于S加T的概率就是两个面积的比值。
现在大家明白我刚才为什么非要画一个全世界的面积了吧?它也相当于是两个面积的比值。

严格的数学计算指数,这两个比值是相等的,课本上有这个过程,我们就不算了。
那么相等有什么意义呢?拿刚才的工厂举例子,假设这个工厂的工况是稳定的,
也就是每个时间段对电子元件的消耗基本恒定不变。

那么我从1月份开始观察,到2月份才出现元件故障的情况,和我从8月份开始观察,到9月份才出现元件故障的情况。
这两件事,概率应当是相等的。这里的1月份就可以理解成坐标元点
8月份就可以理解成S,而经过一个月就可以理解成T。也就是说,
不管你从什么时刻开始观察,不管你观察之前,这个工厂的元件故障情况如何,从你观察开始,经过一个月,工厂有故障元件的概率,都是恒定不变的。

所谓的无记忆,实际上就体现在这个条件概率的限制。
它告诉你,之前时间段的结果,或者说样本点,通通不算数,从我开始之后,才能算作样本空间。
这不就把之前的记忆消除了吗?

这里呢,我们画了比较长的篇幅来讲博松分布和指数分布的来源与意义。
因为这个东西大家在之前没有接触过,也不是很容易理解它的意义所在。
但是我们还是要给大家强调的是,能理解就理解,不能理解,请备工夫。
理不理解呢,对做T而言没有任何影响,毕竟作为苏承阿普主起家嘛,我的本心还是不能忘嘛。

那么今天的视频就到这里了,有机会的话,我们下次再见。