暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

离散型随机变量及其常见分布律

Python爬虫和数据挖掘 2021-07-08
2669

文章目录


  • 文章目录

    • 1. 随机变量

    • 2. 离散型随机变量

    • 3. 离散型随机变量常见分布


1. 随机变量


  • 设随机试验的样本空间为 . 是定义在样本空间 上的实值单值函数。称 「随机变量」

2. 离散型随机变量


  • 定义: 全部可能取到的值为有限个或可列无限多个,这种随机变量称为「离散型随机变量」

    骰子的点数,打靶环数,某城市 120 急救电话一昼夜收到的呼叫次数,都是离散型随机变量

  • 设离散型随机变量 所有可能取的值为 取各个可能值的概率,即事件 的概率,为


    我们称该式为离散型随机变量的分布律

    • 性质:

      稍后介绍常见分布的时候, 这个的证明很简单,不在赘述,我会给出 的必要性证明。

3. 离散型随机变量常见分布


3.1 分布

设随机变量可能的取值只有 ,它的分布律为 ,记做 服从以 为参数的 「分布」「两点分布」

  
  
  
  
  
   

新生儿性别,抛硬币,产品质量是否合格 等可以用 分布的离散型随机变量来表示


3.2 二项分布

  • 设试验 只有两种可能结果: ,则称 「伯努利试验」 。 设 .

  • 独立重复地进行 次, 则称这一连串独立的重复试验为 「重伯努利试验」

    例如,抛硬币, 表示正面,这就是伯努利试验,将硬币抛 次,就是 重伯努利试验。 掷骰子, 表示等到 点, 表示得到的是非 点,也叫一次伯努利试验等

  • 表示 重伯努利试验中,事件 发生的次数, 表示事件 发生的概率, 表示 不发生的概率(即 发生的概率) ,则有


    必要性证明 :

    二项式:

    我们发现 刚好是 展开式中出现 的那一项,因此,我们称随机变量 服从以 为参数的「二项分布」,记做

3.3 泊松分布

  • 设随机变量 的可能取值为 而各个取值的概率为 其中 为常数,则称 服从以 为参数的「泊松分布」,记做

    必要性证明 :

    其中 证明如下,需要用到泰勒公式
    泰勒公式:
    如果函数 的某个邻域 内具有 阶导数,那么对任一


    时,有
    此时有

    为关于 的高阶无穷小,则


一本书一页中的印刷错误数,某医院在一天内的急诊病人数,某一个地区一个时间间隔内发生交通事故的次数等均服从泊松分布

  • 「泊松定理」 是一个常数, 是任意正整数,设 ,则对于任一固定的非负整数 ,有

证明如下 :

  • 该定理说明,当 很大, 很小时,二项分布可用泊松分布近似 即

    一般地,当 时,即可用泊松分布来近似计算二项分布

3.4 几何分布

  • 在伯努利试验中,记每次试验中事件 发生的概率为 ,试验进行到事件 出现时停止,此时所进行的试验次数为 ,其分布率为 , 则称 服从 为参数的几何分布,记作

    必要性证明:

  • 几何分布用来描述 次伯努利试验中,事件 首次发生的概率

3.5 超几何分布

  • 在产品质量的「不放回」抽检中,若 件产品中有 件次品,抽检 件时所得次品数 ,此时有

    服从以 为参数的超几何分布,记做

    必要性证明 :

    范德蒙恒等式:


    证明比较简单,用二项展开式即可:

    根据式(1)和式(2)对应项系数相等,可以知道

    关于 范德蒙恒等式的证明方式有很多,感兴趣的可以查看相关资料

  • 时,超几何分布可用二项分布近似计算,此时有

    证明如下:

    首先我们要明确要证明的等式是 当 ,即 .

    • 需要注意的是,前面我们说到,计算二项分布时,可用泊松分布近似,因此在利用二项分布近似计算超几何分布时,可根据情况,对二项分布使用泊松进行分布进行近似计算


文章转载自Python爬虫和数据挖掘,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论