暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

连续型随机变量及其常见分布的分布函数和概率密度

Python爬虫和数据挖掘 2021-07-08
2835

文章目录


  • 文章目录

    • 1. 随机变量的分布函数

    • 2. 连续型随机变量及其概率密度

    • 3. 重要的连续型随机变量分布


1. 随机变量的分布函数


  • 「背景」:对于非离散型的随机变量,其取值不能一一列举出来,因此就不能像离散型随机变量那样使用分布律描述它。非离散型随机变量有很多种,其中「连续型随机变量」极其常见,因此我们重点研究连续型随机变量。对于连续性随机变量,在某个点的概率为,另外,实际中,对于元件的寿命,测量的误差等,研究其落在某个区间的概率更有意义,因此我们引出了随机变量的分布函数

  • 「定义」:设是一个随机变量, 是任意实数,函数

    则为「分布函数」


    虽然对于离散型随机变量,我们可以使用分布律来全面地描述它,但为了从数学上能够统一地对随机变量进行研究,因此,我们针对离散型随机变量和非离散型随机变量统一地定义了分布函数。

  • 「性质」

    是一个不减函数

    对于任意实数 ,有 成立

    , 即 是右连续的

  • 用分布函数表示事件概率

  1. 这里的表示 分布函数处理左极限。同理,表示 分布函数处理右极限 。

  2. 细心的同学也许注意到背景部分提到连续型随机变量在某一个点的概率为0,这里还整 搞这么麻烦是为了啥?原因是这部分内容,对连续型和离散型随机变量都成立,离散型随机变量在某一个点有具体的不为0的概率值,因此不能忽略!

2. 连续型随机变量及其概率密度


  • 定义,如果随机变量的分布函数,存在非负函数,使对于任意实数

    则称「连续型随机变量」 ,其中函数称为「概率密度函数」,简称「概率密度」
  • 概率密度具有以下性质:

    对于任意实数

    处连续,则有


  • 连续型随机变量,任取一个指定实数的概率为,即

    证明如下:

    根据分布函数定义,有 ,我们知道  表示 处理左极限,即 ,    由于 在定义域内连续,所以有  .

    相关推论:

    1. 这里虽然 , 但随机变量是可以取到 点的, 也就是说 对于事件,如果其发生的概率, 不一定是 不可能事件, 但是如果已经知道 是不可能事件,则必有

    2. 连续型随机变量,计算区间概率时,区间端点可有可无,即 .

    3. 由第二条可知,我们假设 , 会发现虽然, 但是却不能取到 点,所以得出结论:对于事件,如果其发生的概率,则不一定是必然事件,但是如果已经知道 是必然事件,则必有.

3. 重要的连续型随机变量分布


3.1 均匀分布

  • 若连续型随机变量具有概率密度

    则称在区间 上服从「均匀分布」,记作


    必要性证明

  • 分布函数


  • 性质

    落在子区间内的概率,只跟子区间长度有关,跟子区间位置无关,证明很简单,不再赘述

  • 应用

    在公交站台的等车时间,针落在坐标纸上的倾斜角等

3.2 指数分布

  • 若连续型随机变量具有概率密度

    其中为常数,则称服从参数为「指数分布」,记作


    必要性证明

  • 分布函数

  • 性质

    「无记忆性」,如果是某一元件的寿命,那么已知原件已经使用了小时,它总共能用至少 小时的条件概率,与从开始使用时算起它至少能用 小时的概率相等,数学表达式为

    证明如下

  • 应用

    服务系统的服务时间,通话时间,某消耗品的寿命等

3.3 正态分布

  • 若连续型随机变量具有概率密度

    其中为常数,则称服从参数为「正态分布」「高斯(Gauss)分布」,记作


    必要性证明

    很明显, 下面证明

    ,则  

    我们先求 的积分,很难直接求出其积分,我们需要用到一个技巧,令

  • 分布函数

  • 性质

    正态分布曲线关于 对称.

    时取得最大值,

    其他特性,可参考下图理解:

  1. 曲线在 处有拐点
  2. 曲线以轴为渐近线
  3. 越远,的值就越小,这表明对于同样长度的区间,当区间离越远,落在这个区间的概率就越小
  4. 如果固定,改变的值,则图形沿着轴平移,而不改变其形状。被称作位置参数(参考下图黄色和蓝色的线)
  5. 如果固定,改变的值,由于其最大值 随着变小,而变得越尖,因而落在附近的概率变大 (参考下图红色和黄色的线)
  • 时称随机变量服从「标准正态分布」,其概率密度和分布函数分别用表示,则有


     由性质很容易推知:

    证明如下:

    的分布函数为

    第二种证明方法,  令

    由该引理可知


    我们看到,正态分布的值落在内几乎时肯定的事情,这就是  法则」

  • ,若 满足条件

    则称点为标准正态分布的「上  分位点」


  • 应用

    在自然现象和社会现象中,大量随机变量都服从或者近似服从正态分布。例如,一个地区的男性成年人身高,测量某零件长度的误差,海洋波浪的高度,半导体器件中的热噪声电流或电压等。后续我们还会介绍正态分布的其他重要特性

文章转载自Python爬虫和数据挖掘,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论