第一章概率论的基本概念
 第二章随机变量及其分布
 第三章多维随机变量及其分布
 第四章随机变量的数字特征
 第五章大数定理及中心极限定理
 第六章样本及抽样分布
 第七章参数估计
 第八章假设检验

第二章随机变量及其分布

2.1 随机变量

定义

设随机试验的样本空间为 $S=\{e\}$ 。 $X=X(e)$ 是定义在样本空间 $S$ 上的实值单值函数。称 $X=X(e)$ 为随机变量。它有以下特点：

它随试验结果的不同而产生不同的值，在试验之前只可能知道它的取值范围，不能预先肯定它取哪个值。
由于试验结果的出现有一定的概率，于是这种实值函数取每个值和每个确定范围内的值也有一定的概率。

💡 例如：从某一学校随机选择一名学生，测量他的身高。我们把可能的身高看作随机变量，紧接着我们就能提出关于 $X$ 的问题，比如： $P(X>1.7)=?$

意义

将对事件及事件概率的研究扩大到对随机变量及其取值规律的研究。

2.2 离散型随机变量及其分布律

定义

设x_k(k=1,2,…)是离散型随机变量X所取的一切可能值，称P(X=x_k)=p_k,\quad k=1,2,…为离散型随机变量X的概率分布或分布律。其中p_k满足：
1. $p_k\ge0(k=1,2...)$ ;
2. $\sum\limits_kp_k=1$ 。

表示方法

列表法

$X$ $x_1$ $x_2$ … $x_n$

$P_k$ $p_1$ $p_2$ … $p_n$
公式法

$P\{X=k\}=\frac{C_2^kC^{3-k}_3}{C^3_5}$

$X$	$x_1$	$x_2$	…	$x_n$
$P_k$	$p_1$	$p_2$	…	$p_n$

常用的离散型分布

$0-1$ 分布

设随机变量 $X$ 只能取 $0$ 与 $1$ 两个值，它的分布律是：

$X$ $0$ $1$

$p_k$ $1-p$ $p$
贝努利试验，二项分布
- 贝努利试验：设试验 $E$ 只有两种可能结果， $A$ 或 $\overline A$ ，则称E为贝努利试验。如果将E独立重复的进行 $n$ 次，则称这一串重复的毒理实验为 $n$ 重贝努利试验。
- 二项分布：如果每次试验中事件 $A$ 发生的概率为 $p$ ，则以 $X$ 表示在 $n$ 次贝努利试验中事件 $A$ 恰好发生的次数，则 $X=k$ 的概率为
  
  $P\{X=k\}=C^k_np^k(1-p)^{n-k}$
  
  我们称随机变量 $X$ 服从参数为 $n,p$ 的二项分布，并记为：
  
  $X\sim b(n,p)$
泊松分布
- 定义：设随机变量X所有可能取的值为0，1，2，…，且概率分布为：
  
  $p\{X=k\}=e^{-\lambda}\frac{\lambda^k}{k!},\quad k=0,1,2,...$
  
  其中 $\lambda>0$ 是常数，则称 $X$ 服从参数为 $\lambda$ 的泊松分布，记作：
  
  $X\sim P(\lambda)$
- 二项分布的泊松分布近似式：
  
  $C^k_np^k(1-p)^{n-k}\approx e^{-\lambda}\frac{\lambda^k}{k!}$
  
  其中 $\lambda=np$ 。

$X$	$0$	$1$
$p_k$	$1-p$	$p$

💡 泊松定理表明泊松分布是二项分布的极限分布，当 $n$ 很大， $p$ 很小时，二项分布就可以看作是参数 $\lambda=np$ 的泊松分布。

2.3 随机变量的分布函数

分布函数的概念

设 $X$ 是随机变量，对任意的实数 $x$ ，函数 $F(x)=P\{X \le x\}$ 称为X的分布函数。

易知：对于任意的实数a,b(a<b),

$P\{a<X\le b\}=P\{x\le b\}-P\{x\le a\}=F(b)-F(a)$

分布函数的性质

单调不减性
有界性：对于任意实数 $x$ ，都有 $0\le F(x)\le 1$ 。
右连续性

离散型随机变量的分布函数

$F(x)=\sum\limits_{x_k\le x}P\{X=x_k\}=\sum\limits_{x_k\le x}p_k$

2.4 连续性随机变量及其概率密度

概率密度

定义：对于随机变量 $X$ ，若存在非负函数 $f(x),(-\infty<x<+\infty)$ ，使对任意函数 $x$ ，都有

$F(x)=\int^x_{-\infty}f(t)\mathrm dt$

则称 $X$ 为连续型随机变量， $f(x)$ 为 $X$ 的概率密度函数，简称概率密度和密度函数。
性质：
1. $f(x)\ge0$ ;
2. $\int^{+\infty}_{-\infty}f(x)\mathrm d x$ ;
3. $P\{x_1<X\le x_2\}=F(x_2)-F(x_1)=\int^{x_2}_{x_1}f(x)\mathrm dx$ ;
4. 若 $f(x)$ 在点 $x$ c处连续，则有 $F'(x)=f(x)$ 。
5. 对于任意可能值 $a$ ，连续型随机变量取 $a$ 的概率为 $0$ ，即 $P\{X=a\}=0$ 。

常见连续型随机变量的分布

均匀分布

$f(x)= \begin{cases} \frac{1}{b-a} ,\quad &a<x<b \\0&其他 \end{cases}$

记为 $X\sim U(a,b)$

分布函数：

$F(x)=\begin{cases}0,&x<a,\\ \dfrac{x-a}{b-a},&a\le x<b,\\ 1,&x\ge b.\end{cases}$
指数分布

$f(x)=\begin{cases}\frac1\theta\mathbf{e}^{-x/\theta},&x>0,\\ \theta,&x\leq0.\end{cases}$
正态分布（高斯分布）

$f(x)=\dfrac{1}{\sqrt{2\pi}\sigma}e^{-\dfrac{(x-\mu)^2}{2\sigma^2}},-\infty<x<+\infty,$

记为 $X\sim N(\mu,\sigma^2)$ 。

几何特征：
1. 曲线关于 $x=\mu$ 对称，这表明对于任意 $h>0$ ，有 $P\{\mu-h<X\le\mu\}=P\{\mu<X\le\mu+h\}$ 。
2. 当 $x=\mu$ 时， $f(x)$ 取最大值 $\frac1{\sqrt{2\pi}\sigma}$ 。
3. 当 $x\rightarrow \pm \infty$ 时， $f(x)\rightarrow0$ ;
4. 曲线在 $x=\mu\pm\sigma$ 处有拐点；
5. 曲线以 $x$ 轴为渐近线。
6. 固定 $\sigma$ ，改变 $\mu$ 的大小时， $f(x)$ 的图形形状不变，知识沿着 $x$ 轴平移变换。
7. 当固定 $\mu$ ，改变 $\sigma$ 的大小时， $f(x)$ 图形的对称轴不变，而形状在改变， $\sigma$ 越小，图形越高越瘦， $\sigma$ 越大，图形越矮越胖。

2.5 随机变量的函数的分布

❓ 知道 $X=f(x),Y=g(X)$ ，如何求 $f_Y(y)$ ？

离散型随机变量函数的分布

设随机变量 $X$ 的分布律为：

$P(X=x_k)=p_k,k=1,2,3,...$

由已知函数 $g(x)$ 可求出随机变量 $Y$ 的所有可能取值， $Y$ 的概率分布为：

$P(Y=y_i)=\sum\limits_{k:g(x_k)=y_i}p_k,i=1,2,...$

连续型随机变量函数的分布

设随机变量 $X$ 具有概率密度：

$f_X(x),-\infty<x<+\infty$

又设函数 $g(x)$ 处处可导且恒有 $g'(x)>0$ （或 $g'(x)<0$ ），则 $Y=g(X)$ 是连续型随机变量，其概率密度为：

$f_Y(y)=\begin{cases} f_X[h(y)]|h'(y)|&,\alpha<y<\beta\\ 0&,其他 \end{cases}$

其中 $\alpha=\min(g(-\infty),g(+\infty)),\beta=\max(g(-\infty),g(+\infty))$ ， $h(y)$ 是 $g(x)$ 的反函数。

正态分布的特别规律

若 $X\sim N(0,1)$ ，则 $Y=aX+b\sim N(b,a^2)$

习题

计算机硬件公司制造某种特殊型号的微型芯片，次品率为 $0.1\%$ ，各芯片成为次品相互独立。求在 $1000$ 只芯片中至少有 $2$ 只次品的概率。以 $X$ 计产品中的次品数，则 $X\sim b(1000,0.001)$ 。

泊松分布： $C^k_np^k(1-p)^{n-k}\approx e^{-\lambda}\frac{\lambda^k}{k!}$ ，其中 $\lambda=np=1$ 。

$\begin{aligned} P\{X\ge2\}&=1-P\{X=0\}-P\{X=1\}\\ &=1-e^{-1}-e^{-1}=0.2642411 \end{aligned}$

设随机变量 $X$ 的分布律为

$X$	$-1$	$2$	$3$
$p_k$	$\frac14$	$\frac12$	$\frac14$

求 $X$ 的分布函数，并求 $P\{X\le\frac12\},P\{\frac32\le X\le\frac52\},P\{2\le X\le3\}$ 。

$F(x)= \begin{cases} 0,\quad &x<-1 \\\frac14&-1\le x<2 \\\frac34&2\le x<3 \\1&x\ge3 \end{cases}$

$P\{X\le\frac12\}=F(\frac12)=\frac14\\ P\{\frac32<X\le\frac52\}=F(\frac52)-F(\frac32)=\frac12 \\ P\{2\le X\le 3\}=F(3)-F(2)+P\{X=2\}=\frac34$

答案

答案

答案

答案

目录CONTENT

概率论与数理统计第二章笔记

第二章随机变量及其分布

2.1 随机变量

定义

意义

分类

2.2 离散型随机变量及其分布律

定义