第一章 概率论的基本概念
第二章 随机变量及其分布
第三章 多维随机变量及其分布
第四章 随机变量的数字特征
第五章 大数定理及中心极限定理
第六章 样本及抽样分布
第七章 参数估计
第八章 假设检验
第二章 随机变量及其分布
2.1 随机变量
定义
设随机试验的样本空间为S=\{e\}。X=X(e)是定义在样本空间S上的实值单值函数。称X=X(e)为随机变量。它有以下特点:
- 它随试验结果的不同而产生不同的值,在试验之前只可能知道它的取值范围,不能预先肯定它取哪个值。
- 由于试验结果的出现有一定的概率,于是这种实值函数取每个值和每个确定范围内的值也有一定的概率。
💡 例如:从某一学校随机选择一名学生,测量他的身高。我们把可能的身高看作随机变量,紧接着我们就能提出关于X的问题,比如:P(X>1.7)=?
意义
将对事件及事件概率的研究扩大到对随机变量及其取值规律的研究。
分类
随机变量通常分为两类:离散型随机变量和连续型随机变量。
- 离散型随机变量:取值是有限或可列的无限多个。
- 连续型随机变量:全部都能取值,不仅无穷多,还不能一一列举,只能通过区间进行描述。
2.2 离散型随机变量及其分布律
定义
- 设x_k(k=1,2,…)是离散型随机变量X所取的一切可能值,称P(X=x_k)=p_k,\quad k=1,2,…为离散型随机变量X的概率分布或分布律。其中p_k满足:
- p_k\ge0(k=1,2...);
- \sum\limits_kp_k=1。
表示方法
-
列表法
X x_1 x_2 … x_n P_k p_1 p_2 … p_n -
公式法
P\{X=k\}=\frac{C_2^kC^{3-k}_3}{C^3_5}
常用的离散型分布
-
0-1分布
设随机变量X只能取0与1两个值,它的分布律是:
X 0 1 p_k 1-p p -
贝努利试验,二项分布
-
贝努利试验:设试验E只有两种可能结果,A或\overline A,则称E为贝努利试验。如果将E独立重复的进行n次,则称这一串重复的毒理实验为n重贝努利试验。
-
二项分布:如果每次试验中事件A发生的概率为p,则以X表示在n次贝努利试验中事件A恰好发生的次数,则X=k的概率为
P\{X=k\}=C^k_np^k(1-p)^{n-k}
我们称随机变量X服从参数为n,p的二项分布,并记为:
X\sim b(n,p)
-
-
泊松分布
-
定义:设随机变量X所有可能取的值为0,1,2,…,且概率分布为:
p\{X=k\}=e^{-\lambda}\frac{\lambda^k}{k!},\quad k=0,1,2,...
其中\lambda>0是常数,则称X服从参数为\lambda的泊松分布,记作:
X\sim P(\lambda)
-
二项分布的泊松分布近似式:
C^k_np^k(1-p)^{n-k}\approx e^{-\lambda}\frac{\lambda^k}{k!}
其中\lambda=np。
-
💡 泊松定理表明泊松分布是二项分布的极限分布,当n很大,p很小时,二项分布就可以看作是参数\lambda=np的泊松分布。
2.3 随机变量的分布函数
分布函数的概念
设X是随机变量,对任意的实数x,函数F(x)=P\{X \le x\}称为X的分布函数。
易知:对于任意的实数a,b(a<b),
P\{a<X\le b\}=P\{x\le b\}-P\{x\le a\}=F(b)-F(a)
分布函数的性质
- 单调不减性
- 有界性:对于任意实数x,都有0\le F(x)\le 1。
- 右连续性
离散型随机变量的分布函数
F(x)=\sum\limits_{x_k\le x}P\{X=x_k\}=\sum\limits_{x_k\le x}p_k
2.4 连续性随机变量及其概率密度
概率密度
-
定义:对于随机变量X,若存在非负函数f(x),(-\infty<x<+\infty),使对任意函数x,都有
F(x)=\int^x_{-\infty}f(t)\mathrm dt
则称X为连续型随机变量,f(x)为X的概率密度函数,简称概率密度和密度函数。
-
性质:
- f(x)\ge0;
- \int^{+\infty}_{-\infty}f(x)\mathrm d x;
- P\{x_1<X\le x_2\}=F(x_2)-F(x_1)=\int^{x_2}_{x_1}f(x)\mathrm dx;
- 若f(x)在点xc处连续,则有F'(x)=f(x)。
- 对于任意可能值a,连续型随机变量取a的概率为0,即P\{X=a\}=0。
常见连续型随机变量的分布
-
均匀分布
f(x)= \begin{cases} \frac{1}{b-a} ,\quad &a<x<b \\0&其他 \end{cases}
记为X\sim U(a,b)

分布函数:
F(x)=\begin{cases}0,&x<a,\\ \dfrac{x-a}{b-a},&a\le x<b,\\ 1,&x\ge b.\end{cases}
-
指数分布
f(x)=\begin{cases}\frac1\theta\mathbf{e}^{-x/\theta},&x>0,\\ \theta,&x\leq0.\end{cases}
-
正态分布(高斯分布)
f(x)=\dfrac{1}{\sqrt{2\pi}\sigma}e^{-\dfrac{(x-\mu)^2}{2\sigma^2}},-\infty<x<+\infty,
记为X\sim N(\mu,\sigma^2)。
几何特征:
- 曲线关于x=\mu对称,这表明对于任意h>0,有P\{\mu-h<X\le\mu\}=P\{\mu<X\le\mu+h\}。
- 当x=\mu时,f(x)取最大值\frac1{\sqrt{2\pi}\sigma}。
- 当x\rightarrow \pm \infty时,f(x)\rightarrow0;
- 曲线在x=\mu\pm\sigma处有拐点;
- 曲线以x轴为渐近线。
- 固定\sigma,改变\mu的大小时,f(x)的图形形状不变,知识沿着x轴平移变换。
- 当固定\mu,改变\sigma的大小时,f(x)图形的对称轴不变,而形状在改变,\sigma越小,图形越高越瘦,\sigma越大,图形越矮越胖。
2.5 随机变量的函数的分布
❓ 知道X=f(x),Y=g(X),如何求f_Y(y)?
离散型随机变量函数的分布
设随机变量X的分布律为:
P(X=x_k)=p_k,k=1,2,3,...
由已知函数g(x)可求出随机变量Y的所有可能取值,Y的概率分布为:
P(Y=y_i)=\sum\limits_{k:g(x_k)=y_i}p_k,i=1,2,...
连续型随机变量函数的分布
设随机变量X具有概率密度:
f_X(x),-\infty<x<+\infty
又设函数g(x)处处可导且恒有g'(x)>0(或g'(x)<0),则Y=g(X)是连续型随机变量,其概率密度为:
f_Y(y)=\begin{cases} f_X[h(y)]|h'(y)|&,\alpha<y<\beta\\ 0&,其他 \end{cases}
其中\alpha=\min(g(-\infty),g(+\infty)),\beta=\max(g(-\infty),g(+\infty)),h(y)是g(x)的反函数。
正态分布的特别规律
若X\sim N(0,1),则Y=aX+b\sim N(b,a^2)
习题
-
计算机硬件公司制造某种特殊型号的微型芯片,次品率为0.1\%,各芯片成为次品相互独立。求在1000只芯片中至少有2只次品的概率。以X计产品中的次品数,则X\sim b(1000,0.001)。
泊松分布:C^k_np^k(1-p)^{n-k}\approx e^{-\lambda}\frac{\lambda^k}{k!},其中\lambda=np=1。
\begin{aligned} P\{X\ge2\}&=1-P\{X=0\}-P\{X=1\}\\ &=1-e^{-1}-e^{-1}=0.2642411 \end{aligned}
设随机变量X的分布律为
| X | -1 | 2 | 3 |
|---|---|---|---|
| p_k | \frac14 | \frac12 | \frac14 |
-
求X的分布函数,并求P\{X\le\frac12\},P\{\frac32\le X\le\frac52\},P\{2\le X\le3\}。
F(x)= \begin{cases} 0,\quad &x<-1 \\\frac14&-1\le x<2 \\\frac34&2\le x<3 \\1&x\ge3 \end{cases}
P\{X\le\frac12\}=F(\frac12)=\frac14\\ P\{\frac32<X\le\frac52\}=F(\frac52)-F(\frac32)=\frac12 \\ P\{2\le X\le 3\}=F(3)-F(2)+P\{X=2\}=\frac34

-
答案


-
答案


-
答案


-
答案

评论区