随机变量

来自牛奶河Wiki
阿奔讨论 | 贡献2023年3月26日 (日) 19:48的版本
跳到导航 跳到搜索

随机变量(random variable)表示随机试验各种结果的实值单值函数。

随机事件不论与数量是否直接有关,都可以数量化,即都能用数量化的方式表达。

随机事件数量化的好处是可以用数学分析的方法来研究随机现象。

例如某一时间内公共汽车站等车乘客人数,电话交换台在一定时间内收到的呼叫次数,灯泡的寿命等等,都是随机变量的实例。

基本类型

按照随机变量可能取得的值,可以把它们分为两种基本类型:

  • 离散型

离散型(discrete)随机变量即在一定区间内变量取值为有限个或可数个。

离散型随机变量通常依据概率质量函数分类,主要分为:伯努利随机变量、二项随机变量、几何随机变量和泊松随机变量。

例如某地区某年人口的出生数、死亡数,某药治疗某病病人的有效数、无效数等。

  • 连续型

连续型(continuous)随机变量即在一定区间内变量取值有无限个,或数值无法一一列举出来。

有几个重要的连续随机变量常常出现在概率论中,如:均匀随机变量、指数随机变量、伽马随机变量和正态随机变量。

例如某地区男性健康成人的身长值、体重值,一批传染性肝炎患者的血清转氨酶测定值等。

数学期望

  • 离散型

如果 X 是离散随机变量,数学期望是可能取的值的加权平均。简单来说就是所有值的算术平均。

  • 连续型

如果 X 是具有概率密度函数 f(x) 的连续随机变量,那么在上均匀分布的随机变量的期望值正是区间的中点。

记为:E(X)

方差

在统计描述中,方差用来计算每一个变量(观察值)与总体均数之间的差异。统计学采用平均离均差平方和来描述变量的变异程度。

数学-样本方差.png

S2 为样本方差,X 为变量,x̅ 为样本均值,n 为样本例数

记为:D(X), DX, Var(X)

方差的计算公式有个令人迷惑的地方:

总体时分母是 N,样本时分母是 n-1。

实际上,求总体方差时,每个出现的概率为 N 分之一,因为每一项都是自由变换的。而样本是除以 (n-1) 实际上也是乘的概率,样本的 n 项其实如果确定了 (n-1) 项第 n 项就百分百确定,所以每一项出现的概率只有 (n-1) 分之一。方差说的是概率,不是有多少个。

标准差

也称为均方差,为方差的算术平方根。标准差是用来衡量一组数据的离散程度的统计量。