随机变量
随机变量(random variable)表示随机试验各种结果的实值单值函数。
随机事件不论与数量是否直接有关,都可以数量化,即都能用数量化的方式表达。
随机事件数量化的好处是可以用数学分析的方法来研究随机现象。
例如某一时间内公共汽车站等车乘客人数,电话交换台在一定时间内收到的呼叫次数,灯泡的寿命等等,都是随机变量的实例。
基本类型
按照随机变量可能取得的值,可以把它们分为两种基本类型:
- 离散型
离散型(discrete)随机变量即在一定区间内变量取值为有限个或可数个。
离散型随机变量通常依据概率质量函数分类,主要分为:伯努利随机变量、二项随机变量、几何随机变量和泊松随机变量。
例如某地区某年人口的出生数、死亡数,某药治疗某病病人的有效数、无效数等。
- 连续型
连续型(continuous)随机变量即在一定区间内变量取值有无限个,或数值无法一一列举出来。
有几个重要的连续随机变量常常出现在概率论中,如:均匀随机变量、指数随机变量、伽马随机变量和正态随机变量。
例如某地区男性健康成人的身长值、体重值,一批传染性肝炎患者的血清转氨酶测定值等。
数学期望
- 离散型
如果 X 是离散随机变量,数学期望是可能取的值的加权平均。简单来说就是所有值的算术平均。
- 连续型
如果 X 是具有概率密度函数 f(x) 的连续随机变量,那么在上均匀分布的随机变量的期望值正是区间的中点。
记为:E(X)
方差
在统计描述中,方差用来计算每一个变量(观察值)与总体均数之间的差异。统计学采用平均离均差平方和来描述变量的变异程度。
S2 为样本方差,X 为变量,x̅ 为样本均值,n 为样本例数
记为:D(X), DX, Var(X)
方差的计算公式有个令人迷惑的地方:
总体时分母是 N,样本时分母是 n-1。
实际上,求总体方差时,每个出现的概率为 N 分之一,因为每一项都是自由变换的。而样本是除以 (n-1) 实际上也是乘的概率,样本的 n 项其实如果确定了 (n-1) 项第 n 项就百分百确定,所以每一项出现的概率只有 (n-1) 分之一。方差说的是概率,不是有多少个。
标准差
也称为均方差,为方差的算术平方根。标准差是用来衡量一组数据的离散程度的统计量。