不要混淆随机变量及其分布

请牢记标题。随机变量测量的是依赖于随机现象结果的数值量。随机变量的分布指定了随机变量在多次重复的随机现象中的长期变化模式。可以通过模拟随机过程的结果，观察该结果对应的随机变量值，重复多次，并总结结果来近似随机变量的分布。但是，随机变量不是它的分布。分布由以下两部分决定：

基本的概率测度 (\textrm{P})，它代表了关于随机现象的所有假设。
随机变量 (X) 本身，即将样本空间结果映射到数值的函数。

更改概率测度或随机变量本身都会改变随机变量的分布。

例如，考虑两次掷一个公平四面骰子的样本空间。在以下每种情况中，随机变量 (X) 都有不同的分布：

骰子是公平的，(X) 是两次掷骰子的和
骰子是公平的，(X) 是两次掷骰子中较大的那个
骰子加权，落在 1 的概率为 0.1，落在 4 的概率为 0.4，(X) 是两次掷骰子的和

具体来说，在 (1) 中 (X) 取值 2 的概率是 (1/16)，在 (2) 中 (X) 取值 2 的概率是 (3/16)，在 (3) 中 (X) 取值 2 的概率是 0.01。

在 (1) 和 (2) 中，概率测度是相同的（公平骰子），但定义随机变量的函数是不同的（和与最大值）。在 (1) 和 (3) 中，定义随机变量的函数是相同的，样本空间的结果是相同的，但概率测度不同。

我们通常直接指定随机变量的分布，而不明确提及基本概率空间或定义随机变量的函数。例如，在会面问题中，我们可能假设到达时间遵循 Uniform(0, 60) 或 Normal(30, 10) 分布。

在这种情况下，你可以认为概率空间就是随机变量的分布，而定义随机变量的函数就是恒等函数。这一理念对应于“从分布模拟方法”：构造一个对应于随机变量分布的旋转器，并旋转它以模拟随机变量的值。

示例

Donny Dont 对随机变量及其分布之间的区别感到非常困惑。通过提供两个具有相同分布的不同随机变量 (X) 和 (Y) 的简单具体示例来帮助他理解。你能想到 (\textrm{P}(X = Y) = 0) 的 (X) 和 (Y) 吗？可以提供一个离散示例和一个连续示例吗？

示例解答

翻转一枚公平硬币 3 次，让 (X) 表示正面的数量，(Y) 表示反面的数量。那么 (X) 和 (Y) 具有相同的分布，因为它们具有相同的长期变异模式。每个变量取值 0、1、2、3 的概率分别是 1/8、3/8、3/8、1/8。但它们不是相同的随机变量；它们衡量的是不同的事物。如果结果是 HHT，那么 (X) 是 2 而 (Y) 是 1。在这种情况下 (\textrm{P}(X = Y)=0); 在奇数次翻转中，不可能在任何单一结果中同时有相同数量的正面和反面。

在某些会面时间问题中，我们假设 Regina 的到达时间 (R) 是 Uniform(0, 60)，Cady 的到达时间 (Y) 是 Uniform(0, 60)。所以 (R) 和 (Y) 有相同的分布。但这是两个随机变量；一个衡量 Regina 的到达时间，另一个衡量 Cady 的到达时间。如果 Regina 和 Cady 每天见面一年，那么 Regina 到达时间的日常模式会像 Cady 的到达时间的日常模式。但在任何给定的一天，她们的到达时间都不会相同，因为 (R) 和 (Y) 是连续型随机变量，所以 (\textrm{P}(R = Y) = 0)。

分布，就像旋转器，是模拟随机变量值的蓝图。如果两个随机变量具有相同的分布，你可以用相同的旋转器来模拟任一随机变量的值。但分布不是随机变量本身。（换句话说，“地图不是领土。”）即使在任何特定重复（结果）中，这两个随机变量的值从未相等，两个随机变量也可以具有相同（长期）的分布。如果 (X) 和 (Y) 有相同的分布，那么用来模拟 (X) 值的旋转器也可以用来模拟 (Y) 值；从长远来看，模式将是相同的。

在另一个极端情况下，两个随机变量 (X) 和 (Y) 是相同的随机变量，仅当对于每个随机现象结果，(X) 和 (Y) 的结果值都是相同的时候。即，(X(\omega)=Y(\omega)) 对于所有 (\omega\in\Omega)。

有可能存在两个随机变量，其 (\textrm{P}(X=Y)) 很大，但 (X) 和 (Y) 有不同的分布。

许多常见分布都有特殊名称。例如，(X)，三次翻转公平硬币中正面的数量，其分布称为“二项式(3, 0.5)”分布。如果一个随机变量具有二项式(3, 0.5) 分布，那么它取值 0、1、2、3 的概率分别是 1/8、3/8、3/8、1/8。

在以下每种情况中，随机变量都具有二项式(3, 0.5) 分布：

(Y) 是三次翻转公平硬币中的反面数量
(Z) 是三次掷公平六面骰子中的偶数数量
(W) 是医院中三个出生婴儿中的女性婴儿数量（假设男孩和女孩的概率相等）

每种情况涉及不同的样本空间（硬币、骰子、出生），以及一个计数不同事物（正面、反面、偶数、女孩）的随机变量。但所有场景都有一些共同特点：

有三次“试验”（三次翻转、三次掷骰子、三个婴儿）
每次试验可以分类为“成功”或“失败”
每次试验成功或不成功的概率相等（公平硬币、公平骰子、假设男孩和女孩概率相等）
试验独立。对于硬币和骰子，试验在物理上是独立的。对于出生，从大量人口中随机选择确保独立性。
随机变量计数三次试验中的成功次数（反面的数量、偶数掷出的数量、女性婴儿的数量）。

这些示例说明了知道一个随机变量具有特定分布（例如，二项式(3, 0.5)) 并不一定传达关于基础结果或被测量的随机变量（函数）的任何信息。（我们将在后面更详细地研究二项式分布。）

涉及 (W, X, Y, Z) 的场景说明了两个随机变量不必定义在相同样本空间上就可以确定它们是否具有相同分布。这与计算诸如 (\textrm{P}(X=Y)) 之类的量形成对比： ({X=Y}) 是一个事件，除非 (X) 和 (Y) 定义在相同结果上，否则无法研究该事件。

例如，如果你想估计学生在 SAT 数学和阅读考试中的得分是否相等，你必须为每个学生测量一对得分。但你可以收集一组学生的 SAT 数学成绩来估计数学成绩的边际分布，并收集另一组学生的阅读成绩来估计阅读成绩的边际分布。

一个随机变量可以显式地定义为概率空间上的函数，也可以通过其分布隐式定义。经常直接假设或指定一个随机变量的分布，而不提及基础概率空间或定义该随机变量的函数。

例如，一个问题可能会说“让 (Y) 有二项式(3, 0.5) 分布”或“让 (Y) 有正态(30, 10) 分布”。但记住，这种陈述并不一定传达关于基础样本空间结果或被测量的随机变量（函数）的任何信息。

在 Symbulate 中，RV 命令也可以通过其分布隐式定义一个 RV。像 X = RV(Binomial(3, 0.5)) 这样的定义有效地通过一个未指定函数在未指定概率空间上定义了一个随机变量 X。

W = RV(Binomial(3, 0.5))
plt.figure()
W.sim(10000).plot()
plt.show()

示例

假设 (X)、(Y)、(Z) 都有相同的分布。Donny Dont 说：

对偶对 ((X, Y)) 和对 ((X, Z)) 有相同的联合分布。
(X+Y) 与 (X+Z) 有相同的分布。
(X+Y) 与 (X+X=2X) 有相同的分布。

判断 Donny 的每个陈述是否正确。如果不正确，请使用简单示例解释原因。

示例解答

首先，如果这些随机变量都没有定义在相同概率空间上，Donny 的陈述甚至不会有意义。例如，如果 (X) 是 SAT 数学成绩而 (Y) 是 SAT 阅读成绩，则考虑 (X+Y) 没有意义，除非为每个学生测量 ((X, Y))。但即使假设这些随机变量定义在相同概率空间上，我们也可以找到反例来反驳 Donny 的陈述。

举个例子，翻转一枚公平硬币 4 次并让：

(X)：前三次翻转中的正面数量
(Y)：前三次翻转中的反面数量
(Z)：后三次翻转中的正面数量

对偶对 ((X, Y)) 的联合分布与对偶对 ((X, Z)) 的联合分布不同。例如，对偶对 ((X, Y)) 以概率为零取值对 (3, 3)，但对偶对 ((X, Z)) 则以非零概率 (1/16) 取值对 (3, 3)。

(X+Y) 的分布与 (X+Z) 的分布不同；(X+Y=3) 的概率为1，但 (X+Z=3) 的概率小于1 (4/16)。

(X+Y) 的分布与 (2X) 的分布不同；(X+Y=3)，但 (2X) 则以非零概率取值为0、2、4、6。

请记住，联合分布是对值对上的概率分布。即使 (X_1)、(X_2)、(Y_1)、(Y_2) 分别有相同边际分布，但这不一定意味着 ((X_1, Y_1))、 ((X_2, Y_2)\）有相同联合分布。一般来说，仅凭边际分布的信息不足以确定联合分布的信息。

我们在第2.8节中看到过相关双向表格示例。即使两个双向表格有相同总数，它们内部单元格也不一定相同。通过多个随机变量变换获得任意随机变量的分布将取决于涉及各个随机变量的联合分配。例如，(X+Y\）的分配取决于(X和 Y`` 的联合分配。

示例

考虑对应于两次 Uniform(0, 1）旋转器旋转结果和让 U_1'为第一次旋转结果以及 U_2 为第二次旋转结果之概率空间。对于以下每对 random variables，请确定它们是否具有相同分配。无需计算；只需概念性思考即可:

U_1 and U_2
U_1 and (U_1)
U_1 and U_1 + U_1
U_1 and U_1^2
U_1 + U_2 and U_2U_1
U_1 and (U_2) 是否 U_1U_()Joint Distribution = 同 U_11 - U_2 joint distribution?

示例解答

Show/hide solution

Yes each has a uniform(01 distribution) Yes each has a uniform(01 distribution). For uin[01] (u,[01], so (U_(U_I have the same possible values and linear rescaling does not change the shape of the distribution. Changing from u,(u essentially amounts to switching the [01] labels on the spinner from clockwise to counterclockwise. No, the two variables do not have the same possible values. The shapes would be similar though; u has a uniform12 distribution. No, a non-linear rescaling generally changes the shape of the distribution. For example, PTU,<49)=049 but p(u<49)=P(U,<07)=07 squaring a number in [01] makes the number even smaller so the distribution of u places higher density on smaller values than u does. No u + u has a triangular shaped distribution on (02 with a peak at I The shape is similar to that of the distribution of x in section?? but the possible values are (02 rather than (28.) but u has a uniform02 distribution do not confuse a random variable with its distribution just because u and u have the same distribution you cannot replace u with u in transformations the random variable u is not the same random variable as spinning a spinner and adding the spins will not necessarily produce the same value as spinner a spinner once and multiplying the value by. Yes just like u and u have the same distribution. No marginal distributions are the same but joint distribution of(u places all density along a line while joint density of(u distributed over whole two-dimensional region [01x[01] Do not confuse a random variable with its distribution. This is probably getting repetitive by now but we're emphasizing this point for a reason. Many common mistakes in probability problems involve confusing a random variable with its distribution. For example we will soon that if a continuous random variable x has probability density function(fx then probability density function of x is not f nor(f) Mistakes like these which are very common essentially involve confusing a random variable with its distribution. Understanding the fundamental difference between a random variable and its distribution will help you avoid many common mistakes especially in problems involving a lot of calculus or mathematical symbols.

不要混淆随机变量及其分布

示例

示例解答

示例

示例解答

示例

示例解答

相关阅读