统计力学(45):10.2 分布和平均值的统计 (简体字版)
10.2 分布和平均值的统计
在前几章,我们讨论过“分布”,如国民年龄分布,粒子形 象的能量分布等。分布是分类统计的结果。例如,把国民按年龄 分类,每一年龄算一类,而后统计每一类的人数,于是得到图3.1 所示的年龄分布曲线。 这是 一 项有关众国民的数据。它的统 计过程,可以用一个抽象的式子表示
是各人的名字, 是先生(女士)的年龄,是统计人 口数。-函数是分类,即收集年龄为 的人名。年龄在和之间的人数是
读者可复习一下第三章。
“分布”也常作“分配”。我们可以说每段年龄分配到多少人口。用那个名词都无所谓。
(1) 也就是一般分类统计的步骤。分析的对象总是一群“样品” (每个样品都有他的名字或编号) 的某种特性 , 而后收 集 相同的,归之为一类。每类中的样品数叫做该类的“统计份量”。把各类的统计份量 列表或画成曲线,就成了该特性的 “分布”,或样品的“分配”。这是有关这些样品的一项数据。 这项数据,有时仍嫌繁琐。我们可以用些“平均值”来大致表示 分布的情形。例如, 的平均值是
是样品总数, 是 所占的百分比。的平均值是
是分布的“重心” 所在。而是估计分布的分 散的程度。 叫做“几率的 分布”。它只是分统计份量 除以总份量。这是定义。至于 和“机会”、“可能” 等 观念有什么关系,我们在此不必过问。 这要看 的应用。
任何 的函数, 都有它的平均值。例如就是的平均值, 1 的平均值是 1 :
()是所谓“标准化” 或“归一化” 条件。总百分比必是 100% 。
我们可以把分类统计的结果作部份的综合,也就是把某些类 归为大类。例如年龄小于30岁的可归为“青年” 类, 70 岁到 80岁 为“人生开始” 类等等。每一类的人数为其统计份量。一般说来,样品 中的一组 (即样品集中一子集)的统计份量可以定义如 下。令 的“指定函数” 为
因此
为 组的统计份量。令
为 组的“几率”, 这是定义。注意 : 是 的一个例子,即 值在 及 间的样品之集就是。
如果是 样品之集,则
为 “ 之几率”。
这些被统计的“样品” 可以是一群人, 一群物,或一些事件 的记录,实验数据,形象空间中的形象等。现在再看些例子。
以下是新竹电话本(民国 67年)第205、206、 214 页中姓 马和姓梁的电话号码的个位数字:
共有 户,每户为一“样品”,而以上的数字为每户的一 个“特性”, , 。定几率分布为
, 。
此地的-函数的变量只有整数值,故它的定 义是
可以用以上数据统计
从, 各种平均值可以求得,如
(15), (16) 是从 (12)统计出来的结果,至于这些结果有何意义, 还得要多花工夫才能了解。例如,为什么 “4”这号码在 96 户中竟 不出现一次? 同样有趣而且更重要的问题是为什么其他号码的 差不多而又有些差别? 第一问题的答案不难找出,但第二 问题却不是容易囘答的。
再看个例子,从 (12)这些数字,定义
, 这些是(12)数列中相邻数字的乘积。 的平 均值是
现在定义
是所谓相邻数字的相干值,同理,我们可以定
当然 。 不是 , 所以必须比 小很多, 以求平均值的定义大致一样。 是“相干函数”, 是“距离” 的函数。 统计结果 比 小很多, (见(18) 、 (19))。 我们把这结果解释成 (12) 中相邻的号码大致“不相干” 或互相“独立”。 照我们的“直觉”, 如果这些数字是“不规 则”的,则各 会有的高于, 有的低于, 毫无 规则,, , 都该是零。在下一章,我们将对这些观念作有 系统的介绍。
注意,这些相干函数当然是和号码排列有关, 本是指定电 话用户排列顺序,并无统计意义。 的数值在此是照电话本的排 列顺序而定。这顺序是我们新加的观念,各之间的“距离” 也 是照这顺序规定。
我们的目的是要把统计学用来整理分子运动数据,许多实验 都是在度量各种分子运动变量的平均值。我们的统计步骤是要以 分子运动为根据,各种几率平均值都必须从分子运动数据来定义。 时间的顺序,空间的位置,是最基本的观念。各种相干函数, 在讨论运动的规则性时,是最重要的工具。
现在我们看一个比较不同的示范例子。
令一垂直平面为 平面。重力向下 , 轴向上 , 轴水平。 一个粒子在这个平面中 轴以上运动。 轴是一硬地板,粒子 掉在地板上就反跳。假设没有能量损失。水平运动被限制在, 为求简单起见,把 和 认定为同一点,如此 这个粒 子的运动面成为一个圆柱面,其周长为, 这 是所谓周期 性的边界限制或“循环边界” (见图 1)
这粒子的运动,遵照力学的运动方进程。这方进程的解,是 这粒子的轨迹。轨迹非常简单,水平运动一直不变绕着圆柱走。 垂直运动是上下不停。任何性质都可由这个运动轨迹求出,观测 时间是。
图 1
我们先问: 粒子的高度分布如何?这问题并不清楚,因为“分布” 必须要有明确的统计定义, 而我们还没有下这定义。一般 有关运动变量的统计,多是定时间为统计份量,因为实验的结果 多是对时间的平均值。我们现在把粒子花在某段高度的时间,定 义为该段高度的统计份量。令
是在时刻 的高度, 就是几率的高度分布。(21) 是(7)的一个例子。此地的“样品集” 是轨迹,每一时刻 有 一“样品”,即在时粒子的形象。 很容易计算(,即 和垂直速度成反比):
是粒子最高可及的高度,读者可自己导出 (22) 。是上下一 次的周期
是在 时的垂直动量。
如果 , 则 可略去。 的积分
可定义为高度在, 间的几率。就是粒子花在 在这段高度的时间。
高度的相关函数(和 (20)的 相类似)
不难计算出来, (见图 2)
图 2:为一周期函数,因为是个周期函数。
再看在时间 内,地板所受的平均力。粒子不着地 时,地板不受力。着地时,因为地板很硬,受力很大。每落地一 次,粒子动量的改变,是粒子落地前动量的两倍,即。如 果每隔一段时间 落地一次,则第次落地的时刻是,地板 受力是
平均力是
式中 是在 这段时间内落地的次数。这 一项,要看最后一次落地,和 中间,过了多久。如果, 则此项可略去,
之值见 (23) 。
以上的这些例子, 是统计步骤的例子。几率、分布和平均值 的观念,只是用来整理、报导已有的数据。它们并不涉及数据的 解释,并不涉及原理的探求。这些例子还不足以说明几率的一般 定义和用法。在下节,我们转向广泛的讨论。
(可左右滑动看完整公式)
(此抄书系列同时发在本人的博客:hongruma.net)