概率论 :研究随机现象规律的数学分支

更新时间:2023-01-01 14:06

概率论(Probability Theory)是研究随机现象数量规律的数学分支,是对可能发生、可能不发生的随机事件进行大量的重复的同一试验,随机现象的发生呈现出一定的规律性。

概率论的起源可以追溯到亚里士多德时代,当时,人们主要以数据统计为主要手段,主要研究保险、赌博、占卜等实际问题。通常人们认为概率论的鼻祖为法国的数学家布莱士·帕斯卡(Pascal)和皮耶·德·费玛(Fer-mat),他们引进了赌博值的概念。后来,克里斯蒂安·惠更斯(Huygens)改“值”为“期望”,并出版了《机遇的规律》。1713年,雅各布·伯努利出版了《推测术》,从此,概率问题不再局限在对赌博和机遇的讨论上。1796年,法国数学家拉普拉斯研究了概率论的相关问题,并在之后出版了《概率论的解析理论》一书,采用多种方法研究概率问题。1846年俄国数学家切尔雪夫在格列尔的杂志上发表了“概率论中基本定理的初步证明”一文,给出了泊松形式的大数定律的证明。并于1887年,他发表了更为重要的“关于概率的两个定理”,开始对随机变量和收敛到正态分布的条件,即中心极限定理进行讨论。1899年法国数学家贝特朗提出了贝特朗悖论。从贝特朗悖论的解法中推断出概率问题在不同的理解下便会有不同的结果,是由几何概率的逻辑基础的不严密性造成的,进一步侧面推动了20世纪初概率论公理化运动的兴起。后来,俄国数学家马尔可夫在概率论中,发展了矩法,扩大了大数律和中心极限定理的应用范围。最初致力于研究相互独立随机变量序列,改进和完善概率极限理论,后来研究兴趣拓展到随机变量序列,创立和发展了著名的马尔可夫链理论,为随机过程发展奠定了基础。

概率论有一些基本概念,包括随机事件与概率、随机变量与分布、数学特征与特征函数等。与几何学类似,概率论的很多定义建立在公理系统之上。概率论的理论可应用于很多领域实际问题的解决上,如,在数据管理中,概率论提供了常用的归纳总结方法,可以将杂乱的数据变得井然 有序,便于技术人员对未来数据做出预测。

简史

萌芽时期

人类认识到随机现象的存在是很早的。 从太古时代起, 估计各种可能性就一直是人类的一件要事。 早在古希腊时期,利奥六世就已经注意到必然性与偶然性问题; 在中国春秋时期也已有可考词语( 辞海) ; 即使提到数学家记事日程上的可考记载, 也至少可推到中世纪。 在概率论萌芽时期主要以数据统计为主要手段,主要研究保险、赌博、占卜等实际问题。

古典时期

概率论的历史可追溯至17世纪法国的数学家帕斯卡(Pascal 1623~1662)提出的分赌本问题,他和皮耶·德·费玛(Fer-mat  1601~1665)在回信中对该问题做了讨论。1654年,他们引进了赌博值的概念,值等于赌注乘以获胜概率。 后来,克里斯蒂安·惠更斯(Huygens)改“值”为“期望”,并出版了《机遇的规律》,其中的机遇博弈在概率概念的产生及其运算规则的建立中,起了主导作用。1713年,雅各布·伯努利出版了《推测术》,该著作是把概率论由局限于对赌博机遇的讨论拓展出去的转折点和标志。伯努利采取把概率分为“主观概率”和客观概率的立场,其前三部分,是古典概率的系统化和深化。

法国数学家棣莫弗(1677~1754)在1733年出版了《机会的学说》,他推导了正态分布,并指出当二项分布的参数值n很大时可以用正态分布来近似计算其概率。

在1777年,法国科学家布丰完成的投针实验是历史上第一个统计模拟实验,可以用实验结果估计圆周率。该实验可以表述为:向一簇距离为的平行线构成的平面投掷一根长度为的针,求针与直线相交的概率。

分析时期

法国数学家皮埃尔-西蒙·拉普拉斯(P.S.Laplace,1749~1827),总结了古典概率论,并使它发展到新的历史阶段。1796年,法国数学家拉普拉斯研究了概率论的相关问题,并在之后出版了《概率论的解析理论》一书,采用多种方法研究概率问题。

法国数学家泊松(Simeon-Denis 西莫恩·泊松 1781~1840)在数学方面贡献很多。最突出的是1837年在《概率在刑事与民事诉讼方面应用的研究》 一文中提出描述随机现象的一种常用分布,在概率论中现称泊松分布。这一分布在公用事业、放射性现象等许多方面都有应用。他还研究过定积分、傅里叶级数、数学物理方程等。除泊松分布外,还有许多数学名词是以他名字命名的,如泊松积分、泊松求和公式、泊松方程、泊松定理等等。

德国约翰·卡尔·弗里德里希·高斯(Carolus Fridericus Gauss,1777年4月30日~1855年2月23日)在1809年,高斯发现了质数分布定理和最小二乘法。通过对足够多的测量数据的处理后,可以得到一个新的、概率性质的测量结果。在这些基础之上,高斯随后专注于曲面与曲线的计算,并成功得到高斯钟形曲线(正态分布曲线)。其函数被命名为标准正态分布(或高斯分布),并在概率计算中大量使用。

俄罗斯数学家切尔雪夫1845年在自己的论文中借助十分初等的工具——的科林·麦克劳林展开式,对雅各布·伯努利大数定律作了精细的分析和严格的证明。一年之后,他又在格列尔的杂志上发表了“概率论中基本定理的初步证明”一文,文中继而给出了泊松形式的大数定律的证明。1866年,切比雪夫发表了“论平均数”,进一步讨论了作为大数定律极限值的平均数问题。1887年,他发表了更为重要的“关于概率的两个定理”,开始对随机变量和收敛到正态分布的条件,即中心极限定理进行讨论。

法国数学家贝特朗1899年提出了贝特朗悖论。贝特朗悖论是指在圆内任作一弦,求其长超过圆内接等边三角形边长的概率。后来贝特朗在这个问题的解法中发现这个问题之所以有不同的解答,是因为当一随机试验有无穷多个可能的结果时,有时很难客观地界定“等可能”这一概念,在不同的理解下便会有不同的结果,这是由几何概率的逻辑基础的不严密性造成的,它从一个侧面推动了20世纪初概率论公理化运动的兴起。

现代时期

俄罗斯数学家马尔可夫(1856~1922)主要著作有《概率演算》等。在概率论中,他发展了矩法,扩大了大数律和中心极限定理的应用范围。马尔可夫深受圣彼得堡数学的学术影响,是切比雪夫概率思想的继承者和发展者。最初马尔可夫主要是沿着恩师开创的概率方向,致力于相互独立随机变量序列研究,改进和完善概率极限理论。后来其研究兴趣拓展到随机变量序列,创立和发展了著名的马尔可夫链理论,为随机过程发展奠定了基础。

1940年中国数学家许宝騄在概率论和数理统计学方面对马尔可夫过程、极限定理的科学研究做了大量工作,有杰出贡献,是我国最早达到世界先进水平的一个数学家,受到国内外数学界的敬重。他生前共发表学术论文三十九篇。1979年,为了纪念他,美国《数理统计年鉴》专门撰文介绍他的生平,高度评价了他在概率论和数理统计两方面的工作。

1964年中国数学家侯振挺与郭青峰合著的《其次可列马尔代夫过程》里,发展了王梓坤构造理论的方法,并提出了最小非负解方法,包括“Q过程中唯一性准则",这是一个国际上四十年来数学家们非常关心的概率论难题,在侯振挺的著作中得到了完整的、最终的解决。因此,他获得了英国戴维逊奖,受到国内外概率论学者的高度评价,被誉为“侯氏定理”。

基本概念

随机事件与概率

随机事件

随机试验中具有某种共同特征的样本点构成的集合称为随机事件,简称事件,常用英文大写字母或表示。事件发生当且仅当所包含的某个样本点在试验中出现。

概率

概率是针对事件定义的,即对应于事件域中的每一个元素有一个实数与之对应,一般把这种从集合到实数的映照称为集合函数。因此,概率是定义在事件域上的一个集合函数。

随机变量与分布

随机变量

一般地,如果为某个随机事件,试验的结果能用一个数来表示,这个数是随着试验的结果的不同而变化的,也即它是样本点的一个函数,这种量称为随机变量(random variable)。

泊松分布

泊松分布(西莫恩·泊松 广义函数)一种重要的离散型分布,若离散型随机变量可取一切自然数值,且有,则称专服从参数的泊松分布,其中,是自然对数的底,此分布的平均值,标准差

二项分布

二项分布是对只具有两种互斥结果的离散型随机事件的规律性进行描述的一种概率分布,是离散型随机变量中最常见的分布,也称伯努利分布

只有两个可能结果的试验称为雅各布·伯努利试验。记出现事件为成功,出现的反面为失败,满足。若试验重复次,每次事件出现概率均保持不变,则称这种试验为重伯努利试验。在重雅各布·伯努利实验中,记为事件出现的次数,则的分布列 为,其中。这个分布称为二项分布,记为。

正态分布

正态分布(Normal distribution),又称为常态分布或高斯分布。如果随机变量的密度函数为

则称服从正态分布,简记作,此时也称是正态分布的随机变量,或简称为正态变量。

正态分布因分布函数的不同有以下四种类型:

概率密度函数

一维随机变量的概率密度函数(Probability Density 函数,PDF)定义为,式中,是随机变量的数学期望(均值),是的方差,且,。显然,单变量情况下的概率密度函数由参数和就可以完全确定,为简单起见常将相应的概率密度函数简记为或,读作 服从,或服从正态分布

当参数,时,即时,则称服从标准正态分布,相应的概率密度函数定义为。正态分布随机变量概率密度函数都满足:,。对于一般形式的正态分布,有。

累积分布函数

累积分布函数(Cumulative Distribution 函数,CDF),又叫分布函数,是概率密度函数的积分。根据连续型随机变量分布函数的定义,一般正态分布的分布函数为:,正态分布函数是一个增函数,而且有,,。

特别地,当参数,时,标准正态分布的分布函数为:,则有。

设,且为标准正态分布函数,则:,,。

矩母函数(矩生成函数)

对于随机变量,若数学期望存在,则对任意实数,其矩母函数(Moment Generating 函数,MGF,又称矩生成函数)定义为,记为。对于连续分布,其中的期望是;对于离散分布,其中的期望是。若随机变量服从,按照矩母函数及其数学期望的定义公式,可以写出一般正态分布的矩母函数为,其中,标准正态分布的参数、,代入上式,得到标准正态分布的矩母函数为。

特征函数

为了定义特征函数,须先引进复随机变量的概念,设和都是样本空间上的实随机变量,则称为复随机变量,其中。复随机变量的数学期望为,若是(实)随机变量,则当实数取定时,为复随机变量。

因此,设是随机变量,则称实变量的复值函数为随机变量的特征函数,或称为相应分布的特征函数(Characteristic 函数)。

若随机变量服从,按照特征函数定义公式,则一般正态分布的特征函数为,其中,标准正态分布的参数、,代入上式,得到标准正态分布的特征函数为。

均匀分布

均匀分布是一种常见的连续型随机变量分布,即随机变量在确定的区间中,所取得每个值具有等可能性的分布。

若是两个有限数,且随机变量的密度函数为:

则称服从上的均匀分布,记为。

特别地,当时,称为标准均匀分布。

数字特征与特征函数

数学期望

随机变量的数学期望是刻画随机变量平均大小的一个数字特征,记为E(X),E(X)反映了随机变量取值的集中趋势,刻画了的分布的中心位置。

设是离散型随机变量,其分布律为。如果,则称为随机变量(或相应分布)的数学期望,简称期望。如果级数不收敛,则称的数学期望不存在。为书写方便,在不引起混淆的情况下,期望简记为。

设是连续型随机变量,其密度函数为。如果,则称为随机变量(或相应分布)的数学期望。如果不收敛,则称的数学期望不存在。

方差

方差是随机变量的重要数字特征之一,是反映随机变量的取值与其数学期望偏离程度的量。方差因随机变量类型的不同有以下定义。

设是一个随机变量,若存在,则称为的方差,记为或,即并称方差的算术平方根为的标准差或均方差。

协方差

设 是二维随机变量,若存在,则称其为随机变量与的协方差,并记为 。

基本方法

公理化方法

含义

在一个数学系统中,尽可能少地选取原始概念和不加证明的一组公理,以此为出发点,利用纯逻辑推理的法则,把该系统建立成一个演绎系统的方法,就是所谓的公理化方法。

基本内容

为了把某一门数学表达为演绎系统,需要选择一组基本概念和公理作为出发点,因此,如何选择一组基本概念和公理便是运用公理化方法的关键所在,这也是公理化方法的基本内容。公理是对诸基本概念相互关系的规定。这些规定理的、不多不少的。也就是说,公理的选择应符合三条要求:相容性、独立性、完备性。

相容性

所谓相容性,即无矛盾性,就是从公理出发,无论推论到多远,不允许推出命题A和A同时成立。相容性是构成公理的一个基本要求。任何数学分支或理论体系都必须满足这个条件。例如,在平面几何中,命题“两条直线或者平行或者相交”是真命题,而在立体几何中这个命题就是假命题。这反映了平面内两条直线的位置关系与空间中两条直线位置关系内涵与外延的不同,不属于认识上的矛盾。

独立性

所谓独立性这是要求在一个公理集合中不允许出现多余公理,要求公理的数目减少到最低限度。因为多余的公理可作为定理推证出来,因此列为公理没有必要。

完备性

所谓完备性就是保证某一数学分支的全部命题都能从这一组公理推导出来,因此必要的公理不能少,否则就不完备。如果某个数学分支的公理数量不够、不具备完备性,会造成这个分支的一些真命题得不到理论的证明,或者造成一些命题的证明没有充足的理由。

概率论与公理化

概率的公理化定义

设是随机试验,是它的样本空间,对于的每一个事件赋予一个实数,记为,若满足下列三个条件:

独立事件

对事件及,若 则称它们是独立统计的,简称独立的(independent)。注意,按照这个定义,必然事件及不可能事件与任何事件独立。此外可看出,与的位置对称,因此亦称与相互独立。

相容事件

如果两个事件不能同时发生.也就是说,如果甲事件发生,则乙事件必不能发生;乙事件发生,甲事件也必不能发生,就称它们是互不相容的(或互斥的),否则称它们是相容的(或不互斥的)。

完备事件

完备事件,也被称为完备事件组或完全事件组,是概率论的基本概念之一。称有限或可数个事件构成完备事件组,如果它们两两不相容,即;那么它们之和是必然事件。

例如,一批产品分为3个等级,以表示事件“随意抽取一件恰好抽到等品”,则构成完备事件组。

应用

数学

众所周知,概率论的大厦是建筑在微积分的地基之上的,如在函数关系的对应下,随机事件先是被简化为集合,继之被简化为实数,随着样本空间被简化为数集,概率相应地由集函数约化为实函数。以函数的观点衡量分布函数,的性质是十分良好的:单调有界、可积、几乎处处连续、几乎处处可导。因之,微积分中有关函数的种种思想方法可以通畅无阻地进入概率论领域。总之,微积分的思想方法渗透到了概率论的各个方面,换言之,没有微积分的推动,就没有概率论的公理化与系统化,概率论就难以形成一门独立的学科,微积分与概率论的亲缘关系,决定了概率论的确定论的特征。但是作为微积分的一门后继课程,概率论并非按微积分中的思维方法发展下去,而是另辟蹊径,其发展路径与微积分大相径庭。最终成为了随机数学的典型代表,具备了与微积分相当的地位。更因其非线性、反因果的非理性特征,显得比经典的微积分更具有时代精神。而作为确定性数学典型代表的微积分对概率论的发展具有很大作用,因此讨论微积分在概率论中的地位,探究概率论与微积分的联系及方法的相互应用,对教学工作者的教学有着一定的作用。

经济学

概率论在金融风险的防范上,也有重要作用。以炒股为例,炒股需要应用概率论思想与专业的金融学知识,这样才能在金融市场中抓住机遇,将金融风险的发生率降低至最小化,达到理想的效果。

经济利润包括商品生产投资、市场消费、金融投资等中获得的经济金额。概率论根据分析结果实时掌握市场经济的状态,就经济信息进行对照性的推演,对后续的决策和计划的制定提供可靠地参考。对新产品的研发,首先需要在消费市场中进行产品需求调查,并根据当前消费市场和产品需求的趋势计算出消费群体的概率。可以通过抽样选择获得相对实际可靠的消费数据。根据收集的调查样本对商品需求的结果数量进行比较分析。以确定新产品是否具有占领市场的潜力,同时准确计算投资成本和回报。

数据分析

概率论与大数据分析之间本身就具有密切联系,这主要表现在几个方面:第一,概率论与数理统计与大数据分析的目标相同,都是为了探索、明确数据结构,找出数据的联系和规律;第二,在大数据的发展下,拓展了统计学的应用空间,也为概率论与数理统计学提供了全新课题;第三,大数据分析并不是统计学的分支,还可以广泛应用在多个领域中,为其他领域的研究提供了全新的工具、思想;第四,概率论与数理统计属于DM中应用广泛的问题解决方式。

在大数据时代,概率论和数理统计学以及数据挖掘都在数据管理中发挥着重要的作用。在数据管理中,概率论和数理 统计是最常用的归纳总结方法,可以将杂乱的数据变得井然有序,便于技术人员对未来数据做出预测。而数据挖掘则是 一种新兴技术,一般使用高算力计算机来对数据进行处 理。通过数据挖掘可以整理海量,繁杂的数据,使这些数 据呈现规律性,统一性,以便于技术人员解读,分析这些 数据。两种数据处理方法都可以发现庞大数据中存在的规律,提前对未来进行预测分析

实际生活

在体育中的应用

从概率学角度来研究不同分数的难易程度,假设箭靶呈圆形并且每个环的宽度相同,并且宽度设为,采用几何概型,其中十环的面积是依此类托,从内往外,九环、八环到一环的面积依次为。我们假设运动员在射箭途中不会脱靶,并且击中靶上任何一个部位都为随机的,所以由几何概型的定义我们可以得出,对于任何一个射箭运动员来说,射中十环的概率是,射中九环的概率是,以此类推,射中八环七环等一直到一环的概率分别是,所以从概率的角度来看,射中一环的概率最高,射中十环的概率最低,所以越靠近靶心的位置越难射中,相应的分数也会越高。

在决策分析中的应用

在很多的现实情况中,决策者需要就当前或者未来即将发生的问题来从若干个解决方案中选择一个或者多个最佳的方案。所以决策者需要就发生的问题来进行比较科学的分析,选择最优策略,并且尽量避免损失。而很显然概率论可以帮助决策者显著提高决策胜率和决策水平。选择保险公司的投保问题来看概率论在决策分析中的运用。对于保险公司而言,公司一方面既要照顾到保险受益人的经济利益,但是同时,公司作为一个整体也要考虑公司的盈利能力。

免责声明
隐私政策
用户协议
目录 22
0{{catalogNumber[index]}}. {{item.title}}
{{item.title}}
友情链接: