当前位置:首页 期刊杂志

贝叶斯理论与方法的研究进展

时间:2024-05-19

高 莹 曹 宁 雒晓东

(1.西京学院 工程技术系,陕西 西安710123;2.西安市政设计研究院有限公司,陕西 西安710000)

1 贝叶斯理论的发展

总体来说, 贝叶斯理论的发展经历了以下几个阶段:1736 年Thomas Bayes 提出了重要的贝叶斯定理,1763 年其遗著《论有关机遇问题的求解》被他的朋友Richard Price 整理发表,贝叶斯理论的价值才被世人认识,贝叶斯理论开始莫基。 随后,Laplace 等作了进一步的工作,目前以他姓名命名的定理的现代形式实际上归功于Laplace 。 进入到20 世纪50 年代,贝叶斯理论得到了充分发展,60、70 年代以来,其发展达到鼎盛时期。 许多专家学者投身于贝叶斯理论的研究和应用推广中来,力图从不同的角度对贝叶斯理论进行进一步的探讨和研究,形成了具有多分支的理论系统。

2 贝叶斯决策理论

贝叶斯理论系统中的另一个重要分支就是贝叶斯决策理论。贝叶斯决策(Bayesian Decision Theory)就是在不完全情报下,对部分未知的状态用主观概率估计, 然后用贝叶斯公式对发生概率进行修正,最后再利用期望值和修正概率做出最优决策。

贝叶斯统计理论与最优决策的结合,首先在商业和社会科学中得到了很大的成功,其次是在物理、化学、生物等学科领域得到了广泛的应用,如今其概念和方法在社会许多领域得到了广泛应用,如在工程技术、管理科学、系统运筹、医疗诊断等。

3 贝叶斯决策方法简介

贝叶斯决策方法主要包括经验贝叶斯决策、两阶段贝叶斯决策和序贯贝叶斯决策三种方法。

3.1 经验贝叶斯(Empirical Bayes,简称EB)决策

经验贝叶斯决策的主要工具是经验贝叶斯方法, 该方法由VonMises 提出,被Robbins 所广泛发展。 其基本思想是在已知状态参数向θ=(θ1,θ2,…,θp)各分量之间结构关系的前提下,使用当前抽样数据及有关历史数据对先验分布的一些数字特征进行统计推断。它在未知θ 是低维还是高维时,处理问题特别有效。 这种方法一般又分为两种: 一种是假设θ 的先验分布属于某一含有未知超参数的分布族,通过利用观测数据来估计其中的未知参数,这种方法称为参数经验贝叶斯方法,简称PEB 方法。

3.2 两阶段贝叶斯决策

两阶段贝叶斯决策是以先验两阶段确定理论为基础的。 在第一阶段,记π1(θ |λ)为参数的未知先验分布,其中λ 为一超参数,这儿我们不直接对参数兄作估计, 而是代之以元有第二阶段的先验分布π2(λ),它可以是一个合适的正常先验, 但常常是选择一个合适的无信息先验。类似于经验贝叶斯决策,这种方法也可以分为“可交换”和“一般意义下的”两种情况。

3.3 序贯贝叶斯决策

序贯决策是一种多级决策的方法。 该决策过程是序贯进行的,类似于序贯概率比检验。它是在每次试验(或抽样观测)之后,进行一次统计推断,看能否决定采取某种行动,若能,则做出决策,否则,则再进行一次试验。因此,序贯决策的目的是在试验次数随机的情况下,尽可能利用较小的样本进行统计推断。序贯贝叶斯决策根据不同情况又分为三种:(1)最佳固定容量的序贯贝叶斯决策;(2)序贯贝叶斯因子检验法;(3)决策树法。 决策树用一些标记符号表示决策者所能采取的各种行动路径,通过树枝状展开,并利用概率表达其中的可能状态,经运算得知采取每种行动路径后能够获得的期望值。

4 贝叶斯理论与方法的研究进展

贝叶斯方法属于风险性决策方法,决策者虽不能控制客观因素的变化,但却掌握其变化的可能状况及各种状况的分布概率,并利用期望值即未来可能出现的平均状况作为决策准则。不确定性是生活中的常态,贝叶斯方法不是使决策问题完全无风险,而是通过其他途径增加信息量使决策中的风险减小。关于贝叶斯理论与方法的研究以深入到各个方面。

4.1 数量遗传学中QTL 作图的贝叶斯方法研究

在许多复杂情况下.贝叶斯统计方法比经典数理统计方法能更直接解决问题.且可有效整合部分先验信息.但其需要高强度计算的特性曾限制了其广泛应用近几十年来.随着高速计算机的发展以及MCMC算法的不断提出.贝叶斯方法已被用于群体遗传学、分子进化、连锁作图和数量遗传学等研究领域.已有许多学者研究了数量遗传学中QTL作图的贝叶斯方法从简单到复杂的。

4.2 贝叶斯网络的研究进展

贝叶斯网络在经济和医学等领域越来越多的应用日益显示出其发展前途,这些应用通过正在建成许多应用模型用于预测石油和股票价格、控制太空飞船和诊断疾病等等不断地渗人我们的社会和经济生活中。 除此之外贝叶斯网络还被应用于信息恢复诊断与故障检测、工业方面、电讯通信业、交通管理、文化教育和国防系统等各个领域。 在解决许多实际问题中,我们可以使用贝叶斯网络这样的概率推理技术从不完全的、不精确的或不确定的知识和信息中做出推理。

4.3 贝叶斯数据挖掘算法在反垃圾邮中的研究进展

随着互联网络的发展, 垃圾邮件越来越多地充斥着人们的邮箱,部分学者开始研究现在反垃圾邮件的技术,研究了用来评价垃圾邮件分类方法的语料库和评价体系,着重对贝叶斯理论和贝叶斯参数估计理论进行研究,并取得以下的研究成果:(1)在贝叶斯分类器的工作原理基础上,设计了基于朴素贝叶斯反垃圾邮件模型;(2)在贝叶斯分类器的工作原理基础上,提出一种新的邮件分类方法——贝叶斯参数估计邮件分类,设计实现了基于贝叶斯参数估计的反垃圾邮件模型;(3)通过对以上两种方法进行邮件过滤实验比较,证明在邮件分类中基于贝叶斯参数估计分类方法比朴素贝叶斯分类方法具有更高的召回率、正确率和F 值。基于贝叶斯参数估计的邮件分类算法为解决目前困扰人们的垃圾邮件问题提供了一种新的解决方法和途径。

4.4 基于贝叶斯方法的水文模型不确定性研究进展

水文过程的发生与发展取决于气象因素和地理因素,是一个复杂的动态过程;水文模型接受水文、气象等多种输入,运用了许多水文模型与参数,依赖于对输入、输出信息进行解释的专家们的判断,这些复杂的因素导致了水文预报必然存在不确定性。水文模型不确定性是水文预报不确定性的重要来源之一,该不确定性始终存在并制约着防洪决策的正确性。 水文学家很早就认识到了这一问题,并试图通过多方面的努力来消除或减少该不确定性。

贝叶斯概率水文预报突破了常规确定性水文模型在信息利用方面的局限性。 经美国国家气象局的实际应用表明:不管水文预报的不确定性有多大,总可以保证从概率水文预报中获得正的经济效益。 概率水文预报是水文预报发展的必然趋势,作为预报决策系统的重要组成部分,必将引起国内外水文界的兴趣和关注。

5 结语

从1736 年出现贝叶斯理论至今, 贝叶斯理论已经发展的较为成熟并被广泛应用于各个领域。虽然贝叶斯理论在某些领域的研究中还存在一些局限性和风险性,但是人们越来越感受到贝叶斯理论和方法的重要性。

[1]岳超源.决策理论与方法[M].北京:科学出版社,2005.

[2]徐泽水.不确定多属性决策方法与应用[M].北京:清华大学出版社,2006.

[3]施锡铨,范正绮.决策与模型[M].上海:上海财经大学出版社,2003.

[4]简祯富.决策分析与管理[M].北京:清华大学出版社,2007.

[5]苏岩.贝叶斯统计的发展及其争鸣[J].保定师范专科学校学报,2003(02)

[6]陈文强, 李小蕊, 史朋飞.基于贝叶斯决策的先验分布的选取方法[J].经济研究导刊,2009(04).

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!