当前位置:首页 期刊杂志

应急响应环境下基于BDI模型的Agent结构研究*

时间:2024-07-28

潘星晨,汪云峰

(同济大学 经济与管理学院,上海 200030)

由于公共事件的突发及发展具有不可逆性和不可实验性,建模仿真成为研究各类突发公共事件应急管理的重要实验手段之一。Agent作为分布式人工智能概念模型,具备自己行为、目标和知识,是在一定环境下能自主运行的实体,具有主动性、独立性、智能性、反应性、交互性等特点,并具有良好的决策分析的能力,能够适应应急响应过程建模的需要。因此,基于Agent的应急响应建模仿真具有优越性和现实性。

本文通过研究和构建应急响应环境下基于BDI模型的Agent结构,并在NetLogo平台中实现,为今后进一步研究基于Agent的应急管理建模仿真奠定研究基础;同时也为在NetLogo平台下的程序开发工作,提供一定的Agent结构的范式和标准。

1 BDI模型

BDI(Belief-Desire-Intention)模型是近年来学术界广泛研究的一种基于思考型的Agent结构,其哲学观点源自Bratman[1]在IRMA系统的设计中明确表示了信念、愿望和意图,并将意图看作部分行为计划,这些计划是Agent承诺执行、完成其目标的计划,从而使Agent能够根据资源的变化情况有效实现手段目的推理。

BDI模型的结构可以表示为[2]:

Agent:: =<Aid,P,B,D,I,A,see,brf,options,filter,execute>.

其中,Aid为某一具体Agent的标识;P为Agent的视觉状态集,即Agent所感知的外部事物;B为 Agent的信念,即对 P进行的理解和认知;D为 Agent的愿望,即对B所形成所要达到目标的偏好和情感;I为Agent的意图,即对达成D中的一项或多项愿望进行行动承诺;A为 Agent根据I所做出的行动集 ;see、brf、options、filter、execute五个具体行为则用于刻画出Agent的感知过程、意念修正过程、思维过程、愿望筛选过程和行为决策过程[2]。所以,整个结构可以理解为当Agent接受或感知到一个事件时,它根据当前环境状态信息而构成的信念库,进行信念修正,并完善信念库;然后根据实现状态及意图确定愿望,形成愿望库;经规则推理及筛选函数,基于当前信念、愿望及意图的基础上形成新的意图库,最后Agent由该意图驱使进行行为选择,并执行活动。

本文所构建的Agent结构采取BDI模型,这是因为Agent决策的制定过程依赖于表达Agent的信念、愿望和意图的行为操作来实现,所以BDI结构更接近人类的思维方式,更能够在应急响应过程中,解释各个主体的行为过程。

2 应急响应环境下基于BDI模型的Agent基本结构

应急响应环境下的Agent结构建模是一个非常复杂的构建过程。(1)突发公共事件的场景是一个动态的、不断发生变化的场景,构建的Agent必须能够对外界环境的改变做出及时的随机应变,需要不断地做出滚动决策和决策更新,这一要求符合反应型Agent的特征。(2)突发公共事件的应急响应过程是一个紧急、错综复杂、处理不当可能会导致巨大损失的过程,需要做好事先的预案和演习工作,要求Agent能够按照事先的规划进行及时、有序的操作,这是思考型Agent的典型特征。(3)突发公共事件的应急响应需要在指挥部的协调下,各个职能部门协调沟通、协同工作,要求Agent之间能够及时通信和消息共享,有完善的协调商议机制。

基于上述要求,为应急响应所构建的Agent结构必须是一个具有信息感知、匹配处理、筛选决策、执行和与其他Agent通信能力的“反应+思考+通信”混合结构。因此,本文提出基于BDI的Agent基本结构可定义为一个九元组(主体标识、目标、感知器、信念、匹配器、筛选器、意图、执行器、通信器),即:

<AGENT>::=<主体标识><目标><感知器><信念><匹配器><筛选器><意图><执行器><通信器>

<主体标识>::=<主体名><主体的相关属性>

<目标>::=<角色分配>

<感知器>::=<激活条件><信息流>

<信念>::=<任务表><知识库>

<匹配器>::=<任务分解规则>

<筛选器>::=<策略配置机制>

<意图>::=<事物名><事物处理描述>

<执行器>::=<意图的执行者>

<通信器>::=<发送者><接收者><通信原语><通信内容>

基于BDI的应急响应Agent基本结构与BDI模型相比,增加了基于角色分配的Agent目标、感知器、匹配器、筛选器、通信器等内容,同时进一步强调基于团队目标和个人目标的深层次思考,决策过程中策略设置和求解,外界环境和资源的变化,以及团队协作、信息共享对于Agent结构的影响,以此来提高 Agent的反应性、互动性和能动性。

3 应急响应环境下基于BDI模型的Agent结构框架

在基于BDI的Agent基本结构基础上,考虑环境、资源、目标、组织给Agent带来的影响,进一步细化、深化、模块化、多维地、系统地来搭建Agent结构框架体系,构建出应急响应环境下基于BDI模型的Agent结构框架,并进行具体阐述。

应急响应环境下基于BDI模型的Agent结构框架如图1所示,由感知模块、决策模块、执行模块、通信模块四大模块组成,实现一个智能主体的整个活动过程。

图1 应急响应环境下基于BDI模型的Agent结构

其中,感知模块、决策模块、执行模块三层顺序结构体现了Agent的自主思考性;通信模块对于感知模块、决策模块的影响展现了Agent的社交性;感知模块对于环境和资源的充分感知,根据环境的变化所进行的动态装载执行模块都说明了Agent具有良好的反应性;Agent在角色分配之后获得角色责任和权限,即明确了自身的子目标和组织的总体目标,整个结构框架体现了Agent是在目标的引导下开展思考、决策和行为,符合Agent的预动性要求。

四大模块中分别包含感知器、信念、匹配器、筛选器、意图、执行器、通信器七大功能件,其中由于意图的产生和执行分属于决策模块和执行模块两大模块,所以意图为跨模块功能件。同时,Agent结构中还包括任务分解、策略配置、动态装载、通信标准等协议和规则,确保Agent结构的准确、动态、协作性的运作的实现。

各模块中的功能件的作用分别为 (以应急响应过程中消防员Agent的行为为例):

(1)感知模块

感知器是Agent获得外部环境信息以及从Agent自身属性获取信息的部分,感知内容形成Agent自身的信念。应急响应过程中,感知器帮助消防员Agent从应急场景中了解到着火区域位置信息、需要救援市民的信息以及救援过程中所需要的其他相关信息等。

信念为描述Agent对当前环境的认知和自身可能采取行为的估计,形成任务集和知识库。消防员Agent将所需要进行救援的人员和位置信息作为此时自身的信念,并加入所要完成的任务集中。

任务集与知识库是用来储存任务信念和知识信念的存储器,通过感知器和信念更新进行不断修正。任务集中包括Agent所要完成的各项任务。任务可以来源于自身感知现场的发现,也可能来自上一级的命令。知识库中可包括Agent的能力属性及感知外界产生的知识,如消防员Agent自身的灭火能力、行进能力、救援能力,以及消防员Agent根据演习结果或其他历史经验确定到达救援现场的最短路径等。

(2)决策模块

匹配器的作用是根据信念产生的行为估计,进行任务分解,匹配选择多个可行的行动。任务分解是指根据有限的元规则库,形成一定的任务集。匹配器根据条件得出下一步能够进行的行为。行为中包括为达成目标所采取的各种类型(如消防员Agent的机动行为、任务行为和通信行为),机动行为包括寻找路线、寻找目标、接近目标;任务行为包括灭火、救人、挖掘、疏散、修路等;通信行为包括下达命令、接受命令、请求协助、同意协助和拒绝协助等类型。符合匹配条件的行为被匹配器输入筛选器进行下一步精确过滤。

筛选器的作用是在匹配后,根据一定的规则进一步选出一个最优愿望,形成意图进行实施。筛选最优愿望就是对这些行为进行评估,找到最优行为。策略配置是根据一定规则策略的选择和调整,从众多候选行为中选择出一个最先执行的行为形成意图。策略配置受到外界环境(如社会)和资源限制的影响,如消防员Agent在救援过程中,策略配置可以分为确定救援目标(最短距离目标、最危险形势目标),确定救援优先性(以人为本、以发现顺序为本),确定协作方案(有内部协作、无内部协作),确定救援顺序(多目标记忆救援、单目标顺序救援)等。

由于匹配器和筛选器的联合作用,已经完整呈现出了BDI模型中愿望形成的整个过程,所以,在本模型结构中,愿望以虚线框形式表现,并非某个真实存在的功能件。

(3)执行模块

意图用来描述Agent为达到某个具体目标所做出的承诺,是Agent下一步立刻执行的行动。意图的执行是通过装载n个不同的意图子模块来实现的。动态装载是指根据团队协作的需要、环境资源发生的变化以及筛选器的规则过滤,动态添加、改变执行顺序或者删除某个意图子模块,来实现Agent具有良好的即时反应能力。消防员Agent拥有救人子意图、灭火子意图、搜寻子意图,以及根据救援现场的实际情况变化,对于这些基本子意图的动态组合或动态更新。

执行器是用于执行意图的效应器。它能根据消防员Agent知识库中的能力属性,如视距、视角、听觉、灭火距离、速度、方位等性能指标,实现诸如机动或救人任务、灭火任务等意图。意图在执行过程中,受到外界资源的限制,同时对外界环境产生影响。

(4)通信模块

通信器用于与其他Agent进行联系,如传达命令、协同配合等。通信器主要由消息发送、消息接收、消息处理等子模块构成。得到的有用信息被反馈到感知器,以不断更新信念和任务集等动态因素,使以后的判断和行动更加正确有效。消防员Agent在救援过程中,可以和其他消防员 Agent、等待救援的市民 Agent、指挥 Agent等进行即时通信,以完成高效、及时的救援工作。

4 应急响应环境下基于BDI模型的Agent结构的仿真实现

Netlogo是一个由美国西北大学Center for Connected Learning研发的模拟自然和社会现象多实体编程语言和仿真平台[3],尤其适合复杂性系统的开发。开发者可对成百上千个相互依赖且并行运行的Agent发实时指令,与突发公共事件应急响应的环境要求十分相似,故本文采用Netlogo对应急响应过程进行建模仿真研究,并实现应急响应环境下基于BDI模型的Agent结构。

在研究过程中,通过不断地改进和修正,在NetLogo开发平台上实现了本文所提出的应急响应环境下基于BDI模型的Agent结构。在仿真过程中,消防员Agent结构包括四个模块:感知模块、决策模块、执行模块、通信模块。决策模块和通信模块是整个仿真程序的核心部分。

(1)决策模块

根据本文所提出的Agent结构模型,决策模块由匹配器和感知器组成,对产生的信念进行任务匹配和策略配置,形成可执行的意图,对于仿真程序来说,即是一组基于if-then的元规则库。

(2)通信模块

本文所提出的Agent结构模型的通信模块,采取的通信标准为FIPA-ACL通信标准[4-5],包含消息发送方、消息接收方、消息类型、消息内容等四大基本内容。在NetLogo平台的实现过程中,可调用平台所提供的communication.nls库[6-7],简化、减少程序的开发量。

(3)感知模块和执行模块

感知模块和执行模块是仿真程序的重要组成部分,模块中的过程和方法供决策模块和通信模块调用执行。其中,为了有效实现BDI模型结构和减少程序的开发量,这两个模块中均调用了Netlogo平台所提供较为成熟和稳定的 bdi.nls库[6-7]。

感知模块中,根据组织中不同层级、不同权限的Agent,提供了不同的视图,视图范围通过赋予 Agent不同的属性变量加以实现。其中,指挥层级拥有全局视图,可根据整个城市(或仿真系统边界内)的应急需求,通盘统筹考虑资源的调拨和协调;队长层级拥有区域视图,能够及时了解某一个救灾片区中消防队员的救援情况,根据实际的灾害情况,做出指挥和部署。在缺乏所需要的救灾资源时,向上级部门请求调拨;队员层级拥有视域视图,受视力范围所限,只能感知到周围环境的变化,并在队长的指挥和队友的通信交互过程中,协作完成救援任务。

执行模块则调用bdi.nls库中的intention子过程,实现intention模块中的执行程序动态添加、更新和删除,确保Agent能够快速应对环境和任务的变化,准确执行筛选器中选出的最优行为,提高Agent的个体效率,使整个多Agent系统达到全局最优。

本研究使用Netlogo平台实现应急响应环境下基于BDI模型的Agent结构的部分仿真程序,实现了消防员在建筑内部灭火救人的基本场景,如图2所示。整个大矩形代表某个着火的建筑物;里面的小矩形块代表着火地块,即着火点;圆点代表楼内市民;消防员集中在建筑的出入口处,整装待命;外圈部分则是用于市民逃生的道路;右下角的小地块则代表公共绿地或者逃生人员集中地;各个控件是不同策略配置的开关控件。本文所提出的模型结构能够在NetLogo平台上顺利执行实现,取得了仿真所要达到的数据和效果,如图3所示。应急响应环境下基于BDI模型的Agent结构能够对突发公共事件应急管理研究起到较好地支撑作用,同时也为基于BDI模型的Agent结构在Netlogo环境下的编程开发工作提供了范例,具有一定的通用性。

图2 灭火救人基本场景

通过NetLogo平台的仿真结果证明,本文所构建的应急响应环境下基于BDI模型的Agent结构符合应急响应场景救援工作的需要,具有一定的通用性,为进一步研究应急响应过程中的指挥控制、协同协作、信息共享提供了基本场景,为研究应急响应过程中各Agent的行为提供了解释结构,为基于BDI模型的Agent结构在Netlogo环境下的编程开发工作提供了范例。在今后的研究工作中,将以此Agent结构模型为研究基础,进一步研究应急响应过程中组织的动态调整、协同计划和团队协作等内容。

图3 仿真过程图

[1]O’HARE G M P, JENNINGS N R.Foundationsof distributed artificial intelligence[M].John Wiley&Sons, Inc.1996:505-526.

[2]KINNY D,GEORGEFF M,RAO A.A methodology and modeling technique for systems of BDI agents[A].In W.VELDE V, PERRAM JW, Agentsbreakingaway[C].Proceedings of the Seventh European Workshop on Modeling Autonomous Agents in a Multi-Agent World(LNAI Volume 1038), Springer-Verlag: Berlin, Germany, 1996, 56-71.

[3]WILENSKY U.Netlogo center for connected learning and computerbased modelling, Northwestern University, Evanston,IL(1999), http://ccl.northwestern.edu/netlogo

[4]张德同,周明全,耿国华.FIPA规范:Agent系统的开放标准[J].计算机科学 ,2002.29(10):30-32.

[5]FIPA ContentLanguage Specifications.Foundation for Intelligent Physical Agents, 2003. http://www.fipa.org/repository/cls.php3.

[6]SAKELLARIOUI, KEFALASP, STAMATOPOULOUI.Enhancing NetLogo to simulate BDI communicating agents[M].SETN 2008, LNAI 5138, pp.263–275, 2008.

[7]SAKELLARIOU I.Extending NetLogo to support BDI-like architecture and FIPA ACL-like message passing: Libraries,Manualsand Examples (2008), http://eos.uom.gr/~iliass/projects/NetLogo.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!