计算机科学2005V01.32N9.1 动态不确定环境下的决策:一种分层决策模型¨ 杨洋陈小平
(中国科学技术大学计算机系多智能体系统实验室合肥230027) 摘要本文提出一种智能体分层决策结构模型,试图通过分层决策技术有效地解决动态、不确定环境中的智能体的实时决策问题。本模型的高层采用BDI结构,以便为较长期任务的规划和推理提供充分的支持;模型的底层采用反应式结构,以保证对短期实时任务的及时响应。实验结果表明了这种分层模型在某些复杂任务领域中的有效性。关键词智能主体,动态不确定环境,信念一愿望一意图(BDI),RoboCup
Making
DecisionunderReal—Time,UnpredictedEnvironments:a
Multi-LayerModel YANGYang
CHENXiao—Ping
(Multi—AgentSystemLab.CSDept.ofUniv.ofSci.&Tech.ofChina,Hefei230027)
Abstract
Thispaperdescribes our
workindeveloping an
agentarchitecturebased ona
multi-layermodelwhichwill help
tOsolvethe
problemofrealtimedecision—makingindynamic,unpredictedenvironments.Thehighlevelsofthis
architecture use BDI model tO
support
long—termplanningandreasoningwhile use
reactive
modelinthelowerlevel which ensures thesystem toreact
timelyinreal—timeenvironments.Experimentsshowthatsucha
multi—layerarchi— tecture
iseffectiveinsomecomplicatedreal—timedomains.
Keywords
Intelligentagent,Dynamicunpredictedenvironment,Belief-desire—intention(BDI),RoboCup
1 引言
本文第2节介绍模型的整体体系结构;第3和第4节给出模型中两大层次的内部具体实现;第5节给出在RoboCup仿真随着信息自动化科技发展,各种硬、软自主机器人的应用
机器人足球比赛试验平台上的实验结果;最后是总结和未来领域正在不断扩大,从而对机器人的能力提出了越来越高的工作展望。
要求。一方面,自主机器人的应用环境正由传统的静态、确定环境向实时动态、不确定的环境转化;另一方面,随着任务复2智能体体系结构模型
杂程度的提高,单个机器人往往难以独立完成任务,需要多个长期以来,大量的研究工作都致力于构建于可用于真实机器人协调合作共同完成任务。因此,面向动态不确定环境机器人的规划推理系统。早期的SHAKEY机器人的研究工的多主体系统的研究已经引起了国内外学术界的高度重视。
作表明拍],现实世界中大量的动态不确定性或不可预测因素智能体设计者所面临的一个主要问题是如何使智能体在对于机器人设计者提出了重大的技术挑战。传统的知识表示动态、不确定的环境中对系统环境的发展变化及时地做出合和推理模型在提供了良好的推理规划机制和目标驱动的行为理的决策。对于多主体系统而言,如何使智能体与同伴进行协模式的同时,由于未考虑计算资源限制,存在实时性较差的缺调合作从而有效地完成任务,也是设计者所应重点关心的同陷,而且也不够灵活。和传统的规划推理系统不同,另一种称题。在这样的应用领域中,传统的搜索和规划方法往往需要比为Subsumption模型的体系结构则完全抛弃了知识表示和推较长的时间,很难满足实时性的需求;并且实时环境中不断发理规划o’8】。该模型通过简单、底级动作的组合来实现复杂的生的突发事件容易造成系统不断的重新规划,导致整个决策行为模式。与传统的推理规划系统相比,尽管Subsumption模系统产生抖动。因此需要设计一种新的决策模型来满足实践型缺乏对于中长期目标的处理能力,但却展现了良好的在实的需要。
时环境下的快速反应能力。
本文提出一种分层决策的智能体决策体系结构模型,试
最近的研究工作表明[9】,在动态、不确定环境中,尤其是图通过分层决策技术有效地解决上述问题,较好地满足动态
存在多主体的情况下,智能体需要具备中长期规划的能力以不确定环境中的应用要求。在该模型结构中,我们把智能体的作出尽可能合理的决策;但同时又存在很多任务,要求智能体
决策模型分为两大层次:一个层次处理那些对实时性要求不能够及时迅速地作出反应而并不需要太复杂的思考。对于这高,但却对智能体的行为具有方向性指导作用的慎思式推理样的领域,将上述两种模型的优点结合来,构建出分层次的混和规划任务。在这个层次中,我们主要采用一个层次处理实时
和式模型,是一个值得探讨的方向。
性要求很强,但所需处理的问题相对比较局部、简单的实时性
为了将两种模型的优点结合起来,我们采用分层式的决任务。本文将主要围绕在RoboCup仿真机器人足球比赛“’5]策技术。其基本原理是根据决策粒度将决策过程化分为若干这个试验平台上如何利用BDI模型构建智能体的慎思决策层次,每个层次在不同抽象粒度上处理决策问题。层与层之间模型来介绍我们的工作。
有机结合的关键是“愿望”(Desires)。在我们的模型中,愿望定 *)本文得到国家自然科学基金(60275024)和863计划(200LAA4222)支持.
万
方数据?151?
义为智能体所期待达到的状态,也就是智能体的任务。愿望既可以是外部的环境状态,也可以是系统内部的状态。比如说智能体可能会期望把球踢到某个位置,也可能希望了解自己现在还没有获取到的一些信息。需要指出的是,在同一时刻,智能体可能同时拥有多个不同的愿望,它也没有必要一定要完成每个愿望。它可以