为加强研究生学术交流活动,推进学术创新,特开通“研究生学术报告预告区”。我校研究生和教师可以在预告区及时发布和了解有关研究生学术报告的信息,届时参加。也可就某学术报告展开专题讨论与交流。
在生物界、人类社会,都大量存在群体形为,比如鸟群的编队飞行、蜂群的筑巢、鱼群集体觅食、共同抵御入侵者等。人们很早就对这些现象开始研究,从社会智能的角度,“智能体”的概念被提出,指每个“个体”都只会做简单的事情,但用特定方法将这些个体组成一个群体时,就产生了真正的智能。多智能体系统即这样的结构相似的“智能体”构成的系统。一致性问题是多智能体系统协作控制中的典型问题之一,实际上也是根本性问题,此次汇报给出了一种基于策略迭代的Q-learning算法,用来实现离散多智能体系统中各个智能体与领导者的状态一致性。实际应用中智能体的模型信息可能不易或不能获取,而Q-learning算法不需要关于多智能体系统动力学的动力学知识,只需要系统数据,显示了最佳解决方案的收敛性。仿真实例用于验证所提出的控制方案的有效性。