为加强研究生学术交流活动,推进学术创新,特开通“研究生学术报告预告区”。我校研究生和教师可以在预告区及时发布和了解有关研究生学术报告的信息,届时参加。也可就某学术报告展开专题讨论与交流。
研究了一种基于Q-learning的方法,用来实现在切换拓扑下异构多智能体系统的输出跟踪。由于在现实应用里,异构多智能体系统中的每个智能体之间的通信可能是时变的,所以研究切换拓扑更具有实际意义。实际应用中领导者的动态信息可能不易或不能获取,因此需要先训练一个观测器用于每个智能体对领导者的观测,将训练好的观测器用于所提出的Q-learning算法中而不需要关于多智能体系统动力学的动力学知识,显示了最佳解决方案的收敛性。仿真实例用于验证所提出的控制方案的有效性。