研究生学术报告预告登记(开题、中期、答辩)

       为加强研究生学术交流活动,推进学术创新,特开通“研究生学术报告预告区”。我校研究生和教师可以在预告区及时发布和了解有关研究生学术报告的信息,届时参加。也可就某学术报告展开专题讨论与交流。

报告人: 郑玉卿
学号: 1015203058
学院: 电气与自动化工程学院
报告类型: 第一次学术报告
日期: 2016年04月15日
时间: 19:00
地点: 第五会议室
导师: 张国山
题目: Data-based optimal control design with reinforcement learning for continuous-time nonlinear partial differential equation systems
内容提要:

本文研究了无法建立精确数学模型的非线性偏微分方程系统的最优控制问题。首先,利用$Karhunen-Lo\grave{e}ve$分解计算了PDE系统的经验特征函数。利用这些经验特征函数将PDE系统转化为高阶常微分方程。然后,利用奇异摄动定理,用降阶模型逼近高阶系统。在此基础上,建立了基于ODE模型性能优化指标的哈密顿-雅可比-贝尔曼方程。摘要针对哈密顿-雅可比-贝尔曼方程的在线求解,提出了一种基于强化学习方案的策略迭代算法。最后,通过在Burgers-KPP-Fisher系统中的应用,验证了基于数据的最优控制器设计方法的有效性。

图片:
登记人: 郑玉卿
登记时间: 2018年10月29日 星期一 22:13