▶ 报告简介 ◀
9:10-9:50:面向绿色可靠数据中心的事件驱动的学习与优化方法
报告人:贾庆山,清华大学长聘教授,国家杰青
主持人:赵冬斌研究员
摘要:大型数据中心是当代社会基础设施之一,支撑着工业互联网、电子商务、社交媒体等丰富应用,承担了重要的算力任务,也消耗了大量的能源。Nature论文预测,到2030年全球数据中心的运行能耗将占全社会年运行能耗的8%。研究数据中心的绿色可靠运行具有重要的应用前景,也是具有重大挑战的关键科学问题。本报告分别从数据中心的可靠运行以及节能运行两个方面,介绍本领域的研究现状,并着重介绍事件驱动的学习与优化方法,围绕典型应用案例分析展示新一代人工智能技术在大型数据中心绿色可靠运行中的重大应用潜力。
简历:贾庆山,清华大学长聘教授。主要研究信息物理融合能源系统的优化理论与方法。发表四十篇IEEE汇刊论文。获得2009年国家自然科学奖二等奖、2018年国家自然科学奖二等奖、2020年教育部自然科学奖二等奖,多次获得国际期刊、国际会议最佳论文奖。担任IEEE Internet of Things Activity Board委员、IEEE控制系统协会Board of Governors委员、IEEE控制系统协会北京分会主席、IEEE机器人与自动化协会智能建筑专业委员会副主席、IFAC智慧城市控制专业委员会主席。曾任IEEE控制系统协会离散事件系统专业委员会主席。担任中国自动化学会第十一届控制理论专业委员会委员兼副秘书长,中国自动化学会第一届工业控制系统信息安全专业委员会委员。
9:50-10:30:面向种群的多智能体强化学习算法
报告人:杨耀东,北京大学助理教授
主持人:朱圆恒副研究员
摘要:训练多个强化学习智能体并使其进行博弈是具有挑战性的,主要原因是在求解博弈均衡、例如纳什均衡时不存在多项式解法。在本讲中,我将会介绍在合作博弈以及零和博弈上的最新进展。其中,在合作博弈上,我们研究了基于置信域方法的多智能体强化学习算法。该方法的原理是基于多智能体优势函数分解引理,该引理不需要借助任何假设,例如individual-global-max假设而在合作博弈中普遍成立。在零和博弈中,我会介绍基于policy space response oracle的最新进展。PSRO方法能有效解决零和博弈问题中的非传递性non-transitivity问题,并且为零和博弈的通用求解器提出了理论框架。
简历:杨耀东,博士,现任北京大学人工智能研究院助理教授。在加入北京大学以前,他曾任英国伦敦国王大学计算机系助理教授。科研领域包括强化学习、博弈论和多智能体强化学习,相关的研究成果在国际会议和期刊上发表超过30篇学术论文。杨耀东长期担任ICML、NeurIPS、ICLR、AAAI等机器学习会议程序委员和JMLR、IEEE TNNLS, IEEE Cybernatics受邀审稿人。他的研究工作于2020年获国际机器人学习会议CoRL最佳系统论文奖,2021年获国际多智能体系统会议AAMAS最具前瞻论文奖(bestblue-sky paper)。杨耀东于中国科学技术大学获得学士学位,英国帝国理工大学获得硕士学位,英国伦敦大学学院获得博士学位。
10:30-11:10:数字孪生仿真技术在自动驾驶和智慧交通中的应用
报告人:孙驰天,腾讯自动驾驶仿真技术总监
主持人:张启超副研究员
摘要:数字孪生仿真技术是工业互联网的重要核心技术,充分利用数字孪生仿真技术可以在自动驾驶和智慧交通领域创造巨大的价值。报告首先给出数字孪生仿真技术的重要组成内容。接着给出数字孪生仿真技术在自动驾驶方向上的应用方式和案例。最后给出数字孪生仿真技术在智慧交通领域里提升交通安全性、优化交通效率的应用方式和案例。
简历:孙驰天,腾讯自动驾驶仿真技术总监。交通运输部重点领域创新团队负责人,交通运输部科技专家库专家,中国互联网协会车联网工委会秘书长。本科毕业于清华大学数理基础科学实验班,硕士毕业于美国卡内基梅隆大学。回国前在苹果总部自动驾驶团队(SPG)从事自动驾驶模拟仿真系统的开发,回国后在腾讯自动驾驶部门(TAD)负责模拟仿真和交通数字孪生技术的开发。在腾讯带领团队开发的腾讯自动驾驶模拟仿真系统TAD Sim获2020年世界新能源汽车大会创新技术奖,带领的团队也被交通运输部评选为2020年重点领域创新团队。
11:10-11:50:人像深度伪造与鉴伪的AI对抗前沿技术探讨
报告人:董晶,中科院自动化所副研究员
主持人:陈亚冉副研究员
摘要:在AI技术的加持下,当下多媒体内容深度合成技术已成为机器学习和计算机视觉等领域的逐渐热门的话题之一,近年来已获得广泛关注,随着其相关应用的纷纷落地并被广泛应用,已带来越来越多的个人隐私和数据安全的隐患。本报告重点关注数字人像伪造与鉴伪的AI对抗研究,结合深度合成的实际应用需求,介绍多媒体“伪造”与“鉴别”、“攻击”与“防御”相互博弈和相互促进的独特机制,通过研究深度伪造与鉴伪的机理、机制和线索梳理,展开多媒体伪造与取证应用的相关前沿探讨,并介绍其相关研究的技术进展与发展趋势。
简历:董晶,女,中国科学院自动化研究所副研究员,硕士生导师,IEEE/CSIG高级会员;中国科学院青年创新促进会会员;中国人工智能学会理事;中国图象图形学学会理事、副秘书长、女工委秘书长;北京图象图形学学会常务理事、青工委主任委员;中国图象图形学学会多媒体取证与安全专委会常务委员;中国自动化学会混合智能专委会委员;中国计算机学会计算机视觉专委会委员;IEEE 亚太区执委、人道主义科技活动委员会主席;国际模式识别联合会(IAPR)出版委员会委员、IAPR 《Newsletter》主编,曾获2016年度IBM学院奖、2018年度国际模式识别大会最佳科技论文奖、2019年度中国人工智能学会杰出贡献奖、2020年度CSIG石青云女科学家奖、2021年度CSIG科技奖二等奖(排名第一)。
11:50-12:30:基于深度强化学习的端到端室内导航
报告人:刘麟汗,启元世界机器人项目负责人
主持人:李浩然特别研究助理
摘要:近年来,深度学习算法在室内视觉导航中发展迅速。然而,由于数据驱动需求和实体实验复杂,大部分工作都是在仿真中进行。算法在真实环境中的表现如何亟待评估。另外的契机是,仿真环境在渲染和物理引擎上都和真实世界越来越接近,这为虚实迁移算法的落地提供了数据基础。本报告主要介绍了启元世界室内视觉导航方面的强化学习虚实迁移工作,相关工作均以大幅度领先的成绩获得CVPR2020和CVPR2021相关比赛的冠军。
简历:刘麟汗,清华大学学士、博士,现启元世界机器人项目负责人,主要研究兴趣为强化学习中的虚实迁移、多智能体等。
原文来源自: 微信公众号:深度强化学习 CASIA