最近,在南京大学人工智能学院,一场特殊的面试正在进行。13个大学生角逐5个名额,参加即将举行的“2023腾讯开悟多智能体强化学习全国高校公开赛”。未来几个月,他们有充足的时间开展多智能体强化学习,理解越深的学生,将会越受青睐。
在专业学科圈内,这项竞赛被简称为“开悟AI大赛”,目前已举办三届。参赛者们“以赛代研”,研发游戏AI,进行王者荣耀对抗赛。通过多轮次的对战、迭代,以研发出更好更强的AI智能体。
(资料图片)
这些重视体现了这场比赛的分量。对于高校,腾讯的开悟大赛和开悟平台是难得的对于AI人才的实训机会。在算法研究过程中,高校面临缺乏真实数据与硬件基础的痛点,是中国AI人才培养的掣肘,他们希望选出那些对多智能体强化学习有坚定科研意向的学生。
10的20000次方种可能
学生们的热情响应 ,和AI目前的火热互相呼应。南京大学人工智能学院副教授赵一铮认为,ChatGPT的热度,让普通民众突然意识到AI这个东西其实离生活非常近,它不只停留在企业级应用,而是可以解决很多细小的生活中的问题,因此引发了全民对AI技术本身的兴趣和追逐。
AI对数据要求量极大,否则无法达到人类正确识别的程度。针对这个问题,产学研各界都开始发力追赶。已经举办三届的开悟比赛的举办也正是怀抱类似动机,因为游戏是绝佳的AI实验场。腾讯开悟平台,恰好能为中国自主知识产权的人工智能底层技术研究、人工智能应用场景拓展,提供助力和支持。
一局游戏中,预计有高达10的20000次方种操作可能性,而整个宇宙原子总数也只是10的80次方。海量数据需要计算,搭建算力平台需要大量GPU。依托于王者荣耀和腾讯AI Lab在算法、算力方面的核心优势,“腾讯开悟”向学术研究人员和算法开发者开放。
“能把实验室里学到的东西搬出实验室,走进实际的大型项目来说,是一个非常难得的机会。”中国科学技术大学博士赵鉴是游戏爱好者。在第一届比赛时,看到比赛能提供稀缺算力,又能把兴趣跟研究方向相结合,他毫不犹豫地就报名了。在那届比赛中,他的团队取得了第一名。以往,他在实验室里接触到的都是小型化的理想实验环境,但通过比赛,能够获得落地的、复杂,大型的实验环境,“开悟平台提供的海量算力,是以往在实验室环境是很难提供的,供我们去频繁试错,创新,尝试一些新的算法。”赵鉴说。
在他的示范效应下,这两三年,中科大的学生踊跃参赛。去年,中科大跟腾讯合作开办了机器博弈课程,正是借助游戏平台以及开悟平台的底层能力。这门课程教导学生智能决策强化学习的知识,并最终要求他们在开悟平台上搭建一个能够实现对战的AI。学生报名踊跃,由于开放的资源有限,课程限制30人,但报名的人数远超预期。直到现在,还有很多学生询问今年会不会继续开设这一课程。
赵鉴认为,学生本身对游戏有很大的兴趣,而通过游戏能够学习到人工智能的前沿技术,更容易激发他们的开发热情和学习兴趣。
过去一年,开悟在高校开设的课程也出现了很多新变化。今年,开悟课程逐渐扩面,覆盖至19所高校、超20个班级的学生;参与王者AI相关课程的学习的学生累计超630名;北大还将开设二百多位学生参与的大班教学。未来三年,这个项目计划争取支持到全国更多高校开设人工智能相关课程,并开展全国师资培训,帮助AI高校教育的普及和能力提升。
升级AI人才培养解决方案:更普惠,更好用
游戏AI课程的受欢迎,也是因为开悟平台提供了便捷开发的环境,它的分布式强化学习的框架,可以有效帮助学生实现各类的强化学习的决策AI,对学习和科研都有很大帮助。
第一次参赛时,赵鉴就为开悟开发平台完善的功能和便捷的开发环境而惊喜。因为国外的一些游戏AI,可能是一个几百人团队用1-2年时间实现的。当时他先是担心3-5人的规模单打独斗,可能很难在1-2个月内完成一个成熟的游戏AI。
但在比赛过程中,基于便捷的工具箱,团队只要开发跟强化学习算法框架相关的代码即可。在拿到第一届冠军后,很多同学向他了解比赛的信息。此后两年,他以教练员的身份,协助学弟学妹组成的“后浪队”参加比赛。
过去两年间,“腾讯开悟”在高校的知名度越来越高。今年的开悟比赛由邀请制改为公开赛。早在自己参赛时,他就体会到了开悟平台提供的完备支持。在技术文档里,学生们可以为遇到的大部分问题找到解决方案;项目组还提供了一个QA平台,由工作人员及时提供耐心细致的解答。开悟平台上还有录像回放、天梯榜的功能,能帮助参赛学生及时做复盘分析。
为了让这个科研助手更便捷和普惠,今年,腾讯开悟平台也将进行平台优化,将客户端版本调整为web版本;并拓展新的迷宫地图,相比传统的峡谷PVP地图,使用将更加简单。
便捷的工具及厚实的基底,让学生们在过程中可以将全部精力更多的投入于算法创新。初次参赛的3-5人的学生团队,在1—2月时间内就创造出属于他们的王者AI,“给我们带来很大的成就感”。
赵一铮预期,由ChatGPT所引发的热潮将持续推动大学人工智能专业的报考人数稳步增长。这对于学校开设更多的人工智能专业课程、扩充师资队伍以及提升教学质量,都构成了积极的挑战。
在学院的课程设置中,多智能体强化学习是人工智能领域的热门研究方向,相关课程也是学院的重点课程,吸引了大量的学生参与。赵一铮特别强调,引入开悟平台后,课程的吸引力进一步提升。开悟平台让学生能够将课堂上学习的理论知识及时转化为实践,这种切身感受的反馈,对于人工智能人才的培养起到了积极的推动作用。以往,大学教学中往往缺乏这样能提供强大算力、持久数据和实际业务场景的平台。
这也是赵一铮与其他同事精心选拔学生参加比赛的原因:比赛是最生动的教学和科研场景,比赛中的直接反馈更具震撼力,这种参与感对学生来说是极大的鼓舞。
AI产业发展有了三条“新纽带”
中科院自动化所博士何金岷发现,目前不论是ChatGPT的大语言模型,还是自动驾驶等决策大模型,用大模型来求解问题,越发成为AI产学研的风潮,各大高校以及研究所对于AI人才的投入将越来越多。王者荣耀的游戏场景提供了仿真的实验场,为新技术的快速迁移、落地及产业化充当桥梁,对于AI研究很有意义。
赵鉴也认为,将来的科研成果要走出实验室,应用到产业或者实际任务中,在游戏中的技术验证能提供很大的帮助。在现实中,一个机器人如果因为发生碰撞被损坏,就无法继续实验。在游戏环境中率先实现人工智能算法,是更切实的路径,可以减少在现实场景中所需要的训练时间及成本。
以“教育+竞赛+科研”的共生发展模式推动AI产业生态的建设,成为AI产业发展的三条“新纽带”。
第一条纽带中,“开悟”连接了行业里的人,建立与人才之间的联系,助力产学研生态建设。第二个纽带,连接科研共同体,交融碰撞,助力科研突破。第三条纽带,建立与产业伙伴的连接,助力探寻更多产业应用新场景。第三条建立在前两条基础上,它是远景,也是全行业的期望:让游戏科技推动教育产业升级。
产学研联盟的构建也将进一步加速新应用、新技术的落地,加快创新型人才的培养。开悟平台的研究成果还将与更多行业有机结合,沉淀更多创新型算法,为医疗、制造、无人驾驶、农业、智慧城市等领域带来更深远影响。
目前,开悟平台与西南交大合作的智慧交通项目正处在实验阶段,预计今年下半年进入校内场景测试。
基于这些阶段性成果的展出,可以想象:以开悟平台为代表,腾讯在AI+游戏上的研究,也将成为攻克AI终极研究难题,探索通用人工智能的关键一步。
赵一铮认为,国家十分重视AI人才的培养,预计未来会有更多的高等教育机构开设AI相关专业。而对于AI人才的培养,必须在产学研的协同中实现。另一方面,开悟平台将学生培养与实际企业业务紧密联系起来,既能利用其强大的计算能力帮助人才培养,也能推动企业产品和服务的升级和强化。
据他介绍,在学校每年组织的课程评分和匿名反馈时,企业有经验的工程师的实操课程,评分往往最高。甚至有很多学生说大学生涯帮助最大、影响最大的一门课程,来自业界导师,“因为他们不仅仅是把培养或者育人的目光仅仅停留在理论和课本上,而是会直接带着同学们参与到企业级的实操项目上去”。对于未来的AI高等教育,这是值得借鉴和更深入推广的合作模式。(雷渺鑫)
标签: