当越来越多的智能机器走入人们的生活,协助我们的工作,如何以物理形态与用户进行自然、直观的交互,是具身交互智能所关注的核心问题。随着人工智能和机器人技术的快速发展,传感器、执行器和计算能力的持续进步,智能系统具备了能够更好地感知环境、理解用户需求,并作出相应回应的基础。本次论坛邀请知名高校及企业的优秀学者汇聚一堂,观点碰撞,探究如何利用具身智能实现自然、高效的交互技术;如何提升感知能力使智能系统能够在复杂环境和任务需求下自主决策、协同工作;如何赋予具身智能系统交互学习能力。
论坛主席
马楠
北京工业大学教授
北京工业大学教授、博士生导师,国家重点研发计划项目负责人,北京工业大学信息科学技术学院副院长,中国人工智能学会副秘书长,BSIG常务理事,北京市智能制造与机器人创新专项负责人,研究方向为交互认知、机器视觉、无人驾驶与移动机器人。以第一完成人先后获得中国图象图形学学会科技进步一等奖、中国电子学会科学技术奖【技术发明类】二等奖,主持多项国家、省部级项目,承担北汽集团、东风悦享、云迹科技等企业委托智能交互项目10项。带领团队多次在国际、国内人工智能、无人驾驶重要比赛中获得冠军,团队成果“无人驾驶云智能交互系统”获得第二届中国“AI+”创新创业大赛总决赛特等奖(2000余参赛队)。已在IEEE TIP、IEEE TNNLS、ICRA、中国科学.信息科学等国内外学术期刊、会议发表论文80余篇。人才培养方面,国家级一流本科课程《智能交互技术》负责人,先后获得第六届全国教育科学研究优秀成果奖二等奖和北京市教学成果一等奖等
刘永进
清华大学长聘教授
清华大学计算机系长聘教授,人机交互与媒体集成研究所所长,国家杰青。主要研究方向为人机交互,情感计算,计算几何与图形学、多模态媒体智能信息处理。近五年发表论文六十余篇,包括7篇PAMI,5篇ACM TOG/SIGGRAPH,22篇TVCG/TIP/TMM/TAFFC/TASE/THMS /TCDS和21篇CVPR/ICCV/ECCV/ AAAI/ICRA。一篇论文入选ESI热点论文,三篇论文入选ESI高被引论文。获得世界华人数学家联盟年度最佳论文奖(2017、2018)在内的十余项国内外知名期刊会议的最佳论文/优秀论文。六项专利进行了成果转化。培养多名博士生和硕士生获得清华大学优秀博士/硕士学位论文,以及北京市和中国图象图形学学会的优秀博士学位论文奖/提名奖,两名博士毕业生获得中国图象图形学学会石青云科学家奖,入选中国科协青年人才托举计划。两次获得中国人工智能学会吴文俊人工智能自然科学奖(2018年一等奖和2021年二等奖),以及2021年度北京市科学技术进步奖二等奖。作为第一完成人获得2022年度中国图象图形学学会高等教育教学成果奖一等奖。
论坛讲者
查红彬教授
北京大学
报告题目:具身智能:身体、行为与环境的紧耦合
报告摘要:具身智能的本质是实现心智与身体、行为、环境的多层次反馈闭环处理,强化智能体与环境的紧耦合。从生态心理学的角度来看,智能体的环境是一个随时间而变化的事件与过程所形成的系统,具有丰富的流动性。生物生存的基本要求是对变化的快速感知与实时反应,人的生存就是感知-行为循环的无限反复,这种对时变环境的强耦合形成了脑的动态处理机理。该报告将站在生态心理学的立场,说明针对具身智能的以下观点:生态环境中动态过程的存在;智能体与环境的相互依存关系(耦合);对环境及其变化的直接感知;作为环境内身体的行为能力及其制约;智能体与环境相互作用的多层次循环。这些观点突出了与数据驱动的大模型预训练范式的对比,也对传统认知科学的研究提出了挑战。
个人简介:查红彬,北京大学智能学院教授,机器感知与智能教育部重点实验室主任。主要从事计算机视觉与智能人机交互的研究,在三维视觉几何计算、三维重建与环境几何建模、传感器即时定位与地图构建等方面取得了一系列成果。出版学术期刊及国际会议论文350多篇,其中包括IEEE T- PAMI,IJCV, IEEE T-VCG, IEEE T-RA等国际期刊以及ICCV, ECCV, CVPR等国际学术会议论文150多篇。
徐凯教授
国防科技大学
报告题目:融合三维感知与多模态大模型的具身智能
报告摘要:视觉感知是机器人探索、感知和理解未知环境的最重要方式。随着三维传感和重建技术的飞速发展,三维图形正与机器人视觉深度融合,形成三维几何引导的具身感知与交互新途径,结合多模态大模型的强大常识推理和任务规划能力,最终支持机器人在三维世界中实现具身智能。本次报告围绕机器人的主动重建,主动理解,以及任务驱动的交互,汇报我们近年来的系列工作。其中,在任务驱动的交互方面,重点介绍在线语义理解驱动的物体目标导航机器人,以及多模态大模型驱动的室内物品整理机器人。最后探讨基于三维感知与交互的世界模型构建与演进,及其对具身智能发展的推动作用。
个人简介:徐凯,国防科技大学教授,国家杰出青年基金获得者。普林斯顿大学访问学者。研究方向为计算机图形学、三维视觉、具身智能、数字孪生等。在国际上较早开展了数据驱动三维感知、建模与交互工作,提出面向复杂三维数据的结构化感知、建模与交互理论方法系统。发表TOG/TPAMI/TVCG等A类论文90余篇,其中图形学顶会SIGGRAPH论文29篇(第一作者10篇)。担任图形领域顶级国际期刊ACM Transactions on Graphics的编委,以及多个领域重要会议的主席。任中国图象图形学会三维视觉专委会副主任、中国工业与应用数学学会几何设计与计算专委会副主任。获湖南省自然科学一等奖2项(排名1和3)、中国计算机学会自然科学一等奖(排名3)、军队科技进步二等奖、军队教学成果二等奖等。
支涛CEO
北京云迹科技股份有限公司
报告题目:AI+具身智能 未来竞争新势力
报告摘要:机器人从上个世纪中发展至今经历了电气时代、数字时代,如今迈入了智能时代。服务机器人从专用单一功能机器人向复合功能机器人走过了10余年的进化之路。随着大模型落地应用场景越来越广泛,服务机器人被以大模型为代表的新一代人工智能赋能,正加速具身化,通用人工智能时代即将来临。从单模态到多模态再到具身智能,作为其载体的“复合多态机器人作”已成为服务机器人领域的先进代表,不仅具备高度的应用价值,更是行业新质生产力的典型产品。随着技术的不断进步和市场的逐渐成熟,复合多态机器人有望在未来发挥更加重要的作用,为服务行业带来深远的影响。
个人简介:曾创建工业机器人公司,曾任两家电子科技公司创始人兼CEO。拥有十余年传感器及自动化工作经验。2014年创立北京云迹科技股份有限公司,专注于商用智能服务机器人技术与场景落地,拥有专利上百件,获吴文俊人工智能科学技术发明奖,中国(行业)十大创新企业家,是机器人行业发展的探索者。
高跃长聘副教授
清华大学
报告题目:超图计算
报告摘要:许多生物、社会和技术系统的复杂性源于系统单元之间丰富性的相互作用。社会交流、化学反应、生命系统到生态系统中相互作用通常发生在三个或更多对象的组中,并不能简单地用二元关系来描述。有效地利用这些高阶关联结构能够增强对各类系统的建模能力,帮助理解和预测其动态行为。超图是建模此类高阶交互、即高阶关联的天然结构。实际应用中通常也面临数据不足和关联复杂难题。本报告主要介绍面向高阶关联的超图计算理论、方法及应用。具体而言,从由数据到高阶关联的映射、由高阶关联到语义表示的映射及高阶关联语义领域泛化三个维度介绍高阶关联的超图结构建模、数据和高阶关联协同的超图语义计算及面向不同领域的超图计算应用相关进展。
个人简介:高跃,清华大学长聘副教授、博士生导师,国家青年特聘专家、DeepTech 2022年中国智能计算科技创新人物。主要研究领域为人工智能、计算机视觉及医学图像处理,提出并发展了超图计算理论及方法,实现了高阶关联的结构建模与计算,有效应对数据不足和信息关联复杂等挑战,应用于视觉目标检测、医学辅助诊断等领域。研究成果在IEEE TPAMI等发表论文百余篇,论文引用万余次,出版《Hypergraph Computation》等英文专著,多次入选科睿唯安高被引科学家和爱思唯尔中国高被引学者,担任International Journal of Computer Vision和Medical Image Analysis等国际重要期刊编委。曾获得中国电子学会自然科学一等奖、福建省科技进步一等奖等。
赵思成副研究员
清华大学
报告题目:开放环境领域自适应
报告摘要:领域自适应旨在实现分布不同的有标注源域和无标注目标域之间的自适应对齐,提升机器学习模型的泛化能力,解决人工智能的最后一公里问题。本报告将介绍课题组近年来在开放环境下面向情感计算、对象检测、语义分割等应用的领域自适应研究,包括单源领域自适应、多源领域自适应与领域泛化等三个方面,并探讨未来可能的研究方向。
个人简介:清华大学副研究员,国家级青年人才,ACM/IEEE/CCF/CSIG高级会员,哈尔滨工业大学博士,加州大学伯克利分校和哥伦比亚大学博士后。研究方向为情感计算、多媒体、机器学习等。发表IEEE/ACM汇刊、CCF推荐A类论文60余篇,谷歌学术引用10000余次,H指数为50。担任中国图象图形学学会CSIG情感计算与理解专委会秘书长、IEEE TIP/IEEE TAFFC/CSIG通讯编委、IEEE TFS/ACM TOMM/IEEE MM等国际期刊的首席客座编辑、NeurIPS/ACM MM/ECCV/AAAI/IJCAI/ICASSP等国际会议的领域主席或资深程序委员。主持或参与国家自然科学基金、国家重点研发计划、CCF-滴滴盖亚学者科研基金等项目。获得CSIG优秀博士论文、ACM SIGMM中国新星奖、媒体建模旗舰会议MMM 2015最佳论文Runner-up奖等奖励,入选AI 2000人工智能全球最具影响力学者榜单和全球前2%顶尖科学家榜单。
马楠教授
北京工业大学
报告题目:无人驾驶具身交互智能
报告摘要:无人驾驶离不开车对车、车对路、车对人之间的交互协同,应具有良好的具身智能。然而实际场景中,人们往往对无人驾驶行为不清楚、对它做出的决策不理解,针对复杂、不确定环境下无人驾驶交互认知缺失问题,近年来团队先后提出一系列人车路协同的无人车智能交互方法,开展多通道跨模态感知智能和行为理解研究,并设计多视数据时空高阶语义关联特征的人机协同动作识别等算法,实现车与人的交互认知。可交互、会学习、自成长是新一代智能机器的硬核,“自主驾驶+交互认知”将使无人车成为可交互的轮式机器人,更好地服务于人类。
个人简介:北京工业大学教授、博士生导师,国家重点研发计划项目负责人,北京工业大学信息科学技术学院副院长,中国人工智能学会副秘书长,BSIG常务理事,北京市智能制造与机器人创新专项负责人,研究方向为交互认知、机器视觉、无人驾驶与移动机器人。以第一完成人先后获得中国图象图形学学会科技进步一等奖、中国电子学会科学技术奖【技术发明类】二等奖,主持多项国家、省部级项目,承担北汽集团、东风悦享、云迹科技等企业委托智能交互项目10项。带领团队多次在国际、国内人工智能、无人驾驶重要比赛中获得冠军,团队成果“无人驾驶云智能交互系统”获得第二届中国“AI+”创新创业大赛总决赛特等奖(2000余参赛队)。已在IEEE TIP、IEEE TNNLS、ICRA、中国科学.信息科学等国内外学术期刊、会议发表论文80余篇。人才培养方面,国家级一流本科课程《智能交互技术》负责人,先后获得第六届全国教育科学研究优秀成果奖二等奖和北京市教学成果一等奖等。
Copyright © 2024 北京图象图形学学会
电 话:010-82525258
邮 箱:igta@bsig.org.cn
网 站:www.igta.org.cn
微 信:BSIG82525258