和大师的们的思想碰撞 登录 注册
加入支持让我们有继续维护的动力!会员畅享查看所有预告 立即购买

人工智能论坛第76期—— 大模型时代下的开放场景视觉感知与理解


来源:
学校官网

收录时间:
2024-12-06 15:41:51

时间:
2024-12-11 16:00:00

地点:
腾讯会议:744-3448-1313

报告人:
尹军辉

学校:
-/-

关键词:
大模型,视觉感知,开放场景,多模态学习,预训练,零样本泛化

简介:
在当前人工智能领域,大语言模型因其高度通用化和智能化的表现受到社会广泛关注,并逐渐发展成为机器学习领域重要的研究方向。相比于语言模型的快速发展,视觉大模型的研究相对滞后。尽管预训练的视觉大模型借助语言模型的知识表征能力取得了良好的零样本泛化,但在实际模型推理过程中,并不会提供确切的对象类别名称。因此,如何将预训练知识高效快速的迁移到下游各种开放式场景至关重要。本报告聚焦开放场景下视觉大模型提示生成技术的发展现状与趋势,探讨如何构建高效、可解释、泛化能力强的视觉大模型实际应用技术。

-/- 9
报告介绍:
在当前人工智能领域,大语言模型因其高度通用化和智能化的表现受到社会广泛关注,并逐渐发展成为机器学习领域重要的研究方向。相比于语言模型的快速发展,视觉大模型的研究相对滞后。尽管预训练的视觉大模型借助语言模型的知识表征能力取得了良好的零样本泛化,但在实际模型推理过程中,并不会提供确切的对象类别名称。因此,如何将预训练知识高效快速的迁移到下游各种开放式场景至关重要。本报告聚焦开放场景下视觉大模型提示生成技术的发展现状与趋势,探讨如何构建高效、可解释、泛化能力强的视觉大模型实际应用技术。
报告人介绍:
尹军辉,北京邮电大学人工智能学院博士后、新加坡管理大学访问博士后。长期从事多模态学习、视觉感知识别等方向的研究,研究成果在IEEE TIP、PR等国际期刊和会议上发表,主持国家自然科学基金青年项目,曾参与国家杰出青年科学基金、国家优秀青年科学基金、国家重点研发计划等项目。获国家资助博士后研究人员计划,被评为北京邮电大学优秀博士毕业生。

更多讲座报告

邮件提醒 短信提醒

本文节选自学校官网,仅提供聚合查看,所有立场、观点等不代表本站立场。