多模态视觉内容生成是融合人工智能、计算机视觉与跨模态交互理论的核心前沿领域。以大模型技术为代表的创新方法,为多模态视觉内容生成提供了高效可控、跨域融合、低资源适配的解决方案,推动了内容生产、工业设计、自动驾驶、虚拟现实等领域的技术革新与产业落地。一方面,多模态视觉内容生成已成为计算机视觉与 AI 领域的核心研究方向,其技术突破直接引领生成式 AI 的应用升级;另一方面,该技术与数字经济、智能制造、元宇宙建设等国家战略需求深度契合,是解决内容生产效率低、跨模态协同难、场景适配性差等关键问题的重要手段。本论坛报告将围绕多模态视觉内容生成的核心技术与前沿应用,邀请领域内顶尖专家学者分享最新研究成果与未来发展方向。