主要行业

　　多模态：AGI必经之路与商业宏图起点。（1）多模态是实现通用人工智能的必经之路。模态数据输入可帮助模型能力和用户体验提高，允许多模态数据输出也更符合真实世界需要。在数据、算法及算力上的要求都要高于单模态，这一波自然语言大模型发展为其他模态提供技术参考，行业有望加速发展。（2）多模态是AI商业宏图起点。多模态大模型有望真正为企业降本增效，且企业可将节省的成本用于提高产品/服务质量或者技术创新，推动生产力进一步提升；C端技术平权下内容创作有望达到一个成本与质量更优的均衡点，或出现新的、空间更大的UGC平台。

　　多模态大模型的技术脉络与前进方向：（1）视觉模型：数据与算法往往同步发展，大型高质量数据集是模型突破重要基础，而近年视觉算法在泛化性、可提示性、生成质量和稳定性等方面突破将推动技术拐点到来以及爆款应用出现。其中2D图像生成引领视觉模型前进方向，由于2D图像生成是视觉模型中要求相对较低的领域，因此更容易实现技术突破，也出现了midjourney这类爆款应用，其兼顾使用门槛及生成效果，数据飞轮效应开始体现。文生图成本仍有优化空间，其中通用类应用由于需求相对刚性且有较强的付费意愿，盈利领先。3D资产生成、视频生成等领域受益于扩散算法成熟，但数据与算法难点多于图像生成，其中视频生成当前可类比2D图像生成的2021年（已有上亿规模数据集、扩散模型取得突破），且考虑到LLM对AI各领域的加速作用以及已出现较好的开源模型，2024年行业或取得更大的发展。3D资产生成则相对更加早期。（2）听觉模型：数据仍有缺口，23年以来技术有所突破。未来技术成熟后可为企业/内容制造商/娱乐应用提供高性价比的音乐作品，或基于娱乐属性向C端收费。（3）具身智能：相对远期，AI+机器人实现与现实世界交互。

　　海外技术领先，国内技术与应用同步发展。（1）海外：OPENAI和谷歌在多模态领域布局的广度和技术先进程度上都处于领先地位，且都推出了表现较好的通用多模态大模型。而Stability.ai、midjourney、runway等垂类独角兽也对技术突破和产品创新发挥重要作用。（2）国内：国内数据、算法、算力均有劣势，但海外算法开源有利于国内技术追赶；考虑到中国科技公司在产品运营和迭代方面实力更强，技术与应用有望同步发展。国内大厂及大模型公司均积极布局多模态，有望结合生态优势进行变现；万兴科技、美图等AI视觉应用公司亦有望受益于底层技术进步。

　　投资建议：我们推荐在多模态方向已有布局或具备布局能力的标的：昆仑万维、万兴科技、美图，建议关注新国都；多模态技术进步利好电商、游戏、教育、营销等领域AI应用发展，推荐焦点科技、中文在线、盛天网络、蓝色光标、凤凰传媒、世纪天鸿等，建议关注掌趣科技等；建议关注受益于AI视频应用发展的多模态技术公司，如虹软科技、当虹科技等；算力方向建议把握板块龙头投资机会，推荐中际旭创等龙头。

　　风险提示：多模态技术发展不及预期，伦理与隐私问题，商业化拓展不及预期，算力基础设施发展不及预期。

我要报错

点击浏览报告原文

我要给此报告打分： (带*号为必填)

*我要评分：

当前已有13条点评记录，查看大家的点评记录

主要行业

热门行业

精选研报

东吴证券-互联网传媒行业深度报告：多模态技术加速，AI商业宏图正启-231218