主要行业
点击进入可选择细分行业
【免责条款】
1. 用户直接或通过各类方式间接使用慧博投研资讯所提供的服务和数据的行为,都将被视作已无条件接受本声明所涉全部内容;若用户对本声明的任何条款有异议,请停止使用慧博投研资讯所提供的全部服务。
2. 用户需知,研报资料由网友上传,所有权归上传网友所有,慧博投研资讯仅提供存放服务,慧博投研资讯不保证资料内容的合法性、正确性、完整性、真实性或品质;
3. 任何单位或个人若认为慧博投研资讯所提供内容可能存在侵犯第三人著作权的情形,应该及时向慧博投研资讯提出书面权利通知,并提供身份证明、权属证明及详细侵权情况证明。慧博投研资讯将遵循"版权保护投诉指引"处理该信息内容;
4.本条款是本站免责条款的附则,其他更多内容详见本站底部《免责声明》;
多模态:AGI必经之路与商业宏图起点。http://www.hibor.com.cn【慧博投研资讯】(1)多模态是实现通用人工智能的必经之路。http://www.hibor.com.cn(慧博投研资讯)模态数据输入可帮助模型能力和用户体验提高,允许多模态数据输出也更符合真实世界需要。在数据、算法及算力上的要求都要高于单模态,这一波自然语言大模型发展为其他模态提供技术参考,行业有望加速发展。(2)多模态是AI商业宏图起点。多模态大模型有望真正为企业降本增效,且企业可将节省的成本用于提高产品/服务质量或者技术创新,推动生产力进一步提升;C端技术平权下内容创作有望达到一个成本与质量更优的均衡点,或出现新的、空间更大的UGC平台。
多模态大模型的技术脉络与前进方向:(1)视觉模型:数据与算法往往同步发展,大型高质量数据集是模型突破重要基础,而近年视觉算法在泛化性、可提示性、生成质量和稳定性等方面突破将推动技术拐点到来以及爆款应用出现。其中2D图像生成引领视觉模型前进方向,由于2D图像生成是视觉模型中要求相对较低的领域,因此更容易实现技术突破,也出现了midjourney这类爆款应用,其兼顾使用门槛及生成效果,数据飞轮效应开始体现。文生图成本仍有优化空间,其中通用类应用由于需求相对刚性且有较强的付费意愿,盈利领先。3D资产生成、视频生成等领域受益于扩散算法成熟,但数据与算法难点多于图像生成,其中视频生成当前可类比2D图像生成的2021年(已有上亿规模数据集、扩散模型取得突破),且考虑到LLM对AI各领域的加速作用以及已出现较好的开源模型,2024年行业或取得更大的发展。3D资产生成则相对更加早期。(2)听觉模型:数据仍有缺口,23年以来技术有所突破。未来技术成熟后可为企业/内容制造商/娱乐应用提供高性价比的音乐作品,或基于娱乐属性向C端收费。(3)具身智能:相对远期,AI+机器人实现与现实世界交互。
海外技术领先,国内技术与应用同步发展。(1)海外:OPENAI和谷歌在多模态领域布局的广度和技术先进程度上都处于领先地位,且都推出了表现较好的通用多模态大模型。而Stability.ai、midjourney、runway等垂类独角兽也对技术突破和产品创新发挥重要作用。(2)国内:国内数据、算法、算力均有劣势,但海外算法开源有利于国内技术追赶;考虑到中国科技公司在产品运营和迭代方面实力更强,技术与应用有望同步发展。国内大厂及大模型公司均积极布局多模态,有望结合生态优势进行变现;万兴科技、美图等AI视觉应用公司亦有望受益于底层技术进步。
投资建议:我们推荐在多模态方向已有布局或具备布局能力的标的:昆仑万维、万兴科技、美图,建议关注新国都;多模态技术进步利好电商、游戏、教育、营销等领域AI应用发展,推荐焦点科技、中文在线、盛天网络、蓝色光标、凤凰传媒、世纪天鸿等,建议关注掌趣科技等;建议关注受益于AI视频应用发展的多模态技术公司,如虹软科技、当虹科技等;算力方向建议把握板块龙头投资机会,推荐中际旭创等龙头。
风险提示:多模态技术发展不及预期,伦理与隐私问题,商业化拓展不及预期,算力基础设施发展不及预期。
为了完善报告评分体系,请在看完报告后理性打个分,以便我们以后为您展示更优质的报告。
您也可以对自己点评与评分的报告在“我的云笔记”里进行复盘管理,方便您的研究与思考,培养良好的思维习惯。
正在加载,请稍候...