主要行业
点击进入可选择细分行业
【免责条款】
1. 用户直接或通过各类方式间接使用慧博投研资讯所提供的服务和数据的行为,都将被视作已无条件接受本声明所涉全部内容;若用户对本声明的任何条款有异议,请停止使用慧博投研资讯所提供的全部服务。
2. 用户需知,研报资料由网友上传,所有权归上传网友所有,慧博投研资讯仅提供存放服务,慧博投研资讯不保证资料内容的合法性、正确性、完整性、真实性或品质;
3. 任何单位或个人若认为慧博投研资讯所提供内容可能存在侵犯第三人著作权的情形,应该及时向慧博投研资讯提出书面权利通知,并提供身份证明、权属证明及详细侵权情况证明。慧博投研资讯将遵循"版权保护投诉指引"处理该信息内容;
4.本条款是本站免责条款的附则,其他更多内容详见本站底部《免责声明》;
核心观点
视频大模型近期进展多。http://www.hibor.com.cn【慧博投研资讯】近日,谷歌发布AI大模型Gemini,包括适用于高度复杂任务的Gemini Ultra、适用于各种任务的最佳模型Gemini Pro以及适用于端侧设备的Gemini Nano三个版本。http://www.hibor.com.cn(慧博投研资讯)Gemini Ultra展现出强大的自然语言水平和多模态理解能力,在MMLU(大规模多任务语言理解)测评上首次超过人类专家,在32个多模态基准中取得30个SOTA(当前最优效果);Gemini Pro和Nano版本已发布,加速AI赋能谷歌产品。李飞飞的斯坦福团队同谷歌合作,推出了用于生成逼真视频的扩散模型W.A.L.T。英伟达高级科学家Jim Fan评论:2022年是影像之年,2023是声波之年,而2024是视频之年!
首个原生多模态模型Gemini展示出强大视频理解能力。人工智能的发展从单一视觉或语言任务向多模态自监督学习迈进,而原生多模态大模型具有原生多模态和跨模态理解能力,与既往基于大语言模型的多模态模型存在显著不同。Gemini模型在多模态基准测试上表现突出,展示了处理复杂图像、推理序列和生成交替文本和图像回应等新能力,这些新能力有望为视频分析等领域开启全新应用途径。
原生多模态技术有望打开视频分析行业天花板。视频分析行业目前在数据处理规模、速度和深度等方面存在亟待解决的问题,原生多模态大模型有望解决行业痛点,打开行业天花板。原生多模态大模型可充分利用安防厂商积累的大量多模态视频数据,具有多模态输入的原生处理能力、跨模态推理和理解能力、高级分析推理能力,能提高大规模数据处理的准确性和鲁棒性,易于模型蒸馏和小型化部署,有望推动视频分析系统功能的跨步迭代升级。
领先厂商已入局,多模态模型将是视频监控行业新机遇与挑战。海康威视、大华股份等视频分析行业领先厂商纷纷投入到多模态大模型研究和行业应用落地进程中去。多模态大模型对算力部署、算法改进、硬件升级提出了新的挑战和新的机遇,有望推动视频分析系统功能迭代升级和多维感知技术商业化步伐加快。
投资建议与投资标
我们认为以Gemini为代表的原生多模态大模型有望打开视频分析行业天花板,推动智慧安防和智慧物联产品和解决方案升级,智慧安防和智慧物联行业有望从中受益。建议关注国内智慧安防和智慧物联公司:海康威视、大华股份和萤石网络。
风险提示
原生多模态大模型进展不及预期;下游需求不及预期;行业景气度不及预期。
为了完善报告评分体系,请在看完报告后理性打个分,以便我们以后为您展示更优质的报告。
您也可以对自己点评与评分的报告在“我的云笔记”里进行复盘管理,方便您的研究与思考,培养良好的思维习惯。
正在加载,请稍候...