主要行业

　　视频大模型近期进展多。近日，谷歌发布AI大模型Gemini，包括适用于高度复杂任务的Gemini Ultra、适用于各种任务的最佳模型Gemini Pro以及适用于端侧设备的Gemini Nano三个版本。Gemini Ultra展现出强大的自然语言水平和多模态理解能力，在MMLU（大规模多任务语言理解）测评上首次超过人类专家，在32个多模态基准中取得30个SOTA（当前最优效果）；Gemini Pro和Nano版本已发布，加速AI赋能谷歌产品。李飞飞的斯坦福团队同谷歌合作，推出了用于生成逼真视频的扩散模型W.A.L.T。英伟达高级科学家Jim Fan评论：2022年是影像之年，2023是声波之年，而2024是视频之年！

　　首个原生多模态模型Gemini展示出强大视频理解能力。人工智能的发展从单一视觉或语言任务向多模态自监督学习迈进，而原生多模态大模型具有原生多模态和跨模态理解能力，与既往基于大语言模型的多模态模型存在显著不同。Gemini模型在多模态基准测试上表现突出，展示了处理复杂图像、推理序列和生成交替文本和图像回应等新能力，这些新能力有望为视频分析等领域开启全新应用途径。

　　原生多模态技术有望打开视频分析行业天花板。视频分析行业目前在数据处理规模、速度和深度等方面存在亟待解决的问题，原生多模态大模型有望解决行业痛点，打开行业天花板。原生多模态大模型可充分利用安防厂商积累的大量多模态视频数据，具有多模态输入的原生处理能力、跨模态推理和理解能力、高级分析推理能力，能提高大规模数据处理的准确性和鲁棒性，易于模型蒸馏和小型化部署，有望推动视频分析系统功能的跨步迭代升级。

　　领先厂商已入局，多模态模型将是视频监控行业新机遇与挑战。海康威视、大华股份等视频分析行业领先厂商纷纷投入到多模态大模型研究和行业应用落地进程中去。多模态大模型对算力部署、算法改进、硬件升级提出了新的挑战和新的机遇，有望推动视频分析系统功能迭代升级和多维感知技术商业化步伐加快。

　　投资建议与投资标

　　我们认为以Gemini为代表的原生多模态大模型有望打开视频分析行业天花板，推动智慧安防和智慧物联产品和解决方案升级，智慧安防和智慧物联行业有望从中受益。建议关注国内智慧安防和智慧物联公司：海康威视、大华股份和萤石网络。

　　风险提示

　　原生多模态大模型进展不及预期；下游需求不及预期；行业景气度不及预期。

我要报错

点击浏览报告原文

我要给此报告打分： (带*号为必填)

*我要评分：

当前已有1条点评记录，查看大家的点评记录

主要行业

热门行业

精选研报

东方证券-电子行业动态跟踪：视频大模型快速突破，有望打开视频分析行业天花板-231218