主要行业

　　Sora在视频生成和模拟能力实现重大突破。基于通用视觉数据的模型Sora具有强大的功能，具体来看：1）视频生成和处理能力：生成长达1分钟的视频，远超此前Pika的7秒、Runaway Gen2的18秒，视频画面的表现和构图效果更佳。并且，生成视频具有3D一致性，即可生成具有动态摄像机运动的视频，随着摄像机的移动和旋转，人物和场景元素在3D空间中保持一致移动。2）图像生成能力：生成不同大小、分辨率最高可达2048x2048像素的图片。3）模拟能力：在3D空间中模拟人类、动物、自然环境的特征，生成视频符合物理世界的规则。并且还能模拟数字世界、生成程序游戏。

　　Sora采用Transformer架构，并用patches作为训练和预测的基本单位。1）数据处理：类比于大语言模型将各种文本统一为tokens，Sora将不同的视频和图片等视觉数据压缩在低维潜空间中，将其分解为统一的patches，以此作为视频大模型训练和预测的基本单位。2）计算架构：Sora采用的是duffision transformer架构，即基于transformer编码器-解码器的架构，对经过增加噪点处理的patches进行编码，再通过解码器逐步还原出原始patches的预测。随着训练数据的增加，样本质量将显著提升。

　　不仅是多模态，Sora为世界模型的实现奠定基础。我们认为，此次文生视频模型Sora的发布是OpenAI继文字、图像之后，在内容生成领域的又一突破。同时，其强大的视频生成和模拟能力标志着AI技术在多模态领域实现重大突破。该模型强大的功能有望进一步优化内容创作者的视频制作流程，促进优质内容生产。并且，模型所具备的模拟物理世界和数字世界的能力或将加快世界模型的实现进程，推动游戏开发、虚拟现实等领域的发展

　　回顾AI多模态模型的发展：1）Runaway Gen-2：23年2月，Runaway发布其文生视频模型Gen-1，3月发布升级后的Gen-2，随后进行了持续更新，提升视频的清晰度、保真度和一致性。目前最长可生成18秒的视频，较Pika生成视频的动作幅度更大，画质和稳定性更高。2）Pika：23年11月，Pika Labs发布具备使用文本生成和编辑多种风格视频的功能Pika 1.0。目前可生成视频长度为3秒，通过延长功能可增加至7秒，较Runaway Gen-2拥有更精准的语义理解，生成视频的连贯性更高。3）谷歌Gemini：23年12月，谷歌Gemini1.0版原生多模态大模型正式上线。24年2月，其升级版Gemini 1.5Pro发布，实现了上下文窗口容量的大幅提升，提高了对图片、音视频等多模态信息的理解和推理能力。对比Pika、Runaway以及Sora在同一段提示词下生成视频的表现，Sora生成视频的光影和色彩更真实，对提示词的理解更精准，并且能在时长更长的视频场景中保持更好的动作和画面的一致性。随着Sora的发布，AI多模态技术取得的突破正加速技术奇点到来，未来商业化空间有望进一步打开。

　　内容资产价值面临重估，关注价值重估下的两大投资主线我们认为，AI多模态技术的出现，将各种内容形式与多种智能处理算法相结合，可实现不同内容形式间的相互转化。按形式进行划分，内容资产可分为文字、图片、音视频、游戏四大类。展望未来，随着多模态技术不断突破，文字、图片、音视频、游戏内容间的转化门槛将逐步降低，AI辅助内容生成的比例将逐渐提升，长期来看AI生成有望占据主导地位。内容资产有望迎来价值重估，建议关注内容资产以及生成内容资产的AI工具两条投资主线：

　　1）内容资产：

　　首推最低维的内容形式即文字类内容，且拥有内容数量多及质量高的公司弹性最大。文字作为最低维的内容被升维空间最大，有望全面受益于内容资产价值重估，而网络文学的娱乐性最强，因此其商业化空间最大。从目前上市公司的储备情况来看，中文在线已累积数字内容资源超550万种，网络原创驻站作者450余万名；掌阅科技积累的数字内容资源丰富，品类众多，包括图书、有声读物、杂志、漫画、自出版等多种类型，累计签约作者数万名；果麦文化积累了包含四千多种经典图书的数据库，其中已开发或正在开发的近千种。

　　图片、音视频和游戏类资产也需要关注。1）图片类资产主要包括视觉内容和形象IP，如视觉中国拥有海量高质量内容，包括超过4亿的摄影、矢量图、视频、音乐等视觉内容；上海电影旗下的IP全产业链开发运营平台上影元文化运营了众多动画IP及真人影视版权；奥飞娱乐拥有数量众多、知名度广泛的动漫IP资源。2）音视频类资产主要包括动漫、影视作品，如华策影视拥有规模化、系列化的头部爆款影视作品矩阵；光线传媒拥有大量优质电影、电视剧、动画作品；捷成股份携手国内外千余家出品公司，积累了5万余小时的影视、动漫、节目版权内容。3）游戏类资产，如恺英网络已获得“龙族”、“倚天屠龙记”、“仙剑奇侠传”、“盗墓笔记”、“斗罗大陆”等知名IP，成功推出《新倚天屠龙记》等产品。

　　2） AI内容生产工具：

　　生成高维内容资产的生产工具价值更高。1）AI视频工具：该领域海外公司表现更为突出，如Runaway的Gen-1和Gen-2、Pika Labs的Pika 1.0、以及OpenAI最新发布的Sora。此外，国内公司也有相应的布局，如诗云科技具备声音克隆和生成AI数字人功能的在线视频生成平台HeyGen；蓝色光标全资子公司蓝色宇宙发布的在线AI视频生成平台蓝标分身，可降低音视频的制作难度。2）AI音频工具：盛天网络推出具备AI歌声进化功能的音乐社交App给麦，该功能能识别并抓取用户的个性化音色，让用户实现对多语种、不同风格音乐的演唱；腾讯音乐推出启明星AI音色魔法师产品，用户可授权AI用个人声音合成新歌曲；Meta推出AI声音生成模型Audiobox，实现根据文字或音频生成音频的功能。3）AI游戏工具：掌趣科技发布AI游戏引擎LayaAir 3.1版本，通过模糊语音指令可实现数字资产的创建和细节调整，助力高度复杂的游戏开发；巨人网络专注于游戏业务的垂类AI大模型GiantGPT完成备案。

　　其他内容资产生产工具也值得关注。1）AI文字工具：中文在线推出辅助创作的中文“逍遥”万字创作大模型；果麦文化向上海星图比特投资1500万元，委托其开发AI文本校对中的SaaS软件和算法系统。2）AI图片工具：海外公司推出了表现出色的图片模型，如OpenAI的DELL·E3、Stable Diffusion模型、Midjourney基于扩散过程的生成模型。此外，国内拥有相关布局的公司包括视觉中国旗下VCG.com网站推出AI智能搜索功能（Beta版），用户可用“关键词”、“自然语言”、“以图搜图”的方式搜索图片；浙文互联推出AI绘画应用米画，帮助创作者快速生产数字艺术作品；美图推出AI视觉大模型Miracle Vision，利用AI技术对图像进行分析和处理，实现各种图像处理和生成任务；

　　核心观点：

　　我们认为，AI多模态技术突破将降低文字、图片、音视频、游戏内容间相互转化的门槛，提高AI工具辅助内容生成的比例，内容资产价值有望实现重估。建议关注内容资产价值重估下的两条投资主线：1）内容资产首推最低维的文字类内容，且拥有内容数量多及质量高的公司弹性最大；2）AI内容生成工具首推生成高维内容资产的工具。推荐关注标的：1）内容资产：文字IP：中文在线，掌阅科技形象IP：上海电影，奥飞娱乐；图片：视觉中国；音视频：华策影视，光线传媒，捷成股份；2）AI内容生成工具：AI视频工具：蓝色光标；AI音频工具：盛天网络；AI游戏工具：恺英网络、三七互娱、吉比特、巨人网络、掌趣科技、电魂网络；AI文字工具：果麦文化；AI图片：浙文互联。

　　风险提示：

　　AI技术发展不及预期风险；政策监管风险；行业竞争加剧风险。

我要报错

点击浏览报告原文

我要给此报告打分： (带*号为必填)

*我要评分：

暂无评价

主要行业

热门行业

精选研报

太平洋证券-传媒互联网行业：Sora横空出世，关注内容资产价值重估下的两条投资主线-240218