• 热点研报
  • 精选研报
  • 知名分析师
  • 经济数据库
  • 个人中心
  • 用户管理
  • 我的收藏
  • 我要上传
  • 云文档管理
  • 我的云笔记
  • 东方证券-计算机行业动态跟踪:Kimi支持200万字上下文,AI应用有望加速落地-240322

    日期:2024-03-22 16:49:30 研报出处:东方证券
    行业名称:计算机行业
    研报栏目:行业分析 浦俊懿,陈超  (PDF) 13 页 790 KB 分享者:hnjy******011 推荐评级:看好
    请阅读并同意免责条款

    【免责条款】

    1. 用户直接或通过各类方式间接使用慧博投研资讯所提供的服务和数据的行为,都将被视作已无条件接受本声明所涉全部内容;若用户对本声明的任何条款有异议,请停止使用慧博投研资讯所提供的全部服务。

    2. 用户需知,研报资料由网友上传,所有权归上传网友所有,慧博投研资讯仅提供存放服务,慧博投研资讯不保证资料内容的合法性、正确性、完整性、真实性或品质;

    3. 任何单位或个人若认为慧博投研资讯所提供内容可能存在侵犯第三人著作权的情形,应该及时向慧博投研资讯提出书面权利通知,并提供身份证明、权属证明及详细侵权情况证明。慧博投研资讯将遵循"版权保护投诉指引"处理该信息内容;

    4.本条款是本站免责条款的附则,其他更多内容详见本站底部《免责声明》

    研究报告内容
    分享至:      

      核心观点

      3月18日,月之暗面宣布旗下的智能助手Kimi的上下文长度突破到200万字。http://www.hibor.com.cn【慧博投研资讯】2023年10月,月之暗面就发布了支持20万汉字上下文长度的智能助手Kimi,在当时就是全球市场上能产品化使用的大模型服务中最长的。http://www.hibor.com.cn(慧博投研资讯)现在Kimi的能力上限又提升了十倍,达到了国际领先的水平。目前全球最长上下文的模型是谷歌于2023年2月推出的Gemini 1.5 Pro,最极限情况下能够达到1000万token,但是并没有开放使用,日常对外开放的仅有100万token长度。

      上下文技术是大语言模型能力的核心之一,它决定了模型对信息的理解深度和广度。支持更长的上下文长度能够让模型在处理大量信息时都能保持较高的准确性,让模型的应用场景得到进一步拓宽,例如对完整代码库的分析理解、自主完成多步骤复杂任务的智能体Agent、不会遗忘关键信息的终身助理、真正统一架构的多模态模型等。就好比是计算机的RAM,操作系统保留了所有应用程序的实时上下文,由于上下文长度充足,LLM可以像“推理计算机”一样,保留大量用户上下文。

      大模型上下文长度拓展存在“不可能三角”:文本长度、注意力和算力。Transformer架构依赖于自注意力机制来处理输入序列。随着序列长度的增加,自注意力层的计算复杂度呈二次方增长,其中n是序列长度。这意味着对于较长的序列,模型需要进行大量的计算,这也对算力提出了更高的要求,从两个方面共同限制了大模型上下文长度的无限拓展。上下文文本越长,模型越难聚焦充分注意力,难以完整理解用户意图;注意力限制下,短文本无法完整解读复杂信息;处理长文本需要大量算力,从而提高了成本。按GPT-4 Turbo目前API的输入输出价格来计算,要用满128k的长度进行一次输入输出的话,一次问答的价格超过30元。

      随着大模型长文本技术不断深入,AI应用落地的曙光初现。目前业界已经逐步形成共识,即使是千亿参数的大模型也无法完全避免幻觉和胡说八道的问题。相比于短文本,长文本可以通过提供更多上下文信息和细节信息,来辅助模型判断语义,进一步减少歧义,并且基于所提供事实基础上的归纳、推理也更加准确。长文本技术既可以解决大模型诞生初期被诟病的一些问题,增强一些功能,同时也是当前进一步推进产业和应用落地的一环关键技术。随着Kimi率先在国内突破长文本技术,AI相关的应用落地也有望进一步加速。目前月之暗面瞄准的是2C的赛道,未来在2B赛道中长文本能力更有广阔的施展空间。

      算力需求预计也会迎来提升。考虑到Transformer本身架构因素,上下文长度的提升必然会带来算力消耗的提升,即使在业界不断优化的情况下,对于算力的需求仍会有较大程度的增长。随着Kimi带动的长文本技术逐步延展,我们认为各大模型厂商均会逐步开启对于长文本模型的训练和研究,对算力的需求将会进一步提升。

      投资建议与投资标的

      我们认为,大模型上下文长度持续拓展有望加速AI相关应用落地,同时对于算力的需求也会随之大幅提升。

       AI应用:建议关注金山办公(688111,增持)、新致软件(688590,未评级)、科大讯飞(002230,买入)、同花顺(300033,未评级)、彩讯股份(300634,未评级)、上海钢联(300226,增持)等公司

       AI算力:建议关注中科曙光(603019,买入)、海光信息(688041,买入)、寒武纪U(688256,未评级)、云赛智联(600602,未评级)、润泽科技(300442,未评级)、华铁应急(603300,买入)等公司

      其他工具:星环科技-U(688031,未评级)

      风险提示

      技术落地不及预期;政策监管风险

    我要报错
    点击浏览报告原文
    数据加工,数据接口
    我要给此报告打分: (带*号为必填)
    相关阅读
    2024-04-14 行业分析 作者:浦俊懿,陈超 12 页 分享者:m4a****08 看好
    2024-04-09 行业分析 作者:浦俊懿,陈超 4 页 分享者:sunz******eng 看好
    2024-04-07 行业分析 作者:浦俊懿,陈超 12 页 分享者:liu****31 看好
    2024-04-01 行业分析 作者:丁昊,王天一,浦俊懿 30 页 分享者:ext****10 看好
    2024-03-31 行业分析 作者:浦俊懿,陈超 13 页 分享者:123****8s 看好
    关闭
    如果觉得报告不错,扫描二维码可分享给好友哦!
     将此篇报告分享给好友阅读(微信朋友圈,微信好友)
    小提示:分享到朋友圈可获赠积分哦!
    操作方法:打开微信,点击底部“发现”,使用“扫一扫”即可分享到微信朋友圈或发送给微信好友。
    *我要评分:

    为了完善报告评分体系,请在看完报告后理性打个分,以便我们以后为您展示更优质的报告。

    您也可以对自己点评与评分的报告在“我的云笔记”里进行复盘管理,方便您的研究与思考,培养良好的思维习惯。

    当前终端的在线人数: 96292
    温馨提示
    扫一扫,慧博手机终端下载!

    正在加载,请稍候...