• 热点研报
  • 精选研报
  • 知名分析师
  • 经济数据库
  • 个人中心
  • 用户管理
  • 我的收藏
  • 我要上传
  • 云文档管理
  • 我的云笔记
  • 国海证券-海外人工智能行业动态研究:Anthropic发布Claude3家族,整体性能超越GPT~4-240305

    日期:2024-03-06 14:07:14 研报出处:国海证券
    行业名称:人工智能行业
    研报栏目:行业分析 陈梦竹  (PDF) 4 页 421 KB 分享者:gj***m 推荐评级:推荐
    请阅读并同意免责条款

    【免责条款】

    1. 用户直接或通过各类方式间接使用慧博投研资讯所提供的服务和数据的行为,都将被视作已无条件接受本声明所涉全部内容;若用户对本声明的任何条款有异议,请停止使用慧博投研资讯所提供的全部服务。

    2. 用户需知,研报资料由网友上传,所有权归上传网友所有,慧博投研资讯仅提供存放服务,慧博投研资讯不保证资料内容的合法性、正确性、完整性、真实性或品质;

    3. 任何单位或个人若认为慧博投研资讯所提供内容可能存在侵犯第三人著作权的情形,应该及时向慧博投研资讯提出书面权利通知,并提供身份证明、权属证明及详细侵权情况证明。慧博投研资讯将遵循"版权保护投诉指引"处理该信息内容;

    4.本条款是本站免责条款的附则,其他更多内容详见本站底部《免责声明》

    研究报告内容
    分享至:      

      事件:

      2024年3月4日,OpenAI的主要竞争对手之一Anthropic推出了最新的Claude 3大模型,包含性能由弱到强的Haiku、Sonnet和Opus三种型号。http://www.hibor.com.cn【慧博投研资讯】Anthropic由OpenAI前高管创立,投资者包括谷歌、Salesforce、亚马逊、高通等科技巨头,截至模型发布,其估值已超过150亿美元。http://www.hibor.com.cn(慧博投研资讯)

      投资要点:

      Claude 3相较于竞品及前代的优势:①Haiku是市场上同类智能模型中速度最快且最具成本效益的。而对于绝大多数工作负载,Sonnet的速度比Claude 2和Claude 2.1快2倍,且智能水平更高。Opus作为最智能的模型,在人工智能系统的大多数常见评估基准上都优于同行。所有Claude 3模型都显示出在分析和预测、细致内容创建、代码生成以及西班牙语、日语和法语等非英语语言对话方面的增强能力;②Claude 3具有与其他领先型号相当的复杂视觉功能,甚至在图表问答类测试中以0-shot CoT超越了GPT-4V的4-shot CoT;③Claude 3减少了常见于前代产品的对用户请求的拒绝,这主要是因为Claude 3增强了对语义的理解能力;④Claude 3提高了答案的准确性。幻觉问题一直是各大模型的通病,Anthropic将答案分为正确答案、错误答案(幻觉)和承认不确定性,通过让模型对不知道的问题直接承认不会而非给出错误答案来尽可能减少这类问题;⑤继Gemini 1.5之后,Claude 3的三个版本都能支持100万tokens的上下文,为目前市场上在这一领域的领先者。

      使用与定价:Opus和Sonnet已经推出,目前可以在Anthropic的API中使用,Sonnet正在为claude.ai提供免费体验,Opus可供Claude Pro订阅者使用。此外,Sonnet现已通过Amazon Bedrock提供,并在Google Cloud的Vertex AIModel Garden上提供私人预览版;Haiku即将推出。①Opus:输入$15/100万tokens,输出$75/100万tokens;②Sonnet:输入$3/100万tokens,输出$15/100万tokens;③Haiku:输入$0.25/100万tokens,输出$1.25/100万tokens。

      大模型发展走向分化:在通用大模型领域,同时推出不同尺寸分别适用于云/端/边缘的版本或已成为各厂商的共识,我们认为其背后反映着AI在不同场景下对智能与成本权衡后的选择。本次Anthropic发布的Claude 3家族包含性能由弱到强的Haiku、Sonnet和Opus三个版本,允许用户为其特定应用选择智能、速度和成本的最佳平衡。这一操作非常类似于此先谷歌发布Gemini 1.0时的举措,Gemini1.0同样包含性能由弱到强(体现在尺寸)的Nano、Pro和Ultra三个版本。

      我们认为文本和图像或已成为通用大模型两个必备的基础模态。目前以GPT-4、Gemini 1.0和Claude等为代表的通用大模型均已实现至少对文本和图像两类任务的支持,后续可能还会有诸如视频及3D资产类模态的加入。

      我们认为Claude 3对幻觉问题的处理方式可能成为或已成为行业共识,即如何平衡模型过度保守(拒绝回答某些问题)和正确回答问题而非“不懂装懂”的两种倾向。

      这一代产品保持了Claude模型在上下文长度的优势,在上下文窗口增长的同时保证模型的一致性是当前大模型领域的难点之一,我们认为Claude 3针对这一问题的优化也具有一定的“示范”意义。为了有效处理长上下文提示,模型需要强大的记忆能力,“大海捞针”(Needle In AHaystack,NIAK)这一基准评估了模型从大量数据中准确回忆信息的能力。Anthropic通过在每个提示中使用30对随机的“针/问题”对之一,并在多样化的众包文档语料库上进行测试来增强这一基准的稳健性。Claude 3不仅展现出近乎完美的回忆能力,还能识别出“针”句子似乎是被人为插入到原始文本中的,指出了评估本身的局限性。

      行业评级与投资建议

      大模型迭代仍在持续,我们维持行业“推荐”评级,建议关注算力板块,如NVIDIA、AMD、超微电脑等标的;通用或专用大模型厂商,如微软、Google、Amazon、Adobe、美图、焦点科技等标的;积极布局端侧AI的终端设备厂商,如联想集团、Dell等标的。

      风险提示

      AIGC发展不及预期风险、行业竞争加剧风险、用户流失风险、政策监管风险、反垄断风险、商业化拓展不及预期风险、内容质量不佳风险等、各公司并不具备完全可比性,对标的相关资料和数据仅供参考

    我要报错
    点击浏览报告原文
    数据加工,数据接口
    我要给此报告打分: (带*号为必填)
    *我要评分:
    暂无评价
    相关阅读
    2023-12-25 行业分析 作者:陈梦竹,尹芮 8 页 分享者:海森***5 推荐
    2023-12-20 行业分析 作者:陈梦竹 32 页 分享者:pig****iu 推荐
    2023-11-02 行业分析 作者:陈梦竹,尹芮 73 页 分享者:dou****25 推荐
    2023-08-18 行业分析 作者:杨仁文,姚蕾,陈梦竹 88 页 分享者:gary******011 推荐(首次)
    2023-05-07 行业分析 作者:陈梦竹 11 页 分享者:zce****15 推荐
    关闭
    如果觉得报告不错,扫描二维码可分享给好友哦!
     将此篇报告分享给好友阅读(微信朋友圈,微信好友)
    小提示:分享到朋友圈可获赠积分哦!
    操作方法:打开微信,点击底部“发现”,使用“扫一扫”即可分享到微信朋友圈或发送给微信好友。
    *我要评分:

    为了完善报告评分体系,请在看完报告后理性打个分,以便我们以后为您展示更优质的报告。

    您也可以对自己点评与评分的报告在“我的云笔记”里进行复盘管理,方便您的研究与思考,培养良好的思维习惯。

    当前终端的在线人数: 79440
    温馨提示
    扫一扫,慧博手机终端下载!

    正在加载,请稍候...