• 热点研报
  • 精选研报
  • 知名分析师
  • 经济数据库
  • 个人中心
  • 用户管理
  • 我的收藏
  • 我要上传
  • 云文档管理
  • 我的云笔记
  • 国投证券-计算机行业周报:Llama3发布,开源大模型能力进一步提升-240422

    日期:2024-04-22 12:55:52 研报出处:国投证券
    行业名称:计算机行业
    研报栏目:行业分析 赵阳,夏瀛韬  (PDF) 16 页 636 KB 分享者:lisi******ove 推荐评级:领先大市-A
    请阅读并同意免责条款

    【免责条款】

    1. 用户直接或通过各类方式间接使用慧博投研资讯所提供的服务和数据的行为,都将被视作已无条件接受本声明所涉全部内容;若用户对本声明的任何条款有异议,请停止使用慧博投研资讯所提供的全部服务。

    2. 用户需知,研报资料由网友上传,所有权归上传网友所有,慧博投研资讯仅提供存放服务,慧博投研资讯不保证资料内容的合法性、正确性、完整性、真实性或品质;

    3. 任何单位或个人若认为慧博投研资讯所提供内容可能存在侵犯第三人著作权的情形,应该及时向慧博投研资讯提出书面权利通知,并提供身份证明、权属证明及详细侵权情况证明。慧博投研资讯将遵循"版权保护投诉指引"处理该信息内容;

    4.本条款是本站免责条款的附则,其他更多内容详见本站底部《免责声明》

    研究报告内容
    分享至:      

      Llama 3发布,提升开源大模型能力

      上周四,Meta正式发布了人们等待已久的开源大模型Llama3。http://www.hibor.com.cn【慧博投研资讯】Meta表示,Llama3在多个关键的基准测试中性能优于业界先进同类模型,其在代码生成等任务上实现了全面领先,能够进行复杂的推理,可以更遵循指令,能够可视化想法并解决很多微妙的问题。http://www.hibor.com.cn(慧博投研资讯)

      Llama3的主要亮点包括:基于超过15T token训练,相当于Llama 2数据集的7倍还多;支持8K长文本,改进的tokenizer具有128Ktoken的词汇量,可实现更好的性能;在大量重要基准中均具有最先进性能;新能力包括增强的推理和代码能力;训练效率比Llama 2高3倍;带有Llama Guard 2、Code Shield和CyberSec Eval2的新版信任和安全工具。8B和70B版本Llama 3模型已用于Meta AI助手,同时也面向开发者进行了开源,包括预训练和微调版本。

      Llama3在训练数据集上有明显提升:Llama 3使用超过15T的token进行了预训练,这些token都是从公开来源收集的。总体上讲,Llama3的训练数据集是Llama 2使用的数据集的七倍多,并且包含四倍多的代码。为了为即将到来的多语言用例做好准备,超过5%的Llama3预训练数据集由涵盖30多种语言的高质量非英语数据组成。

      Llama3在预训练阶段也有更多改善:在Llama3的开发过程中,Meta对扩展行为进行了一些新的观察。例如,虽然8B参数模型的Chinchilla最佳训练计算量对应约200B token,但Meta发现在对多达15T token进行训练后,8B和70B参数的模型都继续以对数线性的方式提升性能。Llama3预训练是在H100-80GB类型的硬件(TDP为700W)上累计770万个GPU小时的计算。Meta还极大地改进了硬件可靠性和静默数据损坏检测机制,并且开发了新的可扩展存储系统,以减少检查点和回滚的开销。这些改进使总体有效训练时间超过95%,使Llama3的训练效率比Llama2提高了约三倍。

      展望未来,最大的Llama3参数将超过400B,目前仍在训练中,但在接下来的几个月中陆续发布,新功能包括多模态、多语言对话能力、更长的上下文窗口以及更强的整体能力。

      开源大模型追赶GPT-4,利好算力和应用产业推进

      伴随Llama3的发布,开源大模型在能力上将进一步追赶GPT-4的能力,从而带来AI应用的繁荣,同时也将推升训练和推理侧的算力需求。我们认为AI依然是科技产业未来的重要主线之一,当前模型能力和算力需求还没有达到瓶颈,仍可继续关注产业的未来进展。建议关注:AI算力:浪潮信息、工业富联、软通动力、润泽科技等;AI应用:金山办公、科大讯飞、万兴科技、美图公司、佳发教育、彩讯股份等。

      风险提示:

      1)宏观经济变化影响企业信息化支出;2)财政与货币政策低于预期;3)供应链波动加大,影响科技产业发展。

    我要报错
    点击浏览报告原文
    数据加工,数据接口
    我要给此报告打分: (带*号为必填)
    相关阅读
    2024-05-06 行业分析 作者:赵阳,夏瀛韬 13 页 分享者:car****27 领先大市-A
    2024-04-29 行业分析 作者:赵阳,夏瀛韬 17 页 分享者:BeD****gE 领先大市-A
    2024-04-15 行业分析 作者:赵阳,夏瀛韬 14 页 分享者:规**好 领先大市-A
    2024-04-08 行业分析 作者:赵阳,袁子翔 11 页 分享者:1868******296 领先大市-A
    2024-04-01 行业分析 作者:赵阳 18 页 分享者:gsp****s3 领先大市
    关闭
    如果觉得报告不错,扫描二维码可分享给好友哦!
     将此篇报告分享给好友阅读(微信朋友圈,微信好友)
    小提示:分享到朋友圈可获赠积分哦!
    操作方法:打开微信,点击底部“发现”,使用“扫一扫”即可分享到微信朋友圈或发送给微信好友。
    *我要评分:

    为了完善报告评分体系,请在看完报告后理性打个分,以便我们以后为您展示更优质的报告。

    您也可以对自己点评与评分的报告在“我的云笔记”里进行复盘管理,方便您的研究与思考,培养良好的思维习惯。

    当前终端的在线人数: 75727
    温馨提示
    扫一扫,慧博手机终端下载!

    正在加载,请稍候...