• 热点研报
  • 精选研报
  • 知名分析师
  • 经济数据库
  • 个人中心
  • 用户管理
  • 我的收藏
  • 我要上传
  • 云文档管理
  • 我的云笔记
  • 太平洋证券-传媒互联网行业周报:OpenAI o1模型发布,强化学习有望突破Scaling Law瓶颈-240915

    日期:2024-09-19 11:29:03 研报出处:太平洋证券
    行业名称:传媒互联网行业
    研报栏目:行业分析 郑磊  (PDF) 25 页 730 KB 分享者:wat****na 推荐评级:看好
    请阅读并同意免责条款

    【免责条款】

    1. 用户直接或通过各类方式间接使用慧博投研资讯所提供的服务和数据的行为,都将被视作已无条件接受本声明所涉全部内容;若用户对本声明的任何条款有异议,请停止使用慧博投研资讯所提供的全部服务。

    2. 用户需知,研报资料由网友上传,所有权归上传网友所有,慧博投研资讯仅提供存放服务,慧博投研资讯不保证资料内容的合法性、正确性、完整性、真实性或品质;

    3. 任何单位或个人若认为慧博投研资讯所提供内容可能存在侵犯第三人著作权的情形,应该及时向慧博投研资讯提出书面权利通知,并提供身份证明、权属证明及详细侵权情况证明。慧博投研资讯将遵循"版权保护投诉指引"处理该信息内容;

    4.本条款是本站免责条款的附则,其他更多内容详见本站底部《免责声明》

    研究报告内容
    分享至:      

      OpenAI o1新系列模型发布,包括o1预览版和o1-mini

      9月13日OpenAI发布o1新系列模型,即为此前曾透露的草莓模型。http://www.hibor.com.cn【慧博投研资讯】由于相较GPT系列模型,o1系列模型更擅长推理并解决科学、编程、数学领域的复杂问题,因此OpenAI将模型名称重置回数字1,并命名为o1。http://www.hibor.com.cn(慧博投研资讯)o1新系列模型包括o1、o1预览版和o1-mini,此次仅发布了o1预览版和o1-mini,o1上线时间未定。

      通过生成思维链,o1模型具备更强的推理能力

      o1模型是运用强化学习训练的新型语言模型。类比于丹尼尔·卡尼曼提出的人类大脑的两个思考系统,即依赖直觉和经验、快速且无意识的系统1和深思熟虑、谨慎且有意识的系统2,o1模型的发布意味着大模型从运用系统1发展到了运用系统2。表现在使用过程中,即为大模型不再是对问题做出即刻响应,而是先进行一定时间的思考,生成解释推理过程的内部思维链。

      通过思维链,o1模型能对问题做出结构化的思考和推理,而不再像之前通过大量非结构化的文本数据进行模型训练,模型仅能根据上下文内容生成答案。并且通过强化学习,o1模型能不断尝试直到找到正确的解答思路、完善思维链、学会识别和纠正错误等。这一改变极大地提高了模型的推理能力,o1预览版在数学和编程竞赛测试中的得分较GPT-4o提升约5-6倍,o1则提升约8-9倍,在博士级的科学问题测试中,o1预览版和o1均超过了人类专家水平。

      o1模型响应时间更长,使用次数有限

      在使用上,目前o1主要为以文本形式进行问题的分析解答,仍不具备浏览网页信息、上传文件和图像等ChatGPT已有的功能。从官方演示视频来看,o1预览版单次响应时间为32秒,o1-mini为9秒,长于GPT系列。o1预览版和o1-mini已在发布当天逐步向ChatGPTPlus和Team用户开放,但使用次数有所限制,o1预览版每周30条,o1-mini每周50条。并且从下周开始,这两款模型也将向ChatGPT企业版和高校版用户开放。未来OpenAI考虑将o1-mini向所有免费用户开放。在API调用方面,符合条件的开发者可调用o1预览版和o1-mini的API,o1-mini的价格比o1预览版便宜80%。

      强化学习有望突破Scaling Law瓶颈

      OpenAI发现随着强化学习规模(训练时间计算)和思考时长(测试时间计算)的提升,o1模型性能持续提高。这意味着除了增加训练数据数量,模型性能还可通过同时增加推理时长实现提升。ScalingLaw的范式正在向推理环节发展,并且扩展这一方法的限制与此前预训练方法的限制不同,目前仍在继续探索和研究中。我们认为,OpenAI一直是AI技术的先行者,o1模型的发布及强化学习方法的提出有望加速产业内其他公司对该方法的探索,突破Scaling Law的发展瓶颈

      核心观点

      我们认为,目前传媒指数已回落至2023年AI行情起涨点,随o1模型发布及后续强化学习对大模型技术路径发展的突破,有望迎来海外AI产业催化。建议关注:1)AI模型:昆仑万维;2)文字IP:中文在线;3)AI视频工具:上海电影、博纳影业,华策影视、因赛集团;4)AI游戏:掌趣科技、巨人网络等。

      风险提示

      AI技术发展不及预期的风险、政策监管风险、行业竞争加剧的风险。

      

    我要报错
    点击浏览报告原文
    数据加工,数据接口
    我要给此报告打分: (带*号为必填)
    *我要评分:
    暂无评价
    相关阅读
    2024-09-01 行业分析 作者:郑磊 28 页 分享者:Jua****ng 看好
    2024-08-19 行业分析 作者:陈述,崔升远,郑磊 20 页 分享者:250****70
    2024-08-11 行业分析 作者:郑磊 23 页 分享者:nx***n 看好
    关闭
    如果觉得报告不错,扫描二维码可分享给好友哦!
     将此篇报告分享给好友阅读(微信朋友圈,微信好友)
    小提示:分享到朋友圈可获赠积分哦!
    操作方法:打开微信,点击底部“发现”,使用“扫一扫”即可分享到微信朋友圈或发送给微信好友。
    *我要评分:

    为了完善报告评分体系,请在看完报告后理性打个分,以便我们以后为您展示更优质的报告。

    您也可以对自己点评与评分的报告在“我的云笔记”里进行复盘管理,方便您的研究与思考,培养良好的思维习惯。

    当前终端的在线人数: 114992
    温馨提示
    扫一扫,慧博手机终端下载!

    正在加载,请稍候...