• 热点研报
  • 精选研报
  • 知名分析师
  • 经济数据库
  • 个人中心
  • 用户管理
  • 我的收藏
  • 我要上传
  • 云文档管理
  • 我的云笔记
  • 开源证券-通信行业周报:AI模型加速迭代升级,重视AI应用带来产业机遇-240519

    日期:2024-05-19 12:31:39 研报出处:开源证券
    行业名称:通信行业
    研报栏目:行业分析 蒋颖  (PDF) 18 页 1,264 KB 分享者:cha****po 推荐评级:看好
    请阅读并同意免责条款

    【免责条款】

    1. 用户直接或通过各类方式间接使用慧博投研资讯所提供的服务和数据的行为,都将被视作已无条件接受本声明所涉全部内容;若用户对本声明的任何条款有异议,请停止使用慧博投研资讯所提供的全部服务。

    2. 用户需知,研报资料由网友上传,所有权归上传网友所有,慧博投研资讯仅提供存放服务,慧博投研资讯不保证资料内容的合法性、正确性、完整性、真实性或品质;

    3. 任何单位或个人若认为慧博投研资讯所提供内容可能存在侵犯第三人著作权的情形,应该及时向慧博投研资讯提出书面权利通知,并提供身份证明、权属证明及详细侵权情况证明。慧博投研资讯将遵循"版权保护投诉指引"处理该信息内容;

    4.本条款是本站免责条款的附则,其他更多内容详见本站底部《免责声明》

    研究报告内容
    分享至:      

      GPT-4o升级融媒能力,超低延时加速AI应用

      2024年5月14日,OpenAI在首次春季发布会发布新旗舰模型“GPT-4o”。http://www.hibor.com.cn【慧博投研资讯】相较于GPT-4,GPT-4o进一步提升了文本、图像及语音处理能力,具有多项升级:

      (1)多模态交互:GPT-4o是一个多模态大模型,支持文本、音频和图像的任意组合输入,并能生成文本、音频和图像的任意组合输出,具备优秀的多模态交互能力,包括语音、视频,以及屏幕共享。http://www.hibor.com.cn(慧博投研资讯)视觉识别方面:GPT-4o可以识别复杂的视觉内容,帮助进行图像分类、物体检测等任务;音频处理方面:能够处理多重语音输入,进行语音识别和生成;视频分析方面,GPT-4o可以理解和分析视频内容,进行视频摘要和标注。

      (2)超低延时:GPT-4o的响应速度较快快,最短仅需232毫秒,平均为320毫秒,几乎达到了人类在对话中的反应时间。具备超低延时的同时可以实现对话中实时打断AI,增加信息或开启新话题,可以实时识别和理解人类的表情,文字,以及数学公式;交互语音感情丰富,可以变换语音语调、风格,还可以模仿,甚至“即兴”唱歌;并可以在对话中即时翻译多种语言。

      (3)多语言支持:GPT-4o语言处理能力加强,在处理英语和编程语言的文本方面表现与GPT-4 Turbo相当,但在处理非英语语言文本时有显著提升,支持多达20种语言,并能有效减少标记数量,提高处理效率,新的语言标记算法让GPT-4o在多语言环境下更为高效和准确。

      (4)性价比升级:GPT-4o性价比进一步提高,所有ChatGPT用户均可免费使用(有使用上限),速度是GPT-4 Turbo的2倍,API成本低50%,速率限制高5倍。

      谷歌发布新AI搜索引擎,持续强化AI核心地位

      2024年5月15日,谷歌在2024 I/O开发者大会发布多项新AI技术和产品,特别强调了谷歌在AI搜索引擎领域的创新以及其人工智能模型Gemini的多项提升,并展示了AI技术在搜索、图像搜索、工作套件等方面的应用。

      (1)发布新AI搜索引擎:谷歌发布了新的AI搜索引擎,包括多步骤推理能力,可以处理复杂的多条件查询,并支持视频搜索。

      (2)Gemini模型升级:Gemini 1.5 Pro:提供了全球最长的上下文窗口,能够处理高达200万Tokens,支持超过35种语言;Gemini 1.5 Flash:针对需要快速反应的场景推出,提供高速和高效的数据处理能力;Gemini Nano:将于今年晚些时候在Pixel手机上推出,支持端侧运行,处理文本、图像、声音和口语信息。

      (3)新功能和工具:AI旅行规划和数据分析:Gemini将添加新的旅行规划和数据分析功能,提供个性化的建议和见解;Project Astra:一个新的多模态AI项目,能够解释智能手机摄像头捕捉到的物体,并进行交互。

      (4)硬件升级:第六代TPU芯片Trillium:提升了处理能力,将与英伟达的最新GPUBlackwell架构配合使用;液冷系统和光纤网络:谷歌在其数据中心部署了大规模的液冷系统,并投资了大量的光纤网络,以支持其AI和云计算服务。

      (5)AI助手功能:实时语音和视频交互:Gemini支持实时语音和视频交互,为用户提供更自然的通信体验;定制AI助手Gems:与“谷歌全家桶”产品线整合,提供个性化服务。

      风险提示:5G建设不及预期、AI发展不及预期、智能制造发展不及预期、中美贸易摩擦等。

      

    我要报错
    点击浏览报告原文
    数据加工,数据接口
    我要给此报告打分: (带*号为必填)
    *我要评分:
    暂无评价
    关闭
    如果觉得报告不错,扫描二维码可分享给好友哦!
     将此篇报告分享给好友阅读(微信朋友圈,微信好友)
    小提示:分享到朋友圈可获赠积分哦!
    操作方法:打开微信,点击底部“发现”,使用“扫一扫”即可分享到微信朋友圈或发送给微信好友。
    *我要评分:

    为了完善报告评分体系,请在看完报告后理性打个分,以便我们以后为您展示更优质的报告。

    您也可以对自己点评与评分的报告在“我的云笔记”里进行复盘管理,方便您的研究与思考,培养良好的思维习惯。

    当前终端的在线人数: 104029
    温馨提示
    扫一扫,慧博手机终端下载!

    正在加载,请稍候...