主要行业
点击进入可选择细分行业
【免责条款】
1. 用户直接或通过各类方式间接使用慧博投研资讯所提供的服务和数据的行为,都将被视作已无条件接受本声明所涉全部内容;若用户对本声明的任何条款有异议,请停止使用慧博投研资讯所提供的全部服务。
2. 用户需知,研报资料由网友上传,所有权归上传网友所有,慧博投研资讯仅提供存放服务,慧博投研资讯不保证资料内容的合法性、正确性、完整性、真实性或品质;
3. 任何单位或个人若认为慧博投研资讯所提供内容可能存在侵犯第三人著作权的情形,应该及时向慧博投研资讯提出书面权利通知,并提供身份证明、权属证明及详细侵权情况证明。慧博投研资讯将遵循"版权保护投诉指引"处理该信息内容;
4.本条款是本站免责条款的附则,其他更多内容详见本站底部《免责声明》;
事件
据财联社报道,北京时间周二(5月14日)凌晨,美国人工智能研究公司OpenAI在线上举办了“春季更新”活动。http://www.hibor.com.cn【慧博投研资讯】OpenAI在活动中发布了新旗舰模型“GPT-4o”,“可以实时对音频、视觉和文本进行推理。http://www.hibor.com.cn(慧博投研资讯)”据介绍,新模型使ChatGPT能够处理50种不同的语言,同时提高了速度和质量。GPT-4o的“o”代表“omni”。该词意为“全能”。
据华尔街见闻介绍,GPT-4o升级的功能有
1)融媒能力:GPT-4o同时具备文本、图片、视频、音频多方面的能力,即可以接受任何文本、音频等形式及其组合的输入,并生成同样媒介形式的回答。
2)速度更快:GPT-4o的速度是上一代的5倍,语音延迟大幅改善,可以在232毫秒内回应音频输入,平均为320毫秒,接近人类对话的反应时间。这意味用户可以和GPT-4o实时对话、甚至直接打视频让Ta在线解答各种问题。
3)免费开放:发布会即日起,GPT-4o将面向ChatGPT的所有付费和免费用户发布,取消其他所有限制,API价格降价50%。
GPT-4o是迈向更自然人机交互的一步,它可以接受文本、音频和图像三者组合作为输入,并生成文本、音频和图像的任意组合输出。
核心观点
我们认为,此次GPT-4o的推出是AI多模态的重大进步,智能终端可以感知客户的语音语调呼吸等状态来与客户进行交互,也可以通过摄像头识别外部图片进行分析,使得人机交互变的更智能流畅。而随着端侧大模型的推进,智能交互技术开始落地,使得用户体验得到极大提升。随着技术的迭代,端侧AI有望实现快速应用。
投资建议
建议关注:金山办公、科大讯飞、软通动力等。
风险提示
AI技术发展不及预期,端侧AI推进不及预期,国产大模型发展不及预期。
为了完善报告评分体系,请在看完报告后理性打个分,以便我们以后为您展示更优质的报告。
您也可以对自己点评与评分的报告在“我的云笔记”里进行复盘管理,方便您的研究与思考,培养良好的思维习惯。
正在加载,请稍候...