品牌方舟获悉,OpenAI推出了新一代AI模型O3-pro,在多个基准测试中表现领先。
O3-pro是OpenAI今年早些时候发布的推理模型o3的升级版本,已全面取代o1-pro,现面向ChatGPT Pro和Team用户开放,企业版与教育版用户将于下周获得使用权限。O3-pro也已在OpenAI开发者API中上线。
与传统AI模型不同,o3系列具备更强的推理能力,能够逐步拆解问题,提升其在物理、数学与编程等复杂领域的可靠性。据OpenAI介绍,O3-pro支持使用搜索网页、分析文件、处理视觉输入、运行Python代码和基于记忆进行个性化回应等多种工具。
不过,O3-pro也存在一些限制。目前,由于技术问题,ChatGPT中的临时聊天功能暂时不可用。模型生成图像的能力尚未开放,Canvas功能亦不支持O3-pro。同时,其响应速度普遍慢于前代o1-pro。
尽管如此,根据 OpenAI 的内部测试,o3-pro 在热门的 AI 基准测试中取得了令人印象深刻的成绩。在评估模型数学技能的 AIME 2024 中,o3-pro 的得分甚至超过了谷歌表现最佳的 AI 模型 Gemini 2.5 Pro。
此外,在 GPQA Diamond(一项针对博士级科学知识的测试)中,o3-pro 还击败了 Anthropic 最近发布的 Claude 4 Opus。
作者✎ Rayna/品牌方舟
声明:此文章版权归品牌方舟所有,未经允许不得转载,如需授权请联系:amz123happy