OpenAI推出了o3-pro,该公司声称这是迄今为止功能最强大的AI模型。O3-pro是OpenAI o3的一个增强版本,o3是该公司今年早些时候推出的推理模型。与传统的人工智能模型不同,推理模型会逐步解决问题,从而使其在物理、数学和编程等领域的表现更加可靠。
^TT_BAI
$1n\jN O3-pro将于周二起面向ChatGPT Pro和Team用户开放,取代o1-pro版本。OpenAI表示,企业版和教育版用户将于下周上线。O3-pro也将于今天下午在OpenAI开发者API中上线。
8aI^vP"7`= DI=?{A O3-pro的API定价为每百万输入词元20美元,每百万输出词元80美元。输入词元是输入到模型中的词元,而输出词元是模型根据输入词元生成的词元。
~8Ez K_c 2U) 0k* 一百万个词元相当于大约750000个单词,比《战争与和平》稍长一些。
CK8!7=>}^ +THK
Jn!> OpenAI在更新日志中写道:“在专家评估中,评论者在所有测试类别中始终更倾向于o3-pro,尤其是在科学、教育、编程、商业和写作帮助等关键领域。评论者还在清晰度、全面性、指令遵循性和准确性方面对o3-pro的评分始终更高。”
}^azj>p5 is`~C 据OpenAI称,O3-pro可以使用一些工具,使其能够搜索网页、分析文件、推理视觉输入、使用Python、利用内存个性化响应等等。OpenAI表示,O3-pro的一个缺点是,其响应通常比o1-pro需要更长的时间才能完成。
Xj$'i/=-+c Q1P=A:*]9 O3-pro还有其他限制。OpenAI表示,ChatGPT中的临时聊天功能暂时被禁用,因为OpenAI正在解决一个“技术问题”。O3-pro无法生成图像。此外,OpenAI的AI工作区功能Canvas也不支持o3-pro。
Wux[h8G
w~>tpkUB 值得一提的是,根据OpenAI的内部测试,o3-pro在热门的AI基准测试中取得了令人印象深刻的成绩。在评估模型数学能力的AIME 2024测试中,o3-pro的得分甚至超过了Google表现最佳的AI模型Gemini 2.5 Pro。
gaR~K