在上周的Cloud Next大会上,Google宣布Gemini 2.5 Flash模型即将推出,并带来重大改进。今天,Google宣布通过Google AI Studio和Vertex AI在Gemini API中推出Gemini 2.5 Flash预览版。Gemini用户也可以通过模型选择器使用此新模型,并可与Canvas配合使用,轻松优化文档和代码。
8[v9|r
w8veh[%3n 继上一代Gemini 2.0 Flash之后,Gemini 2.5 Flash在推理能力方面进行了显著提升,且成本和延迟均有所降低。Google声称这款新机型拥有卓越的性价比。具体价格如下:
@G'&7-(h* im,H|u_f4 每100万输入词元0.15美元
@}K|/ 2:[
- 每100万个输出词元收费0.60美元(无需推理)
fG dT2}gd fhwJ 每100万个输出词元(含推理)收费3.50美元
SfTTB'9 &BOq%*+ 这是Flash 2.5的早期版本,但相比Flash 2.0版本,它已展现出巨大的性能提升。
n <,:;0{ dlv1liSXL5 如有需要,您可以完全关闭思考功能,并使用此模型作为Flash 2.0的直接替代品。
?58,Ja I}^Q u0ub 它可在Gemini API、AI Studio、Vertex和Gemini应用中使用!
"kb[}r4? WR|n> i@m —Logan Kilpatrick( OfficialLoganK)
kz!CxI ( U~CG(9 Gemini 2.5 Flash是Google首款完全混合推理模型,允许开发者选择开启或关闭推理功能。据称,这可以帮助开发者根据目标质量、成本和延迟来优化响应。请查看下方此新模型的基准测试。
DjLSl,Z
C\`*_t 如上表所示,尽管成本低廉,但与Anthropic和Grok的前沿模型相比,Gemini 2.5 Flash似乎仍不失优势。OpenAI近期发布的o4-mini似乎性能优于Gemini 2.5 Flash预览版,但价格却高得多。
U3t$h