在上周的Cloud Next大会上,Google宣布Gemini 2.5 Flash模型即将推出,并带来重大改进。今天,Google宣布通过Google AI Studio和Vertex AI在Gemini API中推出Gemini 2.5 Flash预览版。Gemini用户也可以通过模型选择器使用此新模型,并可与Canvas配合使用,轻松优化文档和代码。
tN";o\!}
k[y{&f, 继上一代Gemini 2.0 Flash之后,Gemini 2.5 Flash在推理能力方面进行了显著提升,且成本和延迟均有所降低。Google声称这款新机型拥有卓越的性价比。具体价格如下:
:]=Y1*L\) c<DsCzX 每100万输入词元0.15美元
~=Er=
0 `
n@[=l~ 每100万个输出词元收费0.60美元(无需推理)
$
7O[|:Yv 3=T<c?[ 每100万个输出词元(含推理)收费3.50美元
w v9s{I{P sjWhtd[fgG 这是Flash 2.5的早期版本,但相比Flash 2.0版本,它已展现出巨大的性能提升。
V\!FD5% *z` {$hc 如有需要,您可以完全关闭思考功能,并使用此模型作为Flash 2.0的直接替代品。
-NiFO g0cCw2S 它可在Gemini API、AI Studio、Vertex和Gemini应用中使用!
p
Ic;9 a%Mbq; —Logan Kilpatrick( OfficialLoganK)
FspI[gUN, ]/JE# Gemini 2.5 Flash是Google首款完全混合推理模型,允许开发者选择开启或关闭推理功能。据称,这可以帮助开发者根据目标质量、成本和延迟来优化响应。请查看下方此新模型的基准测试。
f.V0uBDN
7.8ukAud 如上表所示,尽管成本低廉,但与Anthropic和Grok的前沿模型相比,Gemini 2.5 Flash似乎仍不失优势。OpenAI近期发布的o4-mini似乎性能优于Gemini 2.5 Flash预览版,但价格却高得多。
kxThtjgv