[业界新闻]Google推出Gemini 3.1 Flash TTS文本转语音模型支持近70种语言 [复制链接]

上一主题下一主题查看指定楼层

离线长安一片月

UID: 331538

管理员

发帖: 11512

今日发帖

最后登录: 2026-04-30

只看楼主倒序阅读使用道具楼主发表于: 2026-04-16 10:42:19

　　Google宣布在其Gemini 3.1系列中推出一款全新的文字转语音模型Gemini‑TTS，被官方描述为“至今最富表现力的文本转语音解决方案”。新模型能够生成听感自然、高保真的语音，同时允许开发者通过提示词（prompt）控制语音的情感、节奏和风格，例如在旁白或对话中精确调节语气、停顿与情绪变化。

　　在多语言支持方面，Gemini‑TTS覆盖约70种语言，包括中文（普通话）、英语、西班牙语、德语、日语等主流语言，模型可自动检测输入文本的语种，无须手动标注语言类型即可生成对应语音。这一能力使得开发者和企业可以在有声读物、播客、语音助手、客服机器人、教育应用等场景中，用一套统一的API为全球用户提供多语种语音内容。

　　Google还强调，Gemini‑TTS与Gemini 3.1系列的其他音频模型（如Gemini 3.1 Flash Live）协同，进一步强化了“实时语音体验”的能力。在实时对话、语音翻译及多模态交互中，系统可以在保持低延迟的同时，通过文本提示和音频标记精细控制语音输出，让AI代理在电话、会议、导航等场景下更接近自然的人类语音交互。

离线loevliang

UID: 354112

初级会员

发帖: 79

今日发帖

最后登录: 2026-04-17

只看该作者沙发发表于: 2026-04-16 20:27:27

同一个框架，多加点功能就变成另一个工具，大厂都是向钱看的

发帖回复

返回列表


	关闭您还没有登录，快捷通道只有在登录后才能使用。立即登录还没有帐号？赶紧注册一个


	关闭选中1篇全选

帖子

[业界新闻]Google推出Gemini 3.1 Flash TTS文本转语音模型 支持近70种语言 [复制链接]

[业界新闻]Google推出Gemini 3.1 Flash TTS文本转语音模型支持近70种语言 [复制链接]