科技媒体engadget今天(11月11日)发布博文,报道称博通(Broadcom)携手AI公司CAMB.AI,将合作开发一款新型AI芯片组,能够在设备端直接处理实时音频翻译。 /A+5q\8G
B.!&z-)#
这项合作旨在将翻译、配音和口述影像等复杂任务从云端转移至本地设备(如电视、智能音箱等)的SoC(片上系统)中完成,从而摆脱对网络连接的依赖。 X3][C
1SH]$V4C
注:口述影像(Audio Description)是一项专为视力障碍人士提供的辅助功能。它通过语音解说,描述视频画面中正在发生的人物动作、场景变化、屏幕文字等视觉信息,帮助视力障碍人士更好地理解内容。 ,4=mlte"
BC5R$W.e
官方表示该技术方案具备两大核心优势:首先是隐私保护,用户的音频数据无需上传至云端服务器,有效避免了潜在的隐私泄露风险。其次是性能表现,该芯片将支持超150种语言,本地处理可实现超低延迟,确保翻译和配音的实时性,同时大幅减少对无线网络带宽的占用。 /([a%,DI
,g4T>7`&U%
为展示技术能力,两家公司发布了一段基于电影《美食总动员》片段的演示视频。视频中,AI系统能够用多种语言实时生成并播报场景描述,同时在屏幕上显示文字翻译。 ,J=l Hj
:9e4(7~ona
这项口述影像功能对于视力障碍用户极具价值,能极大地提升他们获取视频信息的可访问性。该技术所采用的语音模型已被NASCAR、康卡斯特(Comcast)等知名机构使用。 F&lH5
W*?qOq
{
该芯片组技术目前仍处于测试阶段,距离正式商用于消费电子产品还需一段时间。不过,这项技术一旦成熟,有望为智能电视、机顶盒及各类物联网设备带来颠覆性的多语言交互体验。 )3O#T$h