据路透社 2 月 26 日报道,两位了解情况的消息人士表示,DeepSeek 在即将进行重大模型更新之前,未向美国芯片制造商展示其即将推出的旗舰模型,这打破了行业标准做法。 \bXa&Lq
F9^S"qv$
相反,DeepSeek V4 向国内供应商 —— 包括华为技术有限公司 —— 提供了早期访问权限。
mh%VrAq
a?1Wq
报道提到,AI 开发者通常会将主要模型的预发布版本分享给英伟达和 AMD 等芯片制造商,以确保其软件在广泛使用的硬件上高效运行。DeepSeek 之前曾与英伟达的技术人员密切合作。 *. t^MP
+ {]j]OP
对于其即将推出的模型,DeepSeek 没有向英伟达和 AMD 提供访问权限,而是给予包括华为在内的中国厂商几周的时间来适配其芯片。 5P bW[
kh<2BOV
英伟达和 AMD 拒绝评论。DeepSeek 和华为没有回应评论请求。
(3e2c
jXJyc'm7
消息源 @legit_api 于 2 月 26 日在 X 平台发布推文,报道称 DeepSeek 正在测试 V4 Lite 模型,代号为“Sealion-lite”,上下文窗口为 100 万 tokens,并是原生支持多模态推理。 !WlH'y-I
4+n\k
本月早些时候,DeepSeek 更新之后开始灰度测试最高 1M(百万)Token 的上下文长度与此同时,最新 DeepSeek 的知识库已经更新到 2025 年 5 月,非联网状态下可准确输出 2025 年 4 月的新闻。 @ Qe0! (_=
rv;3~'V
BtZ yn7a