中国AI初创公司DeepSeek于周三上午通过微信宣布,其在开发者平台Hugging Face上发布了其R1推理AI模型的更新版本。 +w+qTZyky
)%9P ;/
根据DeepSeek的微信公告,更新后的R1版本采用宽松的MIT许可证,这意味着它可以用于商业用途,这是一个“小”升级。 }"AGX
^BQ*l5K
Hugging Face代码库不包含该模型的描述,只有配置文件和权重,即指导模型行为的内部组件。 Sv03="&
~f]I0FK
升级版R1的参数量高达6850亿,规模相当庞大,如果不进行修改,该模型很可能无法在消费级硬件上运行。 ZTP&*+d
VTxLBFK;
今年早些时候,DeepSeek发布R1模型后声名鹊起,其模型与OpenAI的模型形成了鲜明对比。但这家初创公司也引发了美国一些监管机构的关注,他们认为DeepSeek的技术构成了国家安全风险。 u6BLhyS