《科创板日报》30日讯,DeepSeek本日于AI开源社区Hugging Face上发布了一个名为DeepSeek-Prover-V2-671B的新模子。据悉,DeepSeek-Prover-V2-671B使用了更高效的safetensors文献步伐,并撑合手多种估计精度,便捷模子更快、更省资源地测验和部署,参数达6710亿,或为前年发布的Prover-V1.5数学模子升级版块。在模子架构上,该模子使用了DeepSeek-V3架构,ag真人百家乐 229622点co接受MoE(羼杂群众)形态,具有61层Transformer层,7168维荫藏层。同期撑合手超长高下文,最大位置镶嵌达16.38万,使其能惩办复杂的数学解说,况兼接受了FP8量化,可通过量化技艺减小模子大小,升迁推理后果。