> 资讯 > 资讯 >

DeepSeek开年发布新论文:提出全新mHC架构,梁文锋现身作者名单_每日速看

时间:2026-01-01 17:18:57       来源:IT之家


(资料图)

IT之家 1 月 1 日消息,北京时间今天下午,DeepSeek 公布了一篇新论文,提出名为 mHC (流形约束超连接)的新架构。根据介绍,该研究旨在解决传统超连接在大规模模型训练中的不稳定性问题,同时保持其显著的性能增益。

这篇论文的第一作者有三位:Zhenda Xie(解振达)、Yixuan Wei(韦毅轩)、Huanqi Cao。值得一提的是,DeepSeek 创始人兼 CEO 梁文锋也在作者名单之列。

IT之家附摘要部分大意如下:

论文链接

  • Hugging Face:https://huggingface.co/papers/2512.24880
  • Arxiv:https://arxiv.org/abs/2512.24880

关键词: 论文 拓扑 梁文锋 扩展性 mhc 大模型 d