【话题】DeepSeek的核心优势是什么?

DeepSeek的核心优势是什么?

ds性能优势:

  • mha-》mla;
  • 特殊的moe路由逻辑;
  • 预推理技术

ds核心突破:

  • 不需要sft过程直接通过RL引导出llm的推理能力,有点类似于之前llm发现通过少量stf实现问答能力的aha时刻;
  • 开源