书单推荐
更多
新书推荐
更多

DeepSeek硬核技术解读

DeepSeek硬核技术解读

定  价:99 元

        

  • 作者:刘丹,尹俊希,杨院伶著
  • 出版时间:2025/11/1
  • ISBN:9787111792284
  • 出 版 社:机械工业出版社
  • 中图法分类:TP18 
  • 页码:307页
  • 纸张:
  • 版次:1
  • 开本:24cm
9
7
7
8
9
7
2
1
2
1
8
1
4
全书分为两大部分,第一部分介绍DeepSeek学习的前置知识,包括Transformer架构、强化学习基础、大语言模型量化、大语言模型分布式训练等内容,帮助读者建立扎实的理论基础。第二部分聚焦DeepSeek核心技术,主要介绍MoE架构负载均衡、基础设施层的优化、数据处理、训练逻辑、推理优化等内容。通过本书的学习,读者可以系统地理解DeepSeek的技术原理,并掌握大模型优化的前沿方法。
 你还可能感兴趣
 我要评论
您的姓名   验证码: 图片看不清?点击重新得到验证码
留言内容