书单推荐 新书推荐 |
DeepSeek硬核技术解读
全书分为两大部分,第一部分介绍DeepSeek学习的前置知识,包括Transformer架构、强化学习基础、大语言模型量化、大语言模型分布式训练等内容,帮助读者建立扎实的理论基础。第二部分聚焦DeepSeek核心技术,主要介绍MoE架构负载均衡、基础设施层的优化、数据处理、训练逻辑、推理优化等内容。通过本书的学习,读者可以系统地理解DeepSeek的技术原理,并掌握大模型优化的前沿方法。
你还可能感兴趣
我要评论
|