《DeepSeek图解:大模型是怎样构建的》(订购)
张治政 薛栋 公鑫 著
北京大学出版社
本书是一本系统讲解DeepSeek开发的技术指南,传授大家开发DeepSeek模型的基础知识。旨在帮助读者深入理解DeepSeek的工作机制,并掌握其在大规模预训练、推理优化及应用开发中的关键技术。
全书共10章,依次介绍文本预处理、特征提取、文本分类与情感分析、语言的生成、机器翻译、DeepSeek的核心Transformer模型、多模态模型的架构和训练、预训练模型的训练与微调、DeepSeek API应用开发实战,以及基于DeepSeek实现的仿Manus Agent系统。
本书不仅适合对大模型感兴趣的技术人员阅读,也适合人工智能研究者、开发者及行业从业者等阅读。
来源:北京大学出版社