会员
MindSpore大语言模型实战
陈雷编著更新时间:2024-11-14 15:26:31
最新章节:9.7 参考文献开会员,本书免费读 >
随着ChatGPT等大语言模型的迅速发展,大语言模型已经成为人工智能领域发展的快车道,不同领域涌现出各种强大的新模型。开发者想要独立构建、部署符合自身需求的大语言模型,需要理解大语言模型的实现框架和基本原理。本书梳理大语言模型的发展,首先介绍Transformer模型的基本原理、结构和模块及在NLP任务中的应用;然后介绍由只编码(Encoder-Only)到只解码(Decoder-Only)的技术路线发展过程中对应的BERT、GPT等大语言模型;接下来介绍大语言模型在部署、训练、调优过程中涉及的各种关键技术,如自动并行、预训练与微调、RLHF等,并提供相应的实践指导;最后以开源大语言模型BLOOM和LLaMA为样例,介绍其架构和实现过程,帮助读者理解并构建、部署自己的大语言模型。本书还提供了基于MindSpore框架的丰富样例代码。本书适合人工智能、智能科学与技术、计算机科学与技术、电子信息工程、自动化等专业的本科生和研究生阅读,同时也为从事大语言模型相关工作的软件开发工程师和科研人员提供翔实的参考资料。
品牌:人邮图书
上架时间:2024-10-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行
MindSpore大语言模型实战最新章节
查看全部- 9.7 参考文献
- 9.6.5 微调效果
- 9.6.4 启动微调
- 9.6.3 生成集群通信表
- 9.6.2 ckpt转换
- 9.6.1 数据集准备
- 9.6 基于LLaMA模型的微调
- 9.5.2 LLaMA模型结构实现
- 9.5.1 LLaMA模型模块实现
- 9.5 LLaMA模型实现
陈雷编著
主页
同类热门书
最新上架
- 会员
机器学习的算法分析和实践
本书是一本全面介绍机器学习方法特别是算法的新书,适合初学者和有一定基础的读者。机器学习可以分成三大类别,监督式学习、非监督式学习和强化学习。三大类别背后的算法也各有不同。监督式学习使用了数学分析中函数逼近方法、概率统计中的极大似然方法。非监督式学习使用了聚类和贝叶斯算法。强化学习使用了马尔可夫决策过程算法。机器学习背后的数学部分来自概率、统计、数学分析以及线性代数等领域。虽然用到的数学较多,但是最计算机7.4万字 - 会员
GPT图解:大模型是怎样构建的
人工智能(AI),尤其是生成式语言模型和生成式人工智能(AIGC)模型,正以惊人的速度改变着我们的世界。驾驭这股潮流的关键,莫过于探究自然语言处理(NLP)技术的深奥秘境。本书将带领读者踏上一段扣人心弦的探索之旅,让其亲身感受,并动手搭建语言模型。本书主要内容包括N-Gram,词袋模型(BoW),Word2Vec(W2V),神经概率语言模型(NPLM),循环神经网络(RNN),Seq2Seq(S2计算机14万字 - 会员
AI效率手册:从ChatGPT开启高效能
ChatGPT是当下最新、最热门的工具、效率工具,但为什么不同的人使用效果天差地别,整体上来说:一是认知上的不足;二是方法上的不足。这正是本书要解决的问题。本书不仅让读者会用ChatGPT,更尝试让读者意识到自己需要构建一个完整的学习体系,同时本书提供构建这个学习体系的方法。有了这个学习体系,才能真正用好ChatGPT,也不止能用好ChatGPT。读者能够根据自己的需求,用好ChatGPT,既不停计算机22.5万字 - 会员
PyTorch深度学习与企业级项目实战
《PyTorch深度学习与企业级项目实战》立足于具体的企业级项目开发实践,以通俗易懂的方式详细介绍PyTorch深度学习的基础理论以及相关的必要知识,同时以实际动手操作的方式来引导读者入门人工智能深度学习。《PyTorch深度学习与企业级项目实战》共分18章,内容主要包括人工智能、机器学习和深度学习之间的关系,深度学习框架PyTorch2.0的环境搭建,Python数据科学库,深度学习基本原理,计算机10.8万字 - 会员
自动驾驶:人工智能理论与实践
本书参照产业界自动驾驶技术研发的基本流程,充分借鉴了产业界在自动驾驶技术领域中的实际研发经验,以高性能的智能小车和高度仿真的车道沙盘为实验教具和运行环境,深入浅出地讲解自动驾驶技术的原理与实际应用,为初学者打开一扇通往人工智能世界的大门。本书以帮助初学者如何从无到有地打造出具备自动驾驶功能的智能小车为主线,内容分为看车(了解自动驾驶)、造车(设计智能小车)、开车(收集训练数据)、写车(编写自动驾驶计算机14.9万字 - 会员
玩赚ChatGPT:人人都能用的工作好帮手
本书以工作场景和具体任务来驱动,包括53个场景展示、85项任务模拟、237次提问示范,让完全不懂技术的小白,也能成为ChatGPT工具使用方面的行家。本书通过详细讲解具体任务的提问与追问方法,让ChatGPT成为每个人的工作好帮手,帮助人们提升工作效能,打造超能个体与超能团队。计算机13.8万字 - 会员
智能计算系统:从深度学习到大模型
本书由中科院计算所、软件所的专家学者倾心写就,以“图像风格迁移”应用为例,全面介绍智能计算系统的软硬件技术栈。第2版以大模型为牵引进行更新,第1章回顾人工智能、智能计算系统的发展历程,第2、3章在介绍深度学习算法知识的基础上增加了大模型算法的相关知识,第4章介绍深度学习编程框架PyTorch的发展历程、基本概念、编程模型和使用方法,第5章介绍编程框架的工作原理,第6章回顾深度学习所用的处理器结构从计算机34.9万字 - 会员
ChatGPT大模型:技术场景与商业应用
ChatGPT作为人工智能领域的一大进步,引起了热议,其强大功能的背后离不开大模型的支持。大模型指的是参数规模超过千万的机器学习模型,主要应用于语音识别、计算机视觉等领域。本书聚焦大模型,对大模型的技术场景和商业应用展开详细叙述。本书主要从典型应用ChatGPT入手,探寻其背后支撑大模型的魅力。首先,本书对大模型的基础概念、产业格局、带来的新型商业模式进行讲解,展现了大模型的发展现状和商业化潜力。计算机13.2万字 - 会员
大语言模型:原理、应用与优化
这是一本从工程化角度讲解大语言模型的核心技术、构建方法与前沿应用的著作。首先从语言模型的原理和大模型的基础构件入手,详细梳理了大模型技术的发展脉络,深入探讨了大模型预训练与对齐的方法;然后阐明了大模型训练中的算法设计、数据处理和分布式训练的核心原理,展示了这一系统性工程的复杂性与实现路径。除了基座模型的训练方案,本书还涵盖了大模型在各领域的落地应用方法,包括低参数量微调、知识融合、工具使用和自主智计算机12.1万字