# 《解构大语言模型:从线性回归到通用人工智能》配套代码 购买地址:[京东](https://item.jd.com/14596264.html) 另外,本书还配套免费的视频课程:[B站](https://space.bilibili.com/417265639/channel/collectiondetail?sid=3138772) 如果大家对本书有赞赏、建议、批评之声,请在[豆瓣](https://book.douban.com/subject/36873291/)上留下你们的看法,再次谢谢大家。 ## 简要说明 对于人工智能的经典模型,第三方开源工具都提供了封装良好的实现,使用它们并不复杂。然而,这些开源工具出于工程化的考虑,在代码中引入了过多的封装和细节,使得理解模型的核心结构变得困难。为帮助读者更好地掌握模型原理,本书特别投入较大精力重新实现了模型的核心部分,并附有详细注释。有时候,用人类的语言描述一些精妙的算法处理需要较大篇幅,而且效果也不尽如人意。相比之下,阅读代码则变得直观清晰。 这份代码依赖于多个第三方库,相关的安装命令已经在相应脚本的开头提供。按照给定的顺序运行这些脚本即可。由于涉及随机数,重新运行可能会得到稍有不同的结果,但整体影响不大。值得注意的是,与大语言模型相关的代码需要在GPU上运行,否则计算时间将显著增加。 ## 内容概述 以ChatGPT为代表的大语言模型可谓是当前人工智能领域的最前沿。要搭建这样复杂的系统并充分理解其中的各个细节,需要全面掌握人工智能领域的诸多内容。通常的学习过程是从基础知识开始,逐步加深难度,掌握复杂概念,并最终到达学科的前沿。然而,这样的学习过程在初期常常让人感到困惑,难以理解每一阶段学习内容对最终目标的作用。 为了更清晰地了解学习路径,我们可以采取逆向思维:如果想要深入理解大语言模型,需要具备怎样的知识体系?下图展示了该体系的核心知识点及其相互依赖关系,而这些也正是本书将要覆盖的内容。