暫無描述

Gen TANG 113a06fe50 typo in res net 1 年之前
ch03_linear b5db7b2945 update comment 1 年之前
ch04_logit 2156c1ac35 change color for autograd 1 年之前
ch05_econometrics 2d95750b98 update comment for ch05 2 年之前
ch06_optimizer 05d6077132 update comment for ch06 2 年之前
ch07_autograd c9f95f42ee update font in graph 1 年之前
ch08_mlp c9f95f42ee update font in graph 1 年之前
ch09_cnn 113a06fe50 typo in res net 1 年之前
ch10_rnn c9f95f42ee update font in graph 1 年之前
ch11_llm 098ee9208e typo in ch11 2 年之前
ch12_rl af872ca8ce typo 2 年之前
ch13_others af872ca8ce typo 2 年之前
video e6bd501314 add pdf 1 年之前
.gitignore e18835b1cd update comment for ch07 2 年之前
LICENSE 0a9008828e Initial commit 2 年之前
README.md 7b27253308 fix typo 1 年之前

README.md

《解构大语言模型:从线性回归到通用人工智能》配套代码

购买地址:

如果大家对本书有赞赏、建议、批评之声,请在豆瓣上留下你们的看法,再次谢谢大家。

简要说明

对于人工智能的经典模型,第三方开源工具都提供了封装良好的实现,使用它们并不复杂。然而,这些开源工具出于工程化的考虑,在代码中引入了过多的封装和细节,使得理解模型的核心结构变得困难。为帮助读者更好地掌握模型原理,本书特别投入较大精力重新实现了模型的核心部分,并附有详细注释。有时候,用人类的语言描述一些精妙的算法处理需要较大篇幅,而且效果也不尽如人意。相比之下,阅读代码则变得直观清晰。

这份代码依赖于多个第三方库,相关的安装命令已经在相应脚本的开头提供。按照给定的顺序运行这些脚本即可。由于涉及随机数,重新运行可能会得到稍有不同的结果,但整体影响不大。值得注意的是,与大语言模型相关的代码需要在GPU上运行,否则计算时间将显著增加。

代码目录