Açıklama Yok

Gen TANG ab9a5f2066 update comment for ch12 2 yıl önce
ch03_linear a75c7456d6 update readme for ch03 2 yıl önce
ch04_logit e6c0e50630 update comment for ch04 2 yıl önce
ch05_econometrics 2d95750b98 update comment for ch05 2 yıl önce
ch06_optimizer 05d6077132 update comment for ch06 2 yıl önce
ch07_autograd e18835b1cd update comment for ch07 2 yıl önce
ch08_mlp 35ba0ddcea update comment for ch09 2 yıl önce
ch09_cnn 35ba0ddcea update comment for ch09 2 yıl önce
ch10_rnn 35f6d19e21 typo in ch10 readme 2 yıl önce
ch11_llm 098ee9208e typo in ch11 2 yıl önce
ch12_rl ab9a5f2066 update comment for ch12 2 yıl önce
ch13_others 5a7ab759c1 ch13 finished 2 yıl önce
.gitignore e18835b1cd update comment for ch07 2 yıl önce
LICENSE 0a9008828e Initial commit 2 yıl önce
README.md 3ee3547600 add readme 2 yıl önce

README.md

《概率之舞:从模型到语言的人工智能征程》配套代码

本书正在编辑之中,不久就会面市。

简要说明

对于人工智能的经典模型,第三方开源工具都提供了封装良好的实现,使用它们并不复杂。然而,这些开源工具出于工程化的考虑,在代码中引入了过多的封装和细节,使得理解模型的核心结构变得困难。为帮助读者更好地掌握模型原理,本书特别投入较大精力重新实现了模型的核心部分,并附有详细注释。有时候,用人类的语言描述一些精妙的算法处理需要较大篇幅,而且效果也不尽如人意。相比之下,阅读代码则变得直观清晰。

这份代码依赖于多个第三方库,相关的安装命令已经在相应脚本的开头提供。按照给定的顺序运行这些脚本即可。由于涉及随机数,重新运行可能会得到稍有不同的结果,但整体影响不大。值得注意的是,与大语言模型相关的代码需要在GPU上运行,否则计算时间将显著增加。

代码目录

- ch03_linear: 线性回归
- ch04_logit: 逻辑回归
- ch05_econometrics: 计量经济学的启示
- ch06_optimizer: 最优化算法
- ch07_autograd: 反向传播
- ch08_mlp: 多层感知器
- ch09_cnn: 卷积神经网络
- ch10_rnn: 循环神经网络
- ch11_llm: 大语言模型
- ch12_rl: 强化学习
- ch13_others: 其他经典模型