This website works better with JavaScript
首页
发现
帮助
登录
junxiaoyao
/
regression2chatgpt
关注
1
点赞
0
派生
0
文件
工单管理
0
合并请求
0
Wiki
目录树:
b8a4744ded
分支列表
标签列表
en
zh
regression2chat...
/
ch12_rl
Gen TANG
5885b61320
finished
2 年之前
..
__init__.py
b8c0675877
start ppo
2 年之前
a2c.ipynb
b8c0675877
start ppo
2 年之前
intuition_model.ipynb
b8c0675877
start ppo
2 年之前
llm_ppo.ipynb
5885b61320
finished
2 年之前
llm_ppo_correct_dropout.ipynb
5885b61320
finished
2 年之前
policy_learning.ipynb
b8c0675877
start ppo
2 年之前
utils.py
b8c0675877
start ppo
2 年之前
value_learning.ipynb
b8c0675877
start ppo
2 年之前