Yima Gu's Blog
  • 首页
  • 归档
  • 分类
  • 标签
  • 关于

The Era of Experience

Deep Dive: OaK Architecture & The Era of Experience Speaker: Richard Sutton (Father of Reinforcement Learning) Core Theme: Next-Gen Agent Architecture: OaK (Options and Knowledge) Key Quote: “Wha
2025-12-01
Talks > AI
#AI Talks #Reinforcement Learning #OaK Architecture #Richard Sutton

AI Agent Notes

AI Agent:人类只给AI目标,AI自己想办法完成某个研究问题。 整个图示清晰地展现了强化学习的核心循环:智能体观察环境的状态 (棋盘布局),基于其策略和目标 (赢棋) 来选择一个行动 (下一步棋),该行动改变了环境的状态,然后智能体又观察到新的状态,如此循环往复,直到游戏结束分出胜负。 通过这种方式,AI的目标(图中的“赢棋”)被转化成了一个数学问题:如何选择一系列的行动(下棋),来最大化
2025-07-20
Deep Learning
#DeepLearning #AI #李宏毅机器学习

搜索

Hexo Fluid
总访问量 次 总访客数 人