The Era of Experience Deep Dive: OaK Architecture & The Era of Experience Speaker: Richard Sutton (Father of Reinforcement Learning) Core Theme: Next-Gen Agent Architecture: OaK (Options and Knowledge) Key Quote: “Wha 2025-12-01 Talks > AI #AI Talks #Reinforcement Learning #OaK Architecture #Richard Sutton
AI Agent Notes AI Agent:人类只给AI目标,AI自己想办法完成某个研究问题。 整个图示清晰地展现了强化学习的核心循环:智能体观察环境的状态 (棋盘布局),基于其策略和目标 (赢棋) 来选择一个行动 (下一步棋),该行动改变了环境的状态,然后智能体又观察到新的状态,如此循环往复,直到游戏结束分出胜负。 通过这种方式,AI的目标(图中的“赢棋”)被转化成了一个数学问题:如何选择一系列的行动(下棋),来最大化 2025-07-20 Deep Learning #DeepLearning #AI #李宏毅机器学习