加入支持让我们有继续维护的动力!会员畅享查看所有预告
立即购买
软件学院“智能·软件·未来”论坛30期 | To Explore or to Commit: Conservative Optimism with Pessimistic Baselines for Offline-to-online Learning
- 来源:
- 学校官网
- 收录时间:
- 2026-06-10 03:01:56
- 时间:
- 2024-11-01 22:21:12
- 地点:
- 报告人:
- 学校:
- 山东大学
- 关键词:
- offline-to-online learning, reinforcement learning, conservative optimism, pessimistic baselines, exploration vs. commitment
- 简介:
- 软件学院“智能·软件·未来”论坛第30期,探讨离线到在线学习中的保守乐观与悲观基线策略。
- -/- 28

