在过去的几年里,强化学习(RL,Reinforcement Learning)在很多方面取得了突破。DeepMind公司将深度学习与增强学习结合在一起,在众多的Atari游戏中来取得超越人类的表现,基于深度学习和强化学习训练得到的AlphaGo Zero更是完全从零开始,仅通过自我对弈就能天下无敌。虽然RL目前在许多游戏环境中都表现很出色,但它对解决需要最优决策和效率的问题而言是种全新方法,而且肯定会在机器智能中发挥作用。 OpenAI成立于2015年底,是一个非营利组织。它的目的是“建立安全的人工通用智能(AGI),并确保AGI的福利被尽可能广泛和均匀地分布”。除了探索关于AGI的诸多问题之外,OpenAI对机器学习世界的一个主要贡献是开发了Gym和Universe软件平台。 Gym是为测试和开发RL算法而设计的环境/任务的集合。它让用户不必再创建复杂的环境。Gym用Python编写,它有很多的环境,比如机器人模拟或Atari 游戏。它还提供了一个在线排行榜,供人们比较结果和代码。 课程大纲: 第1周 强化学习与常用的仿真环境平台介绍(MuJoCo, OpenAI Gym, rllab, DeepMind Lab, TORCS, PySC2等) 第2周 OpenAI gym中的常用仿真环境介绍,包括Atari 2600 游戏系列、MuJoCo 物理模拟器、Toy text 文本环境、Robotics机械手与机械臂模拟器等 第3周 马尔科夫决策过程MDP 第4周 基于gym的MDP实例讲解,基于OpenAI Gym构建股票市场交易环境 第5周 基于gym的强化学习实践:基于值函数的强化学习方法实现;基于策略梯度的强化学习方法实现 第6周 虚拟环境Universe: 一个用于训练解决通用问题 AI 的基础架构 第7周 基于Universe的强化学习实践:用OpenAI公司的Gym工具库和Universe平台为游戏创建人工智能机器人 开课时间: 本期课程将于2024年09月27日开课,预计课程持续时间为9周 目标人群: 有简单的强化学习基础,希望学习强化学习的落地实现的同学 课程环境: python3+OpenAI GYM+OpenAI Universe 收获预期: 学习结束后均能自己动手编写一个仿真环境,训练强化学习 授课讲师: 何翠仪 毕业于中山大学统计学专业,炼数成金专职讲师。 在炼数成金上开设了多门关于数据分析与数据挖掘相关的课程,如《大数据的统计学基础》、《大数据的矩阵基础》《金融时间序列分析》等,也曾到不同的公司开展R语言与数据分析的相关培训。对数据分析有深刻认识,曾与不同领域公司合作,参与到多个数据分析的项目中,如华为、广州地铁等 课程试听:
新颖的课程收费形式:“逆向收费”约等于免费学习,仅收取100元固定收费+300元暂存学费,学习圆满则全额奖励返还给学员! 本门课程本来打算完全免费,某位大神曾经说过“成功就是正确的方向再加上适度的压力”。考虑到讲师本身要付出巨大的劳动,为了防止一些朋友在学习途中半途而废,浪费了讲师的付出,为此我们计划模仿某些健身课程,使用“逆向收费”的方法。 在报名时每位报名者收取400元,其中100元为固定 收费,另外300是暂存学费,即如果学员能完成全部课程要求,包括完成全部的书面和互动作业,则300元全款退回。如果学员未能坚持到完全所有的学习计划任务,则会被扣款。期望这种方式可以转化为大家强烈的学习愿望和驱动力! 课程授课方式: 1、 学习方式:老师发布教学资料、教材,幻灯片和视频,学员通过网络下载学习。同时通过论坛互动中老师对学员进行指导及学员之间相互交流。 2、 学习作业:老师每周布置书面及互动作业,学员需按时按质完成作业。 3、 老师辅导:根据作业批改中发现的问题,针对性给予辅导,帮助大家掌握知识。 4、 结业测验:通过测验,完成学业。 您是否对此课程还有疑问,那么请 点击进入 FAQ,您的问题将基本得到解答 咨询QQ: 2222010006 (上班时间在线) 技术热点、 行业资讯,培训课程信息,尽在炼数成金官方微信,低成本传递高端知识!技术成就梦想!欢迎关注! 打开微信,使用扫一扫功能,即刻关注炼数成金官方微信账户,不容错过的精彩,期待您的体验!!! |