您的当前位置:首页>热点 > 正文

每日热门:怎样训练出一个所向披靡的AI赛车手?

来源:虎嗅网 时间:2022-09-02 15:54:22


(资料图片仅供参考)

GT Sophy,当今最强的AI赛车手,它在人气最高的纽博格林北环,以17秒的优势破解了F1七冠王汉密尔顿的赛道记录。它的开发者在登上了nature封面的官方论文里提到,让一个起初连油门踏板都不会踩的AI最终变成所向披靡的赛道之王,背后的秘密是一套特别设计的强化学习算法。

什么是“强化学习”?其实和驯猫是一个道理,猫咪听话时奖励一根猫条,尿炕、抓沙发时给予一些惩罚。强化学习就是通过不断的奖励与惩罚,让一个智能体在与环境交互的过程中,逐渐学会一套能够最大化自身收益的行为。那么,要如何把“奖励”真正送到AI手里呢?

标签:

最新新闻:

新闻放送

关于我们 | 联系我们 | 投稿合作 | 法律声明 | 广告投放
 

版权所有©2017-2020   三秦科技网
 

浙ICP备2022016517号-20
 

所载文章、数据仅供参考,使用前务请仔细阅读网站声明。本站不作任何非法律允许范围内服务!
 

联系我们: 514 676 113 @qq.com
 

Top