Meta反对 谷歌 Karpathy观点惹争议 RLHF不是真正的强化学习
机器之心报道编辑,杜伟AI大牛Karpathy又来科普人工智能概念了,昨日,他发推表示,,基于人类反馈的强化学习,RLHF,只是勉强算得上是强化学习,RL,Karpathy的全文解释如下,RLHF是训...
机器之心报道编辑,杜伟AI大牛Karpathy又来科普人工智能概念了,昨日,他发推表示,,基于人类反馈的强化学习,RLHF,只是勉强算得上是强化学习,RL,Karpathy的全文解释如下,RLHF是训...
新智元报道编辑,乔杨好困,新智元导读,RLHF到底是不是强化学习,最近,AI大佬圈因为这个讨论炸锅了,和LeCun同为质疑派的Karpathy表示,比起那种让AlphaGo在围棋中击败人类的强化学习,...