TAG标签
表现超越GPT 多模态模型学会打扑克

表现超越GPT 多模态模型学会打扑克

只用强化学习来微调,无需人类反馈,就能让多模态大模型学会做决策!这种方法得到的模型,已经学会了看图玩扑克、算,12点,等任务,表现甚至超越了GPT,4v,这是来自UC伯克利等高校最新提出的微调方法,研...

1页 1