多模态模型_五金资讯站

TAG标签

表现超越GPT 多模态模型学会打扑克

只用强化学习来微调，无需人类反馈，就能让多模态大模型学会做决策！这种方法得到的模型，已经学会了看图玩扑克、算，12点，等任务，表现甚至超越了GPT，4v，这是来自UC伯克利等高校最新提出的微调方法，研...

共1页 1条