TAG标签
让对齐大模型超简单 这个团队做了OpenAI没Open的技术

让对齐大模型超简单 这个团队做了OpenAI没Open的技术

机器之心报道编辑,Panda随着大型语言模型,LLM,规模不断增大,其性能也在不断提升,尽管如此,LLM依然面临着一个关键难题,与人类的价值和意图对齐,在解决这一难题方面,一种强大的技术是根据人类反馈...

表现超越GPT 多模态模型学会打扑克

表现超越GPT 多模态模型学会打扑克

只用强化学习来微调,无需人类反馈,就能让多模态大模型学会做决策!这种方法得到的模型,已经学会了看图玩扑克、算,12点,等任务,表现甚至超越了GPT,4v,这是来自UC伯克利等高校最新提出的微调方法,研...

Mamba

Mamba

新智元报道编辑,编辑部,新智元导读,在开源社区引起,海啸,的Mamba架构,再次卷土重来!这次,Mamba,2顺利拿下ICML,通过统一SSM和注意力机制,Transformer和SSM直接成了,一家...