让对齐大模型超简单 这个团队做了OpenAI没Open的技术
机器之心报道编辑,Panda随着大型语言模型,LLM,规模不断增大,其性能也在不断提升,尽管如此,LLM依然面临着一个关键难题,与人类的价值和意图对齐,在解决这一难题方面,一种强大的技术是根据人类反馈...
机器之心报道编辑,Panda随着大型语言模型,LLM,规模不断增大,其性能也在不断提升,尽管如此,LLM依然面临着一个关键难题,与人类的价值和意图对齐,在解决这一难题方面,一种强大的技术是根据人类反馈...
用微信扫码二维码分享至好友和朋友圈AI算力资源越发紧张的当下,斯坦福新研究将GPU运行效率再提升一波——内核只有100行代码,让H100比使用FlashAttention,2,性能还要提升30%,怎么...
什么,疯狂动物城被国产AI搬进现实了,视频请到公众号中查看,与视频一同曝光的,是一款名为,可灵,全新国产视频生成大模型,它采用了Sora相似的技术路线,结合多项自研技术创新,生成的视频不仅运动幅度大且...
清华大学计算机系讲席教授、人工智能研究院基础模型研究中心主任唐杰出品,搜狐科技作者,郑松毅2024年已过半,大模型之争热度不减,通往AGI的路究竟该怎么走,近日,清华大学计算机系讲席教授、人工智能研究...
新智元报道编辑,乔杨桃子,新智元导读,最近,OpenAI的一位前员工发表了一篇165页的超长博文,对AI发展的未来做出了一系列预测,文章的核心观点可以概括成一句话,人类很可能在2027年实现AGI,A...
清华大学计算机系讲席教授、人工智能研究院基础模型研究中心主任唐杰出品,搜狐科技作者,郑松毅2024年已过半,大模型之争热度不减,通往AGI的路究竟该怎么走,近日,清华大学计算机系讲席教授、人工智能研究...
智东西编译陈骏达编辑Panken值得一提的是,李飞飞在斯坦福大学的个人资料显示,她从2024年初到2025年底处于部分休假状态,据路透社报道,目前她正在创办一家初创公司,创业的方向正是空间智能,李飞飞...
只用强化学习来微调,无需人类反馈,就能让多模态大模型学会做决策!这种方法得到的模型,已经学会了看图玩扑克、算,12点,等任务,表现甚至超越了GPT,4v,这是来自UC伯克利等高校最新提出的微调方法,研...
近日,斯坦福大学AI团队主导的Llama3,V开源模型被证实套壳抄袭国内清华与面壁智能的开源模型,小钢炮,MiniCPM,Llama3,V2.5一事,在网络上引发热议,在最新的进展中,斯坦福Llama...
新智元报道编辑,编辑部,新智元导读,在开源社区引起,海啸,的Mamba架构,再次卷土重来!这次,Mamba,2顺利拿下ICML,通过统一SSM和注意力机制,Transformer和SSM直接成了,一家...
Transformer挑战者、新架构Mamba,刚刚更新了第二代,更重要的是,团队研究发现原来Transformer和状态空间模型,SSM,竟然是近亲,两大主流序列建模架构,在此统一了,没错,这篇论文...
近日,斯坦福大学AI团队主导的Llama3,V开源模型被证实套壳抄袭国内清华与面壁智能的开源模型,小钢炮,MiniCPM,Llama3,V2.5一事,在网络上引发热议,在最新的进展中,斯坦福Llama...