算法_第5页_五金资讯站

让对齐大模型超简单这个团队做了OpenAI没Open的技术

机器之心报道编辑，Panda随着大型语言模型，LLM，规模不断增大，其性能也在不断提升，尽管如此，LLM依然面临着一个关键难题，与人类的价值和意图对齐，在解决这一难题方面，一种强大的技术是根据人类反馈...

用微信扫码二维码分享至好友和朋友圈AI算力资源越发紧张的当下，斯坦福新研究将GPU运行效率再提升一波——内核只有100行代码，让H100比使用FlashAttention，2，性能还要提升30%，怎么...

什么，疯狂动物城被国产AI搬进现实了，视频请到公众号中查看，与视频一同曝光的，是一款名为，可灵，全新国产视频生成大模型，它采用了Sora相似的技术路线，结合多项自研技术创新，生成的视频不仅运动幅度大且...

清华大学计算机系讲席教授、人工智能研究院基础模型研究中心主任唐杰出品，搜狐科技作者，郑松毅2024年已过半，大模型之争热度不减，通往AGI的路究竟该怎么走，近日，清华大学计算机系讲席教授、人工智能研究...

新智元报道编辑，乔杨桃子，新智元导读，最近，OpenAI的一位前员工发表了一篇165页的超长博文，对AI发展的未来做出了一系列预测，文章的核心观点可以概括成一句话，人类很可能在2027年实现AGI，A...

清华大学计算机系讲席教授、人工智能研究院基础模型研究中心主任唐杰出品，搜狐科技作者，郑松毅2024年已过半，大模型之争热度不减，通往AGI的路究竟该怎么走，近日，清华大学计算机系讲席教授、人工智能研究...

智东西编译陈骏达编辑Panken值得一提的是，李飞飞在斯坦福大学的个人资料显示，她从2024年初到2025年底处于部分休假状态，据路透社报道，目前她正在创办一家初创公司，创业的方向正是空间智能，李飞飞...

只用强化学习来微调，无需人类反馈，就能让多模态大模型学会做决策！这种方法得到的模型，已经学会了看图玩扑克、算，12点，等任务，表现甚至超越了GPT，4v，这是来自UC伯克利等高校最新提出的微调方法，研...

近日，斯坦福大学AI团队主导的Llama3，V开源模型被证实套壳抄袭国内清华与面壁智能的开源模型，小钢炮，MiniCPM，Llama3，V2.5一事，在网络上引发热议，在最新的进展中，斯坦福Llama...

新智元报道编辑，编辑部，新智元导读，在开源社区引起，海啸，的Mamba架构，再次卷土重来！这次，Mamba，2顺利拿下ICML，通过统一SSM和注意力机制，Transformer和SSM直接成了，一家...

Transformer挑战者、新架构Mamba，刚刚更新了第二代，更重要的是，团队研究发现原来Transformer和状态空间模型，SSM，竟然是近亲，两大主流序列建模架构，在此统一了，没错，这篇论文...

近日，斯坦福大学AI团队主导的Llama3，V开源模型被证实套壳抄袭国内清华与面壁智能的开源模型，小钢炮，MiniCPM，Llama3，V2.5一事，在网络上引发热议，在最新的进展中，斯坦福Llama...