李沐老师回归B站!带着大模型创业成果填坑来了

终于,AI大神李沐回来了!带着他的大模型创业最新成果——

一个专门为复杂场景 角色扮演 设计的大模型,名为 Higgs-Llama-3-70B

得知消息的不少网友已激动在评论区催更,李沐老师也回应,视频坑还是会填的:

那沐神到底干啥去了?这就透过Higgs-Llama-3-70B瞧一瞧。

定睛一看,Higgs-Llama-3-70B是沐神去年联合创立的公司,推出的 Higgs开源系列大模型中的第一个 ,基于Llama 3打造,做了完整的SFT、RLHF。

它不仅能在角色扮演任务上表现优异,在通用领域上的指令遵循和推理方面也很有竞争力。

左击Claude3,右打Gemini

团队在两个新基准测试MMLU-Pro和Arena-hard上展示了Higgs-Llama-3-70B的能力。

他们还特地强调所有基准测试终将导致过拟合,已尽量从微调数据中排除了基准测试数据及其训练示例。

具体来说,是MMLU的扩展,团队认为MMLU-Pro是在模型完成训练之后发布,较少受到其他已发布模型的过拟合影响。

拿来做比较的模型也都一水的很强。

而Higgs-Llama-3-70B的表现优于谷歌在5月I/O大会上最新推出的模型Gemini-1.5-Flash、Claude3家族“中杯”Claude-3-Sonnet以及Llama3-70B-instruct。

再来看 Arena-hard ,该基准包含了来自Chatbot竞技场的500个具有挑战性的真实用户查询。

Higgs-Llama-3-70B的表现排名第四:

除此之外,使用相同的base model,Higgs-Llama-3-70B在6个基准测试中均优于LLama-3-70B-Instruct。

虽然距离GPT-4o还有不小的差距,但值得注意的是沐神团队放出的只是通用能力的基准测试,并且强调并未针对性刷榜。

而且Higgs-Llama-3-70B毕竟是为角色扮演专门设计的,相关效果展示团队未具体给出。

团队表示Higgs-Llama-3-70B只是个开胃菜,将进一步探讨角色扮演性能、训练后的处理流程、零基础建立数据中心、在云端使用GPU以及未来整合多个服务提供商的策略。

之后也会发布更多Higgs系列模型。

开发角色扮演Agent

这次李沐大模型创业方向终于浮出水面,倒是一定程度印证了之前关于沐神创业方向的猜想。

此前有消息爆料,从亚马逊首席科学家的职务上离职后,李沐联手其导师、另一位亚马逊出身AI大牛Alex Smola创办了创业公司Boson AI。而公司方向是利用大模型能力,做和游戏娱乐有关的项目。

这回官方终于给出了个准信儿,确实跟游戏沾边:

目前官网主页也已更新Higgs-Llama-3-70B模型。

还晒出了团队创始成员,除李沐和Alex Smola外,还有四位成员。

李沐和Alex Smola,量子位此前也有介绍过。

李沐 ,是二者之间大家比较熟悉的那一位。自己有很厉害的经历,加上在小破站传道授业,打下了响当当的知名度。

而,更是一个AI届的神级大牛。

直接上数据:Smola在Google Scholar上的被引用次数, 超过17万次 。其中,被引次数前三的所著论文,被引数统统破万。

除了是ML著作《动手学深度学习》的主要作者外,Smola这些年的履历也很值得好好了解一番——

1996年,Smola在慕尼黑工业大学完成硕士学业,而后又在柏林工业大学拿下计算机科学博士学位。博士毕业后,他先后去往柏林GMD软件工程和计算机体系结构研究所、NICTA(澳大利亚信息与通信技术研究中心)工作。

2004年起,Smola在NICTA的统计机器学习项目中,担任高级首席研究员和项目负责人;到了2008年,Smola选择入职 雅虎研究院

2012年春天到2014年年底,2年多的时间里,Smola的工作地点是 谷歌研究院

期间,他开始担任CMU的教授。也是这个时候,他成为了李沐的博士导师,二人结缘。

2016年7月,Smola成为了亚马逊的一员,致力于构建AI和机器学习工具。首要任务之一,是让AWS和开发者社区建立和保持联系,让更多的开发者共同建设亚马逊深度学习库MXNet。

离职创业前,Smola在亚马逊担任的职位是杰出科学家和副总裁。

值得一提的是,由于Smola在分布式深度学习框架领域曾提出并行LDA(Latent Dirichlet Allocation)的框架——这是参数服务器概念的最早来源,因此,Smola也被业界称为 参数服务器之父

其他四位成员如下。

Shuai Zheng ,2019年从香港科技大学获得计算机科学博士学位。

之后就职亚马逊,领导亚马逊的分布式系统和LLM训练工作,包括开发可扩展的分布式训练和推理架构、具有数千亿参数的更智能模型,以及更快的分布式优化算法。

施行健 ,2014年本科毕业于上海交通大学,2018年获香港科技大学博士学位。

曾担任亚马逊担任高级应用科学家,领导过两个项目:AutoGluon Multimodal和DeepEarth。

其中AutoGluon Multimodal通过应用基础模型,突破了传统自动机器学习工具的限制。DeepEarth致力于为地球科学领域构建基础模型。之前他还参与了如Apache/MXNet等开源项目。

,加州大学默塞德分校博士学位。

同样曾在亚马逊AI团队,担任高级应用科学家。研究主要关注大语言模型、多模态学习、自监督学习和视频理解,曾参与AutoGluon、GluonCV等开源项目。

,2012年毕业于浙江大学计算机系。

曾先后在百度实习,担任聚胜万合首席软件工程师、奇虎360技术部经理,之后成为亚马逊高级软件开发工程师。

△领英主页尚未更新

最后,量子位认识的一位团队成员推荐大家用不同的人设、persona来测试Higgs-Llama-3-70B, “可能有惊喜哦”

以及One more thing …

大神李沐创业,肯定是不缺投资的,量子位听闻,知名技术创业者已经打钱支持了。

不过一切以官方信息为准吧。祝福李沐老师一切顺利~

参考链接:[1]https://boson.ai/about/[2]https://szhengac.github.io/[3]https://sxjscience.github.io/[4]https://bryanyzhu.github.io/[5]https://www.linkedin.com/in/yizhi-liu-20810558?original_referer=https%3A%2F%2Fwww.google.com%2F


坑坑洼洼的意思

形容物体表面高低不平。 魏巍 《东方》第六部第十一章:“满地弹坑,都是填平了又炸,炸了又填,显得坑坑洼洼。 ” 韩北屏 《非洲夜会·不巧的巧遇》:“我看到手臂上的肌肉凹下去,皮肤折皱……坑坑洼洼,显然受过重伤。 ”我们现在一般是比如路坑坑洼洼很不好走比如月球表面坑坑洼洼的但是讽刺人也会说人多脸上像月球表面一样,坑坑洼洼

累积盈余就是事业基金吗?

这是个财务条目,是一种公积金,不是基金。 国家规定公司赚了钱,要把10%拿出来放在账上(不会一直拿,到公司注册资金50%就可以了)。 这是《公司法》里面的规定,这些钱可以用来弥补公司亏损(填坑),或者转增资本(就是送股)!说得有点简单,不很专业,但大概意思是这样的。 希望能帮到你。

补土是什么意思?

补土作为模型、手办以及其他模具制作过程中的一个必备用品,有其重要的作用。 在模型加工的过程中,为了消除表面出现的瑕疵、裂痕、缝隙,或为了作出某些效果,都要用到补土。 补土主要分以下几种:普通补土、防磁补土。 1)普通补土用于填补模型零件之间的缝隙(细小缝隙的填补可以用502替代,经济实惠。 但要注意,模型中重要承重部件若与主体出现裂痕或缝隙,只能用补土而不能用502)和细节的制作(比如泥土痕迹等),也用来造型,填坑等等,不能喷涂。 普通补土有基础补土、AB补土、光硬化补土、液态补土等。 它们的基本用途差不多,但AB补土的塑形作用(当然此作用也相对有限,不是什么形状都能用AB补土做出来)是其他补土所不具备的。 2)防磁补土用于制作二站时期德国战车的防磁装甲——这种装甲其实是在装甲外包的水泥板,作用是防止磁性地雷的攻击,而这种装甲在模型版件上都没体现出来~~~这里顺便谈一下水补土。 水补土就是底漆,类似于涂料,通常是液状,在一般情况下需要稀释,但不能用水或者酒精稀释(否则结成絮状,无法使用),需要专门的稀释剂。 一般都使用喷涂的方法来附着到模型表面上,用法和其他油性涂料一样。 水补土分500号、1000号、1200号等几种,作用是增强其他涂料的附着力防止掉漆和遮盖模型零件的原有颜色防止出现色彩偏差,并检查模型表面的瑕疵。 其中第一个作用对油性涂料而言相对较弱,因为油性漆对塑料零件的附着力本来已经很强了。 1200的主要用于民用车辆和飞机的制作、1000的用于战车或者飞机、500号颗粒很粗,可以用于制作战车装甲的防滑板——比如老美的M1A1/2 ~~由此可见水补土和补土不是一回事。 水补土的统一底色、检查瑕疵等主要功能是补土所不具备的。 反之,补土的填补缝隙、塑形等功能也是水补土所不具备的。 此外两者在用法上也存在很大差别。

  • 声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
  • 本文地址:https://www.srwj168.com.cn/keji312/23645.html
媲美长江电力的成长龙头 300910 冯柳重仓 A股唯一价值
跟队记者 球员拒绝多队报价 卡马达本周末与米兰续约至2027