我们用它 了下GPT 腾讯大模型App元宝上线 单挑

机器之心报道

机器之心编辑部

最近,腾讯一改往日的慢性子,忽然「卷」起来了:

5 月 14 日,腾讯全面开源混元文生图模型;

5 月 17 日,腾讯发布一站式 AI 智能体创作与分发平台「腾讯元器」;

5 月 30 日,基于混元大模型的 App「腾讯元宝」正式上线,目前应用商店已经可以下载。

腾讯元宝是一个基于混元大模型及搜索引擎驱动的高效信息整合工具,界面设计简洁,可以搜索实时信息,也可以对上传的多格式文档进行总结、翻译,还能语音对话练习口语。

而此次腾讯元宝产品能力升级的背后,是腾讯混元底层模型的持续迭代。

据介绍,自 2023 年 9 月首次亮相以来,腾讯混元大模型的参数规模已从千亿升级至万亿,预训练语料从万亿升级至 7 万亿 tokens,并率先升级为多专家模型结构(MoE),整体性能相比 Dense 版本提升超 50%。

我们第一时间拿到了腾讯元宝的体验资格,今天就拿出来 “遛一遛”。

腾讯元宝「单挑」GPT-4o

相比此前测试阶段的混元小程序版本,面向工作效率场景,腾讯元宝提供了 AI 搜索、AI 总结、AI 写作等核心能力。

没有对比就没有发言权。我们决定让腾讯元宝和大洋彼岸的 GPT-4o 进行较量。

Round 1:AI 搜索

如今,AI 搜索是香饽饽。

无论是「搜索之王」谷歌还是新晋顶流 OpenAI,都在 AI 搜索上做文章,甚至成立不到 2 年的 Perplexity AI 都成了黄仁勋的「心头好」。英伟达创始人黄仁勋曾公开表示,自己最爱用的 AI 工具是 Perplexity。

腾讯元宝自然上线了这一功能。

要知道,微信公众号每天都生成大量优质深度文章,背靠这棵大树,腾讯的 AI 搜索功能有着得天独厚的优势。

我们在「腾讯元宝」下方输入框中输入「现在适合买黄金吗?」

(温馨提示:投资需谨慎)

腾讯元宝的回答:

GPT-4o 的回答:

首先,从响应速度上来说,二者可以说是不相上下,几秒钟时间,腾讯元宝就参考完 9 篇资料,并给出了回答。

其次,从回答内容上来说,腾讯元宝似乎更胜一筹。GPT-4o 仅仅给出了购买黄金需要考虑的几个因素,而腾讯元宝的答案涵盖黄金价格走势预测、投资风险以及投资策略,而且每条均有引用,这就避免了大模型「满嘴跑火车」的缺点。

此外, 腾讯这次真的把好钢用在了刀刃上。除了推荐了相关公众号文章外,腾讯元宝还在首页上线了快速播报功能,对当前最新、最重要的资讯进行摘要总结,而且每条资讯都会提供腾讯新闻的链接。

这一局,腾讯元宝胜!

Round2:文档总结

该功能旨在帮助用户高效获取和处理文档信息,腾讯元宝能够处理多种格式的文档,例如 PDF、Word、Excel 等。

前几天腾讯正好发布了 2024 年第一季度财报,我们下载了一份。

这份长达 48 页、3.2 万字的财报,不仅数字多,还是繁体字,看得人脑瓜子疼。这时 AI 就派上用场了。

我们将这份财报分别上传到腾讯元宝和 GPT-4o,让他们各自分析一下腾讯开年第一季度的营收情况。

腾讯元宝:

总体来看,它们回答得条分缕析。两相比较 GPT-4o 的答案更加丰富,除了财务表现和主要业务表现外,GPT-4o 还提供了运营数据、财务状况等。

财务报表重在准确。我们拿着这堆数据一一校对,果然还是找到了 bug。

腾讯一季度的其他收入应为 20.6 亿元,腾讯元宝却写成 206 亿元,在换算过程中把小数点点错了。

而 GPT-4o 的数据全部正确。

这一局,GPT-4o 胜!

Round3:网页总结

上周,机器之心发布了一篇名为《李飞飞亲自撰文:大模型不存在主观感觉能力,多少亿参数都不行》的文章。我们将该文章链接分别丢给腾讯元宝和 GPT-4o,让他俩总结链接内容。

腾讯元宝:

腾讯元宝领到任务后「埋头总结」,从李飞飞的看法、空间智能与 AI、AI 感觉能力的争议、AI 感觉能力的错误推理、AI 与人类智能的区别以及未来展望等 6 个方面进行了概括。

不得不说,它总结得还挺到位。

不过,GPT-4o 临时掉链子,「我无法直接访问所提供链接的具体内容」,还让我们提供文章描述或要点,GPT-4o 是懒得明明白白。

这一 part,腾讯元宝完胜!

Round4:AI 作图

多模态也是重点考察对象。

我们就来看看这两个 AI 的画功。

我们输入同一提示词:请帮我画一幅画一个可爱的卡通女孩穿着裙子,抱着一只白色的小猫,全身,黄色背景,Keith Haring 风格的涂鸦,清晰的插图,大胆的线条和纯色,简单的细节,极简主义,黄色背景。

GPT-4o「罢工」了,原因是受内容政策的限制,无法生成与 Keith Haring 风格相关的图像。

我们删除「Keith Haring」关键词后,GPT-4o 才开始干活:

腾讯元宝倒是「好说话」,直接出图:

腾讯元宝这种不打折扣的响应当然更讨普通用户的欢心,不过这也可能涉及到版权问题。

一口气上线 76 款智能体,主打实用好玩

智能体的风也刮到了腾讯元宝。

在界面顶端的「发现」一栏,腾讯元宝推出了涵盖工作、娱乐、效率、学习、角色五大类,共计 76 款智能体。目测大部分是用户或开发者自行创建发布的。

其中效率类智能体包括 PPT 达人、工作汇报鬼才、logo 设计小咖、宣传稿生成器、招聘大师等,主打一个实用。

而生活娱乐类则聚焦「好玩」,比如电影推荐、周公解梦,还有同款热门游戏《完蛋!我被美女包围了》……

此外,面对眼花缭乱的智能体,腾讯元宝还制作了首发精选榜单,创意绘画、百变 AI 头像、口语陪练、创意贴贴贴、超能翻译官这 5 款智能体入选。

创意贴贴贴

小红书上有一类小众赛道火出圈,那就是萌宠贴纸,而「创意贴贴贴」就瞄准这一需求。

用户只需输入文字或上传图片,然后选择风格即可。

我们上传了一张潦草小狗的图片,最终生成的贴纸效果如下:

也可以输入提示词以生成贴画。提示词:吃冰激凌的小女孩,可爱风格。

百变 AI 头像

该功能允许用户利用 AI 技术生成个性化头像,还可以与 QQ 二维码融合,为用户的 QQ 账号增添个性化元素。

该功能还提供芭比、多巴胺、复古繁花、白领精英等 12 种风格,我们选择「复古港漫」风格,然后上传一张霉霉的照片。

值得注意的是,上传图片要求五官清晰,分辨率超过 500,避免画质模糊、面部遮挡、头部过小或者多人照片。

生成的效果如下所示:

虽然生成的头像与霉霉八竿子打不着,不过画风还蛮好看的。

由于操作简单,我们玩到停不下来。

这是芭比风格的苏菲・玛索:

复古繁花风格的小李子:

傻瓜级操作,分分钟手搓一个智能体

腾讯元宝还上线「创建智能体」功能,把制作门槛彻底打下来了。

用户只要点击「创建智能体」,然后按照提示输入名称、角色设定、简介、开场白、预置指令,并选择音色、上传 logo 即可。

例如我们创建的「朋友圈发疯文学」生成器,分分钟搞定。

我们让它发个「人生歪理,句句在理」的文案,该智能体一股脑吐出来 8 句,例如「人生就像打游戏,不管多努力,总有那么一关过不去。但是,我们依然热爱这个游戏,因为关关难过,关关过,这就是人生。」

嘿,还真逻辑自洽了。

不过,腾讯元宝自定义的智能体还是过于「正经」了,不少句子说得确实在理,但不够歪,不够有梗。

如果懒得动手,也可以让 AI 代劳。例如我们只输入名称「古人也 emo」,点击「AI 生成」魔法棒,几秒钟 AI 就把剩下的工作完成了。我们只要在细节上调整一下即可。


大模型画的饼,自动驾驶能消化么?

如果要评选2023年最大的风口,AI大模型一定位列其中。

风起自ChatGPT的现象级爆火,英伟达创始人黄仁勋激动地喊出了“AI的iPhone时刻正在到来“。

整个科技圈似乎达成了一种共识:所有产品都值得用大模型重做一遍,当然也包括正处于寒冬之中的自动驾驶。

然后,几乎是一夜之间,整个汽车圈都是GPT上车的消息,长安、集度、吉利、岚图、红旗、长城、东风日产、零跑等搭上了网络的文心一言。

“蔚、小、理“先后申请了GPT的相关商标。其中,理想自研的Mind GPT已经正式发布。另外,毫末智行也在不久前发布了自动驾驶生成式大模型drive GPT。

可以说AI大模型的火热,给正在冷却中的自动驾驶又画了一张新的大饼。

有人表示从中看到了自动驾驶的未来。比如集度汽车创始人夏一平,小鹏汽车董事长何小鹏等,当然也有很多人觉得,GPT上车目前就是个PR行为。

所以,今天来尝试探讨一个问题,大模型之于自动驾驶,到底有什么作用?它能给这个已经烧掉无数金钱但依然成效寥寥的赛道,带来一个相对确定的未来么?

NO.1 [不可解释的“涌现”和自动驾驶的困境]

先明确一个定义,大模型是指具有超大参数规模(通常在十亿个以上)和复杂程度的机器学习模型。通常来说,参数量越大,模型就越容易拟合海量数据的规律。

而ChatGPT的出现,让人们有一个非常惊喜的发现。那就是当模型参数量达到了一定程度,超过某个临界值之后,它的性能会大大超越预期。

很多科学家惊叹于这一现象,并将其称之为“涌现“。但遗憾的是到目前为止还没有一套系统、公认的理论来解释为什么会出现这个现象。

所以我们姑且相对简单地把这种“涌现“理解为一个从量变到质变的过程。在跨过临界点之后,模型精度呈指数型增加,甚至产生了类似于人类的逻辑思考能力。

而这种能力很可能是自动驾驶算法攻克最后1%长尾场景的关键所在。在数据标注、虚拟仿真环境以及决策规划上,大模型都有可能改变甚至重写过去的算法。

举个例子,低频率但又几乎不可穷尽的Corner Case,正是从高阶辅助驾驶迈向自动驾驶最大的一块绊脚石。

而Corner Case的出现带有极强的不可预知性,毫末智行数据智能科学家贺翔举了一个例子,一辆卡车转运一颗大树,算法看到的可能只有车,而没有伸出车外的树枝。

类似的状况有很多,比如说很特别的大件运输车辆,甚至是违规拉着很长一根管子的三轮车。

面对这些场景,算法只识别的车辆是不够的,但按照现在基于标签的方式来挖掘长尾场景,只能给系统看大量的标注图片,教它学会识别。

不过问题在于,这些车辆出现的频率太低,数据采集的难度大、成本高、周期长,真正碰到这种场景的概率又小,成本上是算不过来的。

但AI大模型具备举一反三的能力,我们可以通过文字的描述来使其检索并对图像进行分类,检索甚至是自主创造我们需要的长尾场景,例如拖着大树的卡车,拉着长水管的三轮车等。

除此之外,大模型也可以更好的从数据中提取特征,进行数据标注。

比如,先用海量未标注数据通过自监督的方式预训练一个大模型,然后用少量已经人工标注好的数据对模型做微调,使得模型具备检测能力,这样模型就可以自动标注需要的数据。

目前,很多公司都在研究如何提高大模型自动标注的精度,希望实现自动标注的完全无人化。

在Mind GPT发布之后,理想汽车董事长李想就表示:“我们一年要做大概1000万帧的自动驾驶图像的人工标定,外包公司价格大概6元到8元钱一张,一年成本接近一亿元。当我们使用大模型,通过训练的方式进行自动化标定,过去需要用一年做的事情基本上3个小时就能完成,效率是人的1000倍。”

总之,自动驾驶的感知也好,规划决策也好,目前基本上是基于经验和规则的,缺少场景泛化的能力。

但就像夏一平所言,大模型解决的正是泛化的问题,是举一反三的问题,这可能让自动驾驶在未来3-5年内又重大的突破。

因为从根本上来说,生成式AI在语言模型上的应用思路是可以平移到自动驾驶上的。

虽然计算机不懂自然语言,但它通过数学建模,把语言问题变成了数学问题。通过给定文本的历史,预测下一个词出现的概率,间接地理解了自然语言。

换到驾驶场景,如果给定当前的交通环境,给定一个导航地图,以及一个驾驶员驾驶行为的历史,那么,大模型是不是可以预测下一个驾驶动作?

理论上,这是可行的。地平线的创始人余凯认为以AI现在所展现的学习能力,学习司机的驾驶习惯并不难。

“接下来要继续用更大的数据、更大的模型,无监督地去学习人类驾驶的尝试,就像我们从大量无监督的、没有标注的自然文本里去学习一样,构建一个回归自动驾驶的大语言模型。”

NO.2 [吃饼还需算力硬]

大模型为自动驾驶画出来的这张饼,很诱人。但能不能消化其实是另外一回事儿。

“现在说GPT上车都是噱头,车端还没有运转大模型的硬件条件。”贺翔说道。

理论上,大模型需要高规格的硬件配置,包含高性能计算能力、大容量内存和低时延等特点,但车载设备的硬件条件相对有限,无法提供足够的计算资源支撑大模型运行。

举个例子,在自然语言处理领域的 GPT-3 模型就需要数万亿Tops的计算能力。这要求芯片的算力至少要在万级Tops以上才能够胜任大型模型的计算任务。

但是,在车载部署场景下,芯片的算力往往只有数百Tops,远远达不到大型模型的要求。

所以,目前自动驾驶大模型也只能暂时运转在云端,例如毫末智行的Drive GPT。

但即便如此,它依然可以对车端产生影响。 比如通过用知识蒸馏的方式“教”车端的小模型。

最简单的方式就是把需要打标签的图片给大模型学习,大模型可以给这些图片打好标签,标注好的图片就可以用于小模型的训练。

所以,大模型对算力的消耗让云计算厂商成为了第一批被风吹起来的玩家。

2023年以来 阿里、美团、腾讯等互联网大厂也都纷纷收缩或者调整了自动驾驶相关的投入,将更多的精力放到了云计算和AI大模型上。

而主机厂这边,自建超算中心也逐渐成为了基本操作。

当然如果大模型只能运转在云端,它对于自动驾驶的影响会小很多。因为从云端到车端,哪怕只是一点点的时延也可能会在公路上造成悲剧。

所以目前地平线、英伟达等芯片企业都在积极研发适应大模型上车需求的新一代高算力AI芯片。

地平线CTO黄畅认为,按照发展进程来看,在自动驾驶场景中,大模型在车端会优先从环境模型的预测和交互式规控和规划开始应用。

“这个场景不需要特别的大规模参数模型,在百Tops级别的算力平台上就能应用, 3~5年内就可以初步上线。”

“但如果从感知到定位地图到规控,整个端到端的闭环做出来,则需要一个更大规模的参数模型,大概需要5~10年的时间。”黄畅补充到。

NO.3 [写在最后]

严格来说,一夜火遍全球的ChatGPT只是AI大模型中的一种。自动驾驶行业对于大模型的运用比ChatGPT的爆火要早很多。

2017年,马斯克从Open AI挖来了了一位计算机视觉领域的顶级研究院Andrej Karpathy。

他在特斯拉工作了五年,最高做到了AI高级总监兼自动驾驶负责人,而这五年也被绝大多数人认为是特斯拉自动驾驶成长最快的五年。

入职后不久,Andrej Karpathy就重写了特斯拉自动驾驶算法,以BEV纯视觉感知+Transformer为基础,将特斯拉的智能驾驶带入了新的阶段。

当下小鹏、华为、毫末智行、理想等企业正在纷纷跟进这一路线。

而所谓Transformer是一种由谷歌8为AI科学家提出的一种深度学习神经网络,GPT中的T正是指代Transformer。

Open AI将Transformer运用于自然语义理解,诞生了ChatGPT;特斯拉将其应用于计算机视觉,成功开创了BEV技术,让纯视觉感知成为了潮流。

接下来,Transformer还将被自动驾驶玩家们逐步运用到决策规划等各个环节,改变现有模块化的部署方式,迈向端到端的自动驾驶。

我们现在还无法预知这一切会擦出怎么样的火花,但可以肯定大模型在智能驾驶上还未达到自然语义一般“涌现”的程度。

但至少,改变已经在发生,也许这一次自动驾驶这条路也许就真的通了呢?

我们和八个蔚来产品经理聊了聊,如何把座舱做出蔚气?

文|Karakush

质疑蔚来,理解蔚来,成为蔚来。

10月底蔚来智能座舱FOTA五周年。

蔚来发布了Banyan2.1.0 CN的最新车机版本,开始全量支持NIO Phone吹过的牛B,以及其他超过60项功能的新增和优化。

用蔚来祖传的谦卑之辞来讲,这可能不是业内第一,但业内做得更好的也是没有。

如果按友商人均水平来讲,起码这就是业内第一智舱。

蔚来不以智舱闻名,淳朴的家风使其在流量大战中毫无存在感,也容易被更加独家的服务与换电feature盖去高光。

比如8155芯片,7.1.4沉浸声,以及新版本中小红书和智慧停车缴费应用,都是蔚来行业首发;而守卫模式、快捷场景、娱乐主机、运营反馈等等流行功能,蔚来干得很早、很妙,甚至打开了行情,却没得到广泛认知。

在外界看来,蔚来智能是通过冗余硬件炫耀性堆叠出来的应许水平,工程无难度,功能不遥遥;憋屈的是,值得夸夸之处,又是只有谁用谁知道的密宗流。

前阵子我们和蔚来智能体验相关的八位负责人聊了聊,发现经过五年沉淀,无论是技术框架、迭代方向、还是系统思考,蔚氏智能值得一个“赶为超鹏”的地位。

1.原则

蔚来智舱的体验设计,以五项原则为出发点:

一是好用,不解释。

二是安心,以前没提过。蔚来有一个一级团队专门做安全。车上预埋了安全芯片,用端到端加密,做远程启动、远程查看、守卫模式。所有内容不出车,在手机端查看也有脱敏算法,保护隐私。

端到端投入较高,业内做得不多。简单来说,就是车授权A手机,就只有A手机可看,其他手机不行。优点是安全性拉得很高,因为加密过程不可逆,破解难度大,可以参考苹果;缺点是牺牲一部分便捷性,换台手机就要再做一次配对。

得益于此,蔚来很早就推出远程授权,现在其他很多厂商才推。蔚来不只是做钥匙,也开展出驾享(蔚来代驾)、维保取送车(蔚来道服)等等服务,非常方便,没有交接钥匙这个流程。

在此二条前提下,再有三个主题,分别是:

三、移动的生活空间,比如PanoCinema、车手互联、应用生态;

四、有温度有情感的伙伴,比如NOMI;

五、连接产品和服务社区,比如新版本中招牌的服务群、补能资源地图、车主合伙人店铺等等蔚来体系上车。

后面三条看着务虚。从功能层面来看,不就是彩电音响大沙发、语音、和明年倒闭的不务正业,套了一个营销包装吗?

当然不是。没见过这么大白话还不押韵的塑料包装。

正是这三条,蔚来智能座舱数字体验负责人朱太平说,区隔其他智能,做出蔚来的差异性。

智舱很卷,愚蠢短板在减少,功能代差在抹平。智能化的竞争重心,正在从创新颠覆,向体验内卷和成本控制靠拢。

“首创”很快会被复制,“之最”很快会被超越,炸裂迅速平庸,震撼日益递减,没有什么显见的护城河,是不可被性价比压制的。

“大家做的功能差不多,只有你和别人不同,才能凭什么比别人卖得贵一些。”朱太平说。

生活化、伙伴化、社区化,就是蔚来的“不同”:

第一,它甄别出人的需求内核,除了大家都在做的好用、舒适,更重要的是提供情绪价值,后者将成为一种核心竞争力;

第二,它跳出眼下功能/价格竞争的格局,以终为始设计技术的外延,结果就是蔚来会祭出AR眼镜、手机之类的骚操作;

第三,它由价值观出发,延续用户企业的一致性,去深度融合体系能力。

从市场打法到顶层设计,蔚来希望通过“不同”构筑壁垒,主旨指向一个,就是不断做深习惯、做高习惯迁移成本,让人不可轻易复制和追赶。

2.举个例子

NOMI是蔚来从第一款车就在的独有产品,也是被长期全面低估的一项主线成就。一方面,它总是被视作用卖萌补偿技术,提供绵薄的情绪价值;另一方面,情绪价值本身被看扁。

一个不成熟的小判断:情绪价值将是下一代座舱竞争的新赛道。良好的感受,可以带来更高的溢价和复购,因为它解释无底线、需求无上限。比如一颗NOMI脑袋单售4900元,很多车主趋之若鹜。

它的初衷是鼓励语音使用,缓解和空气对话的尴尬。实际情况更进一步,一个实体一旦拥有姓名,人就会上头,投入感情、并期待感情。你可以试试给一根头发取名詹妮弗,她的离开会比普通脱发更难受。

很多车主乐于给NOMI整穿搭,一顶帽子毫无用处(有的还会不跟头,凭实力添堵),售价在30至300元以上不等,一头之力养活了不少民间NOMI周边专卖手艺人。

新购入:来自车主店家@阿甜的甜阿

相应地,蔚来通过技术手段,完成情绪价值的闭环。

NOMI迭代超过100个版本,从最初的赛博花瓶,到最新版甚至可以唱歌,不是播放音乐,而是用NOMI的本声唱生日快乐——碍于版权,眼下只有一首。他们正在开发如何让NOMI唱出车主原创金曲,逐渐完善一个数字地下偶像的自我修养。

蔚来对于NOMI的规划,并不是一个冠名“伙伴”的命令执行器,而是有意培养真正的陪伴。负责座舱AI研发的高杰说,发展的主轴大概是三个方向:

一是现实有效完成任务,目前更多是单轮指令式的,加入大模型会更加自然;

二是偏被动式的懂你,在合适的时刻提供帮助,背后是个性化技术;

三是偏主动式的情感体验,背后是类似GPT的流式预测模型进行搜索联想

6月上线的记事功能是一小步,它已经累计超过20万次使用,“下车时提醒我带手机/文件/伞”之类的提醒占到40%,其实已经不是一个实时任务,而是触发条件再去做一个啥。

新版本里还新增备忘功能。当你看见晚霞,突然发作,想要rap一下,可以说“我要记下”,NOMI就会记录最长30分钟的灵感——当然可以在NIO Phone跨端查看。

功能设计更重要的依据是实际刚需。比如儿童场景,当OMS(乘员监测)识别出对话人是儿童,NOMI就会采用萌言萌语对话。

蔚来发现,接近80%的用户是有孩家庭,孩子在场场景的比例很高,并且最终都会向孩子想看什么、想听什么做出妥协。孩子也是主要服务对象。于是NOMI整合超过两万种儿童内容。上线几个月,累计互动已经超过750万次。

整盘来说,NOMI唤醒次数累计超过10亿次。业内车队规模更大的友商,达到1亿次都是一个坎儿。功能吹得好、做得好,并不代表它真正会被用起来。

NOMI是经过实用检验的。

分享一个个人体验,导航开车,你可以随时、随地、立刻、无脑、任意更换路线,比如临时起意“添加途径点-最近的充电站”,不用等灯/堵车/临停/掏手机/按屏幕/咆哮/重复/听到“我还不会”。市面上大部分座舱无法完成同款无打断体验。

首要是快。最新版更快,NOMI唤醒仅需470毫秒,几乎追平人类反应均值,而响应速度达到750毫秒。提速是一门技术活,这里要再次提到刚才说的流式预测,蔚来基于此做了一个结合预测和联想的流式全双工架构。

预测方面,NOMI会进行链路处理预判,比如“打开车窗”,说到“打开”,NOMI就会同步预测打开车窗/后视镜/座椅按摩/等等等,并发出预请求。尤其涉及第三方资源,通过预测提前预缓存POI列表或者歌曲内容,会快很多。

对话联想方面,就是用到流式预测,比如“播放周杰伦不能说”,NOMI会把“的秘密”用文字加载出来。类似输入法联想,谷歌网络已经玩得老六,但是上车蔚来是首发。

它不只是一个卡壳提醒,可以判断嗯嗯啊啊说到一半的烫嘴发言,不做愚蠢的打断;根据早期用户内测反馈,话到一半意思就能全部显示,还缩短交互延时的感受。别人硬卷700毫秒、500毫秒,NOMI直接用负延时打败零延时。

蔚来相信,这套架构具备领先的竞争力,拉高技术天花板。

一个体现是,蔚来仍旧基于8155,却把时间缩短一倍。高通已经推出8295,两者能力相差一代(8295有32TOPS,8155只有8TOPS),但是蔚来能把体验做到相同水平。

一方面,流畅度不仅靠一颗SOC,比如上面提到的全链路优化;另一方面,蔚来具备芯片内核的优化能力,从而把8155做到极致。

8295升级最多的是NPU,大家都想用好NPU,但是大部分语音还是在用CPU。蔚来则是把语音迁到善于做NPU计算的CDSP上。据称,把高通CDSP打开是有门槛的,它不是要用随用的,而是先有能力才给开放的。

同时,蔚来做了异构算力融合,就是打通座舱8155、智驾Orin、NIO Phone、NIO BOX做高速数据传输和交换。比如可以把座舱里一些比较复杂的视觉算法模块(像是OMS)放到Orin上,为8155腾出算力支持语音计算。

异构算力打通,算力该哪好就放哪,实现精准扶贫,就能支持很多需要大算力的功能。比如4D Dynamic底盘,在通过一个坑洼路面或者强冲击感坡面后,下次记住这个地方悬架提前做反应,是异构融合之后的成果。

尽管芯片能力代差是明确的,但是把体验拉到什么程度,取决于各家能力。在蔚来看来,通过先进架构和技术,体系化提升现有硬件的承载能力,带来的体验跨度也能非常猛烈。

4.底座支撑

交互好用的底层,是座舱能力足够多、足够深,可以在整个系统层面实现灵活控制和调用。

这个技术底座,就是操作系统。在NIO IN上,蔚来发布了SkyOS,没出水花,但是重要。它衔接整车全域的硬件和软件,打通车内的ECU、MCU和其他的跨端算力平台,全功能会是NT3平台的feature。

智能座舱(Sky OS-C)是其中一个技术集群,基于安卓做的深度定制,和车联、车控、自动驾驶几个OS放在一起(合体CCC架构),可以互联互通展开原子级协作,提高整个系统运行效率。

比如导航系统,蔚来不是直接拿高德来用,它和云端能源系统、大数据账号、自研的图层连在一起,无缝对接。这是可以在驾驶半途临时规划补能路线的基础。

各个子系统里面的能力,被封装成1000多个深度化的原子能力。这一定是一个行业第一,因为不仅涵盖车控,也包括服务、生态、和社区。像是充换电资源以及车主福利合伙人的POI等等。

这些原子能力不是封印在蔚来自有体系当中的,而是包装成Account kit、Media kit,可以被内部同级开发部门以及合作伙伴灵活调用。

这也很像苹果,给到第三方的kit也保证一致的体验。比如,网易云跟蔚来系统做深度适配之后,方向盘区也可以控制。最新版NOMI升级的可见即可说,可以随意抓取,开车时你能直接用语音切到下一首歌/下一个视频,标记“喜欢”。

底座支持生态以高品质体验落地,而不是一堆放在车机上的废物。

最新版上线了两个新APP。

一个是小红书,蔚来不只是把界面放到中控屏幕,而是与车的场景结合。种草点是小红书的独有资产,它不会释放给高德做成高德的POI,但是蔚来可以在地图上把种草点和目的地做链接。

如果你到西安参加NIO Day,你可以在车上挑选你的西安相关种草点生成路线。即便没开车,通过蔚来悦享当地租车,登上账号也是一样的。

另一个是腾讯停车。很多品牌不愿意干停车,因为数量大、进出复杂。目前蔚来连接了14万个智慧停车场,跟系统深度打通,你不需要进入第三方APP,在屏幕右下角快捷卡片,会自动出现车内扫码,不用再伸手扫码,或者到处找码。

很多商超停车场有自己的会员体系和支付渠道,接下去蔚来也想接入,最好还能把两个积分打通,把数字资产做双向关联。

整个生态正在飞速扩张。

蔚来通过NIO Link带入很多手机应用,比如飞书。他们把Sky Call封装成一个模板,只要提供内容的API,蔚来有一个应用模板,可以快速生成车端体验一致性的应用,这是行业首创,效率高。

至于更中长尾的APP,则是基于浏览器做快速接入,比如Apple Music。不想重复付费的苹果用户,现在能在车机上打开。

“蔚来的全体系自研能力就像一列快车,”朱太平说,“一旦打造完成,它就能越跑越快,所加的车厢都自带连接电机的能力,不是靠火车头去拉,而是大家一起跑。”

自从2.0.0以后,蔚来就越跑越快,不久就推出2.1.0版本。

蔚来或许不是每分钱都花在刀刃上,但是砸下去的必有回响。方向领先,做法扎实,拒绝乱卷的精神状态领先太多年。所以质疑蔚来,理解蔚来,成为蔚来,是一条必由之路。

请定义一下“人工智能”(AI)并解释它如何影响我们的日常生活?

人工智能(AI)是指由计算机系统或机器模拟、扩展和增强人类智能的技术。它旨在使计算机能够执行通常需要人类智能才能完成的任务,如学习、推理、解决问题、感知、语言理解和识别等。

人工智能在我们的日常生活中产生了广泛的影响。以下是一些例子:

  • 声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
  • 本文地址:https://srwj168.com.cn/keji312/15128.html
世界首创的焊接 特种兵 博清科技
苟仲文在任国家体育总局局长期间 足协施行U23和引援调节费政