视觉&amp 小时 人形机器人亮相 语音推理能力 每天打工20 地表最强

财联社8月6日讯(编辑 史正丞) 当地时间周二早晨,获得微软、英伟达、OpenAI投资的人形机器人明星企业Figure如期发布最新款人形机器人Figure 02。基于机载算力和各个组件的全方位升级,AI人形机器人朝着“进厂打工”又迈进了一大步。

顺便一提,随着人工智能大模型的飞跃式发展, 这款被不少媒体称为“地表最强人形机器人”的AI设备,也已经具备视觉推理和聊天沟通的能力——操作机器人的默认UI就是语音控制。

新产品有哪些亮点?

与2023年发布的第一代产品相比, Figure 02最为明显的区别在于外观的彻底重构 ——机器人完全采用外骨骼结构(由外皮承担负载和压力),机器人的电源和算力布线集成在机体内部,从而提高了机器人的可靠性,也使得封装更加紧实。

Figure的创始人兼首席执行官布雷特·爱德考克(Brett Adcock)透露, 为了这个设计,公司还重新定制了电线端子和连接器。

当然,人形机器人最关键的升级点,依然是如何从一堆电线、芯片和算法,拼出一个活灵活现的“打工(机器)人”。

公司披露, Figure 02身上总共装了6个RGB摄像头,分别位于头部、胸前和后背,因此这个机器人也拥有着“超人”视觉。

Figure 02身上总共装了6个RGB摄像头

配合输入的图像资料,机器人能够通过AI驱动的视觉系统感知和理解真实的物理世界。 Figure 02配备了机载的视觉语言模型(VLM),使其能够进行快速的常识性视觉推理

爱德考克表示,相较于上一代产品, Figure 02的机载计算和AI推理能力翻了3倍 ,使得许多真实世界的AI任务能够完全自主执行。公司的AI数据引擎将不断提供最新的模型,供机器人在本地GPU上运行。

除了视觉以外, Figure 02也搭载了公司投资人OpenAI专门定制的语音到语音推理模型 ,通过机载麦克风和扬声器与人类进行对话。爱德考克也透露,这个机器人的默认UI是语音。

Figure 02也搭载了公司投资人OpenAI专门定制的语音到语音推理模型

虽然在谷歌和OpenAI的较劲升级后,AI实时语音聊天已经不再是夺人眼球的新鲜功能,但对于人形机器人而言,应用这项技术仍有重大的意义。毕竟这个70公斤的大铁块,迟早有一天将会与人类在同一个屋檐下“打螺丝”,能够响应语音指令,将会是人类重要的安全工具。

在投资者最为关心的连接器等方面,Figure并没有给出明确的信息。公司仅表示, Figure 02上搭载的第四代机械手具备16自由度,拥有与人类相当的力量,能够完成许多近似人类的工作 。同时整个机械手的机械、电器、控制和传感器设计,都是由公司内部完成的。

图为Figure在展示机械手

最后,这台机器人还有一个不怎么起眼但很重要的升级, 机器人内部的电池组容量提高了50%至2.25KWh 。爱德考克解释称,这个设计旨在最大限度地延长机器人的运行时间, 公司希望Figure 02能够实现每天实际有效的工作时间超过20小时。

值得一提的是,公司官网的参数说明一栏中,显示Figure 02的续航时间只有5小时。合理推断爱德考克提供的应该是“充电+干活”的极限工作时间。

稍有遗憾的是,Figure公司目前并没有广泛推出Figure 02的时间表,仅暗示各位吃瓜群众不要把想象力局限在“机器人进厂打螺丝”上。公司表示, Figure 02将人类形态的灵巧性与先进的人工智能相结合,可以在商业应用中执行各种任务,并且在不久的将来,还可以在家中执行各种任务。

已经“进厂”

作为发布前的试验,宝马汽车的装配厂已经接纳过一批Figure 02“实习工人”。除了主动执行汽车装配的程序外,AI也能自动识别和纠正已习得行为习惯的错误。

宝马集团也在周二发表公开声明称,Figure 02在美国斯帕坦堡工厂试运行期间,从事的是将钣金部件插入特定装置的工作, 机器人必须特别灵巧才能完成这个工作 。宝马集团表示, 使用机器人可以避免员工从事不符合人体工程学的笨拙、累人任务 。集团正在与Figure一起测试和评估,如何在汽车生产中安全地使用人形机器人。

宝马集团生产管理委员会成员Milan Nedeljković表示,通过早期的测试,双方现在正在确定人形机器人在生产中的可能应用。


视觉是什么意思

视觉的解释

物体的影像 刺激 眼睛 所产生的感觉 详细解释 物体的影像刺激视网膜所产生的感觉。 胡适 《答蓝志先书》 :“ 其实 ‘拼音文字’是双方的,拼的音是‘听觉的’,拼成的文字是‘视觉的’。 ” 瞿秋白 《<饿乡纪程> 绪言 》 :“这个阴影呵!他总在我眼前晃着-- 似乎 要引起我的视觉。 ”

词语分解

视的解释视 (视) ì 看:视觉。 视力。 视野。 鄙视 。 注视。 近视。 视而不见。 熟视无睹 。 亲临某事: 视事 。 视察。 看待: 藐视 。 重视。 等闲 视之。 看望 :探视。 省(媙 )视。 比照:“天子之卿受地视侯”。 古同“示” 觉的解释觉 (觉) é 人或 动物 的器官受刺激后对事物的感受辨别:感觉。 知觉。 触觉。 视觉。 觉察。 醒悟 : 觉悟 。 觉醒。 “觉今是而昨非”。 觉 (觉) à 睡眠(从睡着到睡醒):午觉。 睡了一 大觉 。 笔画数:;

视觉的意思

视觉的意思是视知觉。

一、视觉的中文释义如下:

1、所谓视觉,也即视知觉。 大传统心理学中,一般认为,知觉是对客观刺激物的直接反映,是人的心理过程中低层次的认知心理现象,视觉艺术不同于听觉艺术,它是看的见,用手摸的到的艺术,强调真实性。

2、视觉:光线刺激眼睛引起的感觉。 包括对外界物体的明暗、形状、运动和颜色的辨别。 由光的刺激引起视网膜兴奋,经视神经传导到大脑的视区而产生。

二、视觉的造句:

1、在建筑装饰设计中合理利用视错觉,可以给设计创作带来与众不同的艺术效果,给人以标新立异的视觉感受。

2、减少的视网膜神经纤维层和黄斑面积与视觉准确度有明显的相关性,低的视觉对比准确度和视野均差在多发性硬化患者中为低。

3、确切地说,它们是视觉艺术家们的作品。 在这些作品中,艺术家们深刻地领悟了视觉系统的活动,从而创造出视觉幻象。

4、整个透视结构是依据单眼视觉和一种阿尔贝蒂研究的那些,似乎改变他们外观形象的视觉分析方式而构建的。

5、艺术效应的产生,从视觉主体来看,是由过去的生活积淀、视觉经验同视觉所见共同整合而成的,是所知与所见相交融的结果。

6、我们知道鸟类采用视觉,听觉,可能还有振感或触觉来寻找食物,但是视觉是起支配作用的。

视觉是什么?

图像处理,用计算机对图像进行分析,以达到所需结果的技术。 计算机视觉是一门研究如何使机器“看”的科学。 计算机视觉应用于:视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断,和军事等领域中各种智能/自主系统中不可分割的一部分。 具体的问题可以咨询容联。 北京容联易通信息技术有限公司(简称容联),国家高新技术企业,专业的智能通讯云服务商。 容联总部位于北京,在上海、广州、深圳、武汉、成都、杭州、贵阳、东京等地设有分支机构。 目前拥有员工超过1000人。 拥有专利申请数十项、软著数百件,通过软件CMMI5认证。

  • 声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
  • 本文地址:https://srwj168.com.cn/keji312/6956.html
卢锋 改革新征程与经济新观察 许宪春 杨志勇 赵波
重获自由一个月 人人影视创始人梁良致歉 机房硬盘等设备将出售