消息称李飞飞正建立初创公司开发可理解3D空间关系的AI系统

作者： 2024年05月05日财经浏览

IT之家 5 月 5 日消息，当地时间周六，据路透社援引 6 名知情人士消息，计算机科学家李飞飞正在建立一家初创公司。该公司旨在利用类似人类的视觉处理技术，使 AI 具备高级推理能力，有望成为 AI 技术的一次飞跃。

IT之家注：李飞飞被广泛称为“AI 教母”，与通常用来指因 AI 技术突破而在 2018 年获得图灵奖的三位研究人员的“AI 教父”对应。这三名“AI 教父”则是杰弗里・辛顿、杨立昆、约书亚・本西奥。

一位消息人士通过李飞飞上个月在温哥华 TED 大会发表的演讲，对这家初创公司进行了详细描述：李飞飞曾表示，最前沿的研究涉及一种算法，这种算法可以合理地推断出图像和文字在三维环境中的样子，并根据这些预测采取行动，使用的概念叫作 “空间智能”。

李飞飞曾展示一张猫伸出爪子把杯子推向桌子边缘的图片。她说，在一瞬间，人脑就能评估 “这个玻璃杯的几何形状、它在三维空间中的位置、它与桌子、猫和其他一切的关系”，然后预测会发生什么，并采取行动加以阻止。目前，她在斯坦福大学的实验室正试图“教计算机如何在三维世界中行动”，例如使用大型语言模型让机械臂执行任务、根据口头指令开门和制作三明治等。

报道称，当前有不少声音认为，在人工智能模型实现人工通用智能（AGI）之前，必须先建立起这种 “推理 ”能力。“推理 ”能力指的是一个阈值，在这个阈值上，系统可以像人类一样或更有能力地完成大多数任务。

人工智能的发展前景趋势？

1、机器视觉和语音识别是主要市场

技术层是基于基础理论和数据之上，面向细分应用开发的技术。中游技术类企业具有技术生态圈、资金和人才三重壁垒，是人工智能产业的核心。相比较绝大多数上游和下游企业聚焦某一细分领域、技术层向产业链上下游扩展较为容易。

该层面包括算法理论(机器学习)、平台框架和应用技术(计算机视觉、语音识别、自然语言处理)。众多国际科技巨头和独角兽均在该层级开展广泛布局。近年来，我国技术层围统垂直领城重点研发，在计算机视觉、语音识别等领城技术成熟，国内头部企业脱颗而出，竞争优势明显。

2、计算机视觉发展历经三大理念，规模突破400亿元

1982年马尔(David Marr)《视觉》(Marr，1982)一书的问世，标志着计算机视觉成为了一门独立学科。计算机视觉的研究内容，大体可以分为物体视觉(object vision)和空间视觉(spatial vision)二大部分。物体视觉在于对物体进行精细分类和鉴别，而空间视觉在于确定物体的位置和形状，为“动作(action)”服务。正像著名的认知心理学家所言，视觉的主要功能在于“适应外界环境，控制自身运动”。适应外界环境和控制自身运动，是生物生存的需求，这些功能的实现需要靠物体视觉和空间视觉协调完成。

计算机视觉近40年的发展中，尽管人们提出了大量的理论和方法，但总体上说，计算机视觉经历了三个主要历程。即：马尔计算视觉、多视几何与分层三维重建和基于学习的视觉。

国际市场研究机构Research And Markets发布的最新报告显示，2019年全球计算机视觉市场规模为46.433亿美元，预计到2027年将达到950.805亿美元，从2020年到2027年，预计年复合增长率为46.9%。

3、语音识别发展科追溯到1956年

语音识别的研究工作可以追溯到20世纪50年代。在1952年，AT&T贝尔研究所的Davis，Biddulph和Balashek研究成功了世界上第一个语音识别系统Audry系统，可以识别10个英文数字发音。这个系统识别的是一个人说出的孤立数字，并且很大程度上依赖于每个数字中的元音的共振峰的测量。1956年，在RCA实验室，Olson和Belar研制了可以识别一个说话人的10个单音节的系统，它同样依赖于元音带的谱的测量。到21世纪之后，深度学习技术极大的促进了语音识别技术的进步，识别精度大大提高，应用得到广泛发展。

目前，语音识别技术已逐渐被应用于工业、通信、商务、家电、医疗、汽车电子以及家庭服务等各个领域。例如，现今流行的手机语音助手，就是将语音识别技术应用到智能手机中，能够实现人与手机的智能对话功能。其中包括美国苹果公司的Siri语音助手，智能360语音助手，网络语音助手等。

随着语音技术和自然语言理解技术的快速进步，AI语音语义技术已在智能翻译、智能医疗、智能汽车、智能客服、互联网语音审核等多个领域实现场景应用。

疫情之后不仅是工业领域，政务服务领域的语音机器人、传统行业企业的语音机器人也将有较高的市场增长空间。另外，NLP、AI数字员工、RPA的发展，一定程度上也将重塑AI应用场景。

2018年，全球智能语音市场仍呈现快速增长趋势，市场规模为142.1亿美元，根据预测到2024年全球智能语音市场规模将达到215亿美元，其中智慧医疗健康、智慧金融以及各类智能终端智能语音技术需求将成为主要的驱动因素。

4、美国AI高层次学者数量大幅领先

AI高层次学者是指入选AI 2000榜单的2000位人才，由于存在同一学者入选不同领域的现象，经过去重处理后，AI高层次学者共计1833位。从国家角度看AI高层次学者分布，美国A1高层次学者的数量最多，有1244人次，占比62.2%，超过总人数的一半以上，且是第二位国家数量的6倍以上。中国排在美国之后，位列第二，有196人次，占比9.8%。德国位列第三，是欧洲学者数量最多的国家;其余国家的学者数量均在100人次以下。

—— 以上数据参考前瞻产业研究院《中国人工智能行业市场前瞻与投资战略规划分析报告》

人工智能领域哪些高校实力强？

高校建立的实验室与大公司有所不同，其研究项目除了偏应用科学的领域，还有一些属于基础理论研究的项目，是无法从具体的产品上表现的，通常高校实验室会同时进行两种领域的研究甚至侧重后者，考虑到高校在学术界的地位，人们在关注实验室研究内容的时候除了关注它的产品，同时也应该注意其在基础研究领域的水平。

麻省理工学院

MIT的人工智能实验室全称叫CSAIL (ComputerScience and Artificial Intelligence Laboratory)。最初，这是两个实验室：计算机实验室创办于1963年，人工智能实验室创办于1959年，两个实验室在2003年正式合并。

CSAIL是MIT最大的实验室，也是世界上最重要的信息技术研发中心。CSAIL的成员创立了多于100家知名公司，包括机器人之父科林·安格尔，iRobot公司创始人之一海伦·格雷纳，波士顿动力公司创始人马克·雷伯特，还有卡内基·梅隆大学机器人研究所的负责人马特·梅森。

MIT也几乎是顶尖技术的代名词。它在去年底发布了2015年CSAIL的主要创新，包含3D打印心脏，可以爬楼梯、开门甚至驾车的机器人，癌症预测工具等。

斯坦福大学

斯坦福大学的人工智能实验室成立于1962年，50多年来一直致力于推动机器人教育。由于斯坦福与硅谷的特殊联系，斯坦福的学生有更多机会将他们的发明商业化。斯坦福大学在2014年底宣布了一个长达100年的人工智能研究计划，可见其在人工智能研究方面的投入和决心。

另外，斯坦福大学在网上公开了许多他们有关机器人和深度学习的课程。在斯坦福人工智能实验室的教授团队中，最为华人熟悉的是Andrew Ng（吴恩达），他是世界上machine learning（机器学习）领域的大师，在斯坦福教授的machine learning课程十分受欢迎。同时，他还曾在Google公司的“谷歌大脑”项目中担当要职，帮助谷歌建立全球最大的“神经网络”，这个神经网络能以与人类大脑学习新事物相同的方式学习现实生活。2014年，Andrew加入网络担任网络首席科学家。

斯坦福的华人李飞飞参与建立了著名的ImageNet计算机视觉识别数据库及挑战赛，其每年都会吸引各大公司的图像识别程序的参加，极大促进了图像识别领域的技术发展。目前，李飞飞是斯坦福人工智能实验室的主管。

卡内基梅隆大学

卡内基梅隆大学在1979年成立了Robotics Institute（机器人学院），专门在机器人科技领域进行实践和研究，这个学院还是全世界第一个推出机器人PHD项目的大学。在该学院下面还设有National Robotics Engineering Centre （NREC），与政府及商业机构合作，进行高端项目研究。

同时，卡内基梅隆大学还是NASA航空航天科研任务的主要承制单位之一,该校的机器人研究所从事过自动驶车、月球探测步行机器人,单轮陀螺式滚动探测机器人的研究。

加州大学伯克利分校

加州大学伯克利分校是最负盛名的公立学校。该校的机器人和智能机器实验室，致力于用机器人复制动物的行为。它的自动化科学和工程实验室从事更广泛的机器人功能的研究，如机器人辅助外科手术和自动化制造。还有计算机可视化小组，学生可以学到如何帮助机器人能“看的见”。

加州大学伯克利分校研发的一个机器人可以自己拧开瓶盖。

布里斯托大学

布里斯托大学智能系统实验室（Intelligent Systems Laboratory，ISL）的研究领域涵盖了机器学习，数据分析和挖掘，图像识别等多个领域，除了专精计算机科学和工程学外，布里斯托大学还非常注重计算机科学在其他领域学科中的交叉应用。去年3月，该实验室由人工智能教授尼洛·克里斯蒂亚尼（Nello Cristianni）所带领的团队在一项新的研究中首次使用算法分析了13万多篇网上有关2012年美国总统大选的媒体报道，总结出了大选年媒体的表达规律从而判断出他们对政党的态度。这是一项典型的大数据与社会学的综合研究。ISL的负责人目前是Colin Campell

耶路撒冷希伯来大学

以色列以科技创新闻名于世，那里的希伯来大学虽然没有专门的人工智能实验室，但在人工智能领域取得的成就却丝毫不逊于很多专门成立了实验室的学校。希伯来大学还拥有世界上第一家技术转让公司Yissum，独家负责希伯来大学发明创造的商业化应用。希伯来大学最著名的发明应该数自动驾驶系统Mobileye，它于今年被Tesla采用，视为在自动驾驶领域对抗谷歌的武器。

牛津大学

牛津大学也没有专门的人工智能实验室，但其在深度学习方面的实力也不容小觑，14年谷歌先是收购了人工智能公司DeepMind，然后在年底展开了与牛津大学的合作，雇佣了7位深度学习领域的专家，其中3位仍然保留牛津大学教授的职称。正是这些人和DeepMind一起研制出了后来名扬天下的AlphaGo。

Dalle Molle

瑞士意大利语区高等专业学院Dalle Molle人工智能研究所（意大利语Scuola universitaria professionale della Svizzera italiana - Istituto Dalle Molle di studi sullintelligenza artificiale）是一个非营利性的人工智能研究机构，隶属于卢加诺大学信息学院，瑞士意大利语区高等专业学院信息技术部以及瑞士南方的应用科学大学。

研究所致力于机器学习，包括人工神经网络和强化学习，目前，该实验室正在研制一种用于无人机搜救的人工智能系统，可以识别出复杂的从林中需要救助的对象，如迷路的人或登山队员。

SCIAI全称为锡耶纳大学人工智能研究所（The Siena College Institute for Artificial Intelligence），它与布里斯托大学一样比较重视计算机科学与其它科学，如经济学、社会学、医学等领域的联合应用。并且它还比较重视有关AI的伦理问题和AI应用后对社会可能的冲击的研究。我们认为后者应该属于AI领域的基础理论研究，因此尽管其没有有名的产品和合作，我们也将其选入了进来

苏黎世理工

苏黎世联邦理工学院的人工智能实验室在机器视觉和深度学习、机械工程等方面有深厚的积累。培养出了无数人工智能领域的人才。国内外的许多AI公司的CTO都毕业于该校的计算机视觉领域。

在其人工智能实验室成立25周年之际，苏黎世理工展示了他们建造的最新的一款人形机器人，其结构设计看起来同人类的肌肉-骨骼系统颇为相似。其分布式自动控制实验室甚至制造出过一款带有球拍的、可以用来打球的四旋翼无人机系统“Quadrators”。

“元宇宙”火了，这玩意到底是啥？

元宇宙，英文名Metaverse，是一个平行于现实世界的虚拟世界。

从概念层面理解，目前元宇宙定义很多，但大致相同的说法是：元宇宙是利用多种科技手段进行链接与创造的，与现实世界映射、交互的虚拟世界，是具备新型社会体系的数字生活空间。

从技术层面理解，它是由5G、区块链、云计算、3D引擎、VR/AR/XR、数字孪生等多项互联网前沿技术融合，构成的基于真实世界的虚拟空间，并可与真实世界产生链接和互动。

元宇宙的核心要素包括极端沉浸化体验、极度丰盛的内容生态、超时空社会系统和虚实互动的经济系统。这就表明随着相关技术的不断深入，元宇宙将实现极大的可延展性，或许会如同今天的移动互联网一样，影响到人们生活的方方面面，目前已经眼见为实并正逐步普及的包括：

去中心化金融：依托区块链技术，实现资产的数字化，存钱取钱包括贷款无需再跑银行，一切皆可线上进行；个人资产更加安全明晰，重要实物资产也可上链确权，所有财产数据化。

NFT-元宇宙创业：毫无疑问的是，以元宇宙为依托的资产数字化，必将推动NFT产业繁荣，一切皆可NFT，现实世界中的所有物品均可转化为元宇宙中的虚拟财产，这就需要一大批元宇宙虚拟资产的自由创作者，发挥自己特长为元宇宙世界繁荣添砖加瓦，成就一种新的自由职业。

元宇宙虚拟办公：不同于传统远程线上办公，元宇宙虚拟办公可借助3D场景搭建和虚拟数字人、AR/VR等虚拟技术，实现沉浸式的线上办公，在一些专业线上办公软件的加持下，可以实现更好的现场协作办公、沟通，甚至比当面沟通更加高效，未来在家就可实现真正的上班。

元宇宙会议会展：这是当下企业级应用比较多的一种形式，通过3D场景、云算力、虚拟数字人等技术，实现跨时空、沉浸式、多元互动的数字会议展览，省钱省心省力，更高效。

诸如此类，元宇宙带给人们工作、生活的变化将是革命性的，效果也正逐步突显。基于各种新需求，国内一些多接口元宇宙生态平台也逐渐出现，比较具有代表性的是网络希壤、云控蜂核#11维空间#等，虚拟城市街区规划，多生态多场景多应用空间融合，基本都是以个人元宇宙体验为核心，链接企业级元宇宙应用需求，实现闭环可持续的元宇宙生态建设。其中11维空间还开通有个人艺术空间、家园空间、体育空间、三国文化空间、时光复刻、《萌宠向前冲》游戏空间等，生态和玩法十分丰富多样，并可赋能UGC创作者数字资产流转。在安卓或ios端均可畅玩，通过安卓或ios端应用商店搜素11维空间，即可很方便下载畅玩。

声明：本站内容均来自互联网，仅供演示用，请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系，我们将在24小时内删除。
本文地址：https://srwj168.com.cn/caijing/4702.html

人工智能的发展前景趋势？

人工智能领域哪些高校实力强？

“元宇宙”火了，这玩意到底是啥？

相关文章