李开复谈大模型价格战 但疯狂降价是双输 推理成本将每年降10倍

微软

21世纪经济报道记者白杨 北京报道

李开复

市场久违的价格战,正在大模型领域上演。

5月21日上午,阿里云宣布通义千问大模型降价,其中Qwen-Max模型价格降至0.04元/千tokens,降幅达67%,而主力模型Qwen-Long的价格降至0.0005元/千tokens,降幅达97%。

降价后,通义千问大模型的最低价格已经达到1元200万tokens。

当天下午,百度云采取了更激进的策略,直接宣布文心大模型两个主力模型(ERNIE Speed和ERNIE Lite)将全面免费。这也意味着大模型迈入了免费时代。

在此之前,率先打响价格战的是字节跳动旗下的火山引擎。5月15日,火山引擎发布豆包大模型,并宣布豆包通用模型pro-32k在企业市场的定价为0.0008元/千 tokens,相当于1元125万tokens,号称比行业便宜99.3%。

推理成本将一年降10倍

对于这一轮大模型降价,零一万物CEO 李开复向21世纪经济报道表示,未来整个行业的推理成本每年降低10倍是可以期待的,而且这个趋势是必然的。对于行业来说,现在模型的API调用还是非常非常低的比例,如果推理成本一年降低10倍那就有更多的人可以用上大模型,这是非常利好的消息。

然而,对于激烈的价格战,李开复指出,类似于ofo的疯狂降价是一种双输的策略。他认为大模型公司应该不会这么不理智,因为技术还是最重要的,如果技术不达标,仅仅依靠赔钱做生意是不可持续的,零一万物也绝对不会跟这样的定价来做对标。

据记者了解,零一万物最新发布的Yi-Large模型的定价是20元100万tokens。李开复称,“我们现在还没有调整价格的打算,Yi-Large上线后的反馈是非常正面的,也有很多忠诚的爱好者已经加入,我们先服务好他们”。

不过,李开复也坦言,“如果以后中国大模型市场就是这么卷,大家宁可赔光通输也不让你赢,那我们就走外国市场”。

谈到零一万物的商业化策略,李开复表示,“我们也在走企业级方向,但是初步用户会在国外”。他认为,国外用户的付费意愿和金额远高于国内,因此尽管零一万物也非常希望服务国内企业,但是按照现在国内TOB卷的情况,我们可能做一单赔一单,这种情况在AI1.0时代看的太多,所以零一万物将坚决不做。

差距从7-10年缩短至6个月

过去一年多,中国大模型一路狂奔,并取得了诸多进展。

“现在如果用国际最好的大模型和国内最好的大模型相比,那还是有一定的差距。但同时要考虑的是,比如谷歌团队是2000人,OpenAI是1000人,而像零一万物把模型加infrastructure团队加起来也不到100人,更不用说使用的GPU算力不到他们十分之一,模型尺寸也不到他们的十分之一了”。李开复说。

所以从效率上来讲,中国大模型的已经远远超过国际顶尖大模型。李开复也提出,“一年前我们落后OpenAI跟谷歌开始做大模型研发的时间点有7到10年,那现在我们跟他们的差距只有6个月左右。”

据零一万物披露,在LMSYS盲测竞技场最新排名中,零一万物的Yi-Large总榜排名世界模型第七,中国大模型中第一,已经超过Llama-3-70B、Claude 3 Sonnet。

“我们发布的模型在今年5月的时候,可以打败去年11月之前的任何模型,这也是落后6个月差距的由来”。李开复说,但在其看来,这6个月的差距也不是很大,因为中国在以一个不可思议的超级速度进行追赶。

比如在算力方面,国外厂商确实有更大的优势,但是,中国厂商能够把同样的一张GPU挤出更多价值来,这是中国厂商能够达到现在水平的重要理由。

另外在模型优化方面,不只是纯粹的科技和算法问题,还涉及数据配比、优化训练等各种方面的技术,在这些方面,中国厂商也不输于美国。

“我在写《AI·未来 》这本书时提到,美国在做突破性科研方面,全世界没有对手。但是在同一本书里我也提到,中国人的聪明、勤奋、努力是不容忽视的。后发有后发的优势,美国的创造性,我们有很多学习的地方,但是比执行力,比做产品,我们强于美国公司”。李开复说。


商业图谱什么意思-读《人工智能——李开复谈AI如何重塑个人、商业与社会的未来图谱》

关于知识图谱的几个问题

1.为什么知识图谱对于机器实现人工智能如此重要呢?

2.自然语言的理解为什么需要知识图谱?

大模型 推理成本将每年降10倍

3.知识图谱为什么商业前景很好?

读《人工智能——李开复谈AI如何重塑个人、商业与社会的未来图谱》

时下人工智能是非常热门的话题,尤其是2017年5月围棋程序AlphaGo战胜李世石的事件掀起人工智能的热潮。人工智能的发展,促使我们面对几个问题:人工智能是什么,有什么影响,如何应对?作为人工智能领域的专家,产业推动者,思想布道者,李开复先生通过这本书解答了我们的问题。这本书内容丰富,几乎涉及到人工智能的方方面面,但是感觉结构有些松散。总的来说作为一本科普读物,还是给予我很多启发。

一、什么是人工智能

人工智能的概念从计算机发明之初就已经提出,图灵提出的图灵测试,就开始思考人工智能的发展并给出了测试方式。书中列举了历史上对于人工智能定义的演进过程,与定义的抽象相反,人工智能现在已经实实在在的在我们身边,例如智能助理、新闻推荐、机器视觉、AI艺术、新搜索引擎、阿尔法狗等。书中用高德纳技术成熟度曲线论证,现在的人工智能热潮与以往有本质的区别,它实现了语音识别、机器视觉、数据挖掘等多个领域追上甚至超过了正常人类水平,突破了心理阈值,进入真实应用场景,并与商业模式紧密结合,在产业界发挥真正的价值。

深度学习造就了当下的人工智能,是背后的关键技术。2006年,杰弗里.辛顿及其合作者用一篇《一种深度置信网络的快速学习算法》的论文宣告了深度学习时代的到来。深度学习算法来自人工神经网络技术,技术灵感来源于对于人类神经节的沿着网状结构传递和处理信息的假说,历史上这个技术因为“异或难题”陷入停滞,直到1975年这个问题被解决,人们又开发出多层神经网络技术,到2010年后逐步成熟。

书中对深度学习这种神秘的算法作了形象且容易理解的介绍。从根本上来说,深度学习和所有机器学习方法一样,是用数学模型对真实世界的特定问题进行建模,以解决该领域内相似问题的过程。用人类小朋友学习认字的过程类比,计算机要总结出文字规律,以后看到类似的图案,按照之前总结的规律知道图案是什么,这个过程叫做“计算机学习”。学习对象叫做“训练数据集”,数据集中的数据通过“特征”区别,计算机“建模”来总结出模型。计算机学习有不同的算法,如决策树。深度学习的特点是在表达能力上灵活多变,同时允许计算机不断尝试,直到逼近目标。从数学的角度,深度学习与传统机器学习方法本质上没有实质差别,都希望在高维空间中,根据对象特征,将不同类别的对象区别开,但是他的表达能力比传统机器学习高明。具体一点来说,可以把学习的对象看成一大堆数据,把数据丢进一个复杂的、包含多个层次的数据处理网络(深度神经网络),然后检查经过这个网络处理得到的结果数据是不是符合要求,如果符合就保留模型,否则就继续调整,直到输出满足要求为止。书中举了水池阀门的例子。这种方式所需要的是计算机用特定的方式近乎疯狂的调节所有流量调节阀,不断试验,摸索,增加层数、变量数量,加大算力、加大数据量,直到凑出最佳模型。所以指导深度学习的基本是一种实用主义。

到这可以看出,深度学习算法有效发挥作用的前提,一是芯片计算性能、处理能力大幅度提升,二是因为互联网长夜发展带来的高质量海量数据。在这两个条件成熟后,基于深度学习的人工智能随之强大起来。

有点玄妙的是,深度学习算法很有效,但做出模型出来后,设计模型的人也无法能够说得清楚为什么,因果关系是什么。有史以来最有效的机器学习方法,在许多人看来是一个“黑盒子”,由此也会引发一个问题:人们开发出自己无法理解的程序,只知道它做了什么,但是不清楚它掌握的是一种什么样的规律,这种学习程序会不会失控?

二、人工智能的影响

对于人工智能讨论的最热烈的应该是科幻电影吧,《骇客帝国》、《攻壳机动队》、《我,机器人》、《终结者》,这个名单可以很长讨论了无数种可能。简单的归类,分为乐观和悲观两种观点。

人工智能对我们有威胁么?电影喜欢这种设置,人工智能发展超过了人类的控制,人类被赡养、奴役或者消灭。我觉得的确是杞人忧天了。

书中对人工智能进行分类:弱人工智能、强人工智能、超人工智能。书中观点是,我们现在能够看到的是弱人工智能,就是应用型人工智能,专注于且只能解决特定领域问题的人工智能;强人工智能,又称通用型人工智能,可以胜任人类所有工作的人工智能,具有在不确定环境下推理、策略、解决问题、制定决策、有常识、规划、学习、沟通等,强人工智能可以替代人类。但是这里,强人工智能是否有“意识”?这个问题很复杂,如果人工智能有了自我意识,那么跟人类有区别么?人和机器的关系,就不是人和工具的关系了;超人工智能,假设人工智能继续发展,可以比世界上最聪明的人,最有天赋的人还聪明,这个定义比较模糊,因为已经超过人类的理解,只能从哲学、科幻的角度去解析了。

书中有个关于是否奇点来临的讨论,前阵子很流行所谓“吓尿指数”,人们发现人类的科技水平是加速发展,且短短百年,人类已经远远超过了历史。因此人们也担心这种加速度趋势,会使得强人工智能和超人工智能快速发展,一旦奇点来临,人类命运是难以预料的,就像美洲土著无法预料科技先进的欧洲殖民者到底会带来什么影响。按照书中的观点,特定的科技如人工智能,在一段时间的加速度发展后,会遇到难以逾越的技术瓶颈,例如芯片性能。他的结论是,在一定时期内,都是人类的工具,很难突破人工智能的门槛。霍金的忧虑是机器与人在进化速度上的不对等,人工智能可以加速度进化,但是人类的进化有限。此外,还有失业问题。

总的来说,我赞同书中观点,在我有生之年可以见到弱人工智能的充分发展,也许可以看到强人工智能的出现,但是超人工智能还是在科幻电影里。我们能够看到的,更大的可能是一个人与作为工具的人工智能协作发展的景象。

三、如何应对人工智能时代

人工智能时代到来是无法回避的客观事实,从乐观的角度来看,人工智能可能是人类社会全新的一次大发展,与三次工业革命一样重要,人类因此生活在完全不同的时代,个性和自由可以得到更大的发展。人们的联系的效率,生产的效率提高,引起的社会、经济的变化。顺应时代潮流是理性的选择。

首先面对的问题是工作,我们的工作会被取代么?书中给出经验法则:“五秒钟原则”,如果人可以在5秒内对工作中所需要思考和决策的问题作出相应的决策,那么这项工作很有可能被替代。想一想自己的工作真是有点担心。但如果涉及到缜密的思考,周全的推理和复杂的决策,那么久是很难取代的。有专家认为,那些有清晰的评估标准,工作业绩可以被客观的衡量的,人工智能容易取代。在未来,无论什么样的层次工作,都会跟人工智能合作进行,以让高级人才发挥他们的技能特长,着眼于最不容易被自动化的工作。这种趋势已经很明显,各行各业都开始了AI+的过程。既然人工智能在某些领域会做的远远比人类好,我们要考虑的是作为人类的话要如何捍卫自己的价值。做那些人工智能做不好的事情,例如跨界推理、抽象能力、小样本和无监督学习能力、知其然知其所以然的能力、建立整体体系的能力、常识能力、自我意识、审美、情感等。

其次面临的问题是教育,我们需要什么样的教育?书中从社会结构的角度来讨论这个问题,传统的社会结构是金字塔型,在人工智能时代,金字塔会更加合理和高效,底层从事基础工作、重复性劳动的人会减少,但金字塔不会坍塌,更多的可能是在现有基础上自我调整。乐观的来说,随着生产力的发展,更多的人从繁重的生计中解脱出来,可以或者说必须投入更加人性化的领域。因此,教育体制需要进行大调整,要培养更多博学、专深、领导、艺术人才,增强人机协作的技能。更多培养如思考、创造、沟通、情感交流、人与人的依恋、归属和协作、综合感悟和对世界的想象力等人所特有的能力。仅靠记忆和练习就能掌握的技能是最没有价值的,几乎一定可以由机器来完成。死记硬背的应试教育和计算能力是最无用的技能了。只有人的个性才是人工智能时代人类的真正价值。从表现形式来看,作者举了两个前沿的例子,一个是密涅瓦大学,一个是清华的的“姚班”,他总结人工智能时代的核心、有效的学习方法是,主动挑战极限,从实践中学习,关注启发式教育,互动式在线教育,主动向机器学习,学习人与机器的协作,学习要追随兴趣。找到一个不容易被机器替代的工作,无论是为了美还是为了好奇心。

书中也对未来产业发展进行了阐述。自动驾驶是人工智能最大的应用场景,充满想象。它会带动新的业态,新的基础设施建设,新的生活方式,这对我来说是个福音。作者还详细的阐述了自动驾驶技术的发展情况,他认为中国发展自动驾驶技术的优势是很大的,可以扮演关键角色。一个是因为法律和道德上宽容度更高,一个是基础设施建设是我们的长项。另一个人工智能目前被看好的是智慧金融。利用深度挖掘大数据,在量化交易,智能投顾,风险防控、安防和客户身份识别、智能客服精准营销等上具有优势;翻译、智慧医疗。智慧医疗是我很看好的,医疗资源紧缺,通过人工智能的辅助,可以提高效率和受众面,顶尖医生可以腾出精力来进行研究真正具有挑战性的科研。书中还对人工智能创业,从国家战略到企业层面进行了阐述,中国政府拥有更强大的执行能力,中国也有优秀的科研人员。此外,也还讨论了人工智能时代的信息安全问题的担忧和建议。

四、给我的启示

生活在这个时代是幸运也是不幸的。说幸运,是因为我们处于变革期,有机会看到未来颠覆性的发展。不幸是要调整自己面对不确定性,而且可能见不到“强人工智能”的充分发展和“超人工智能”。

推理

乐观的来看,未来由于从低端的劳动中解脱出来,人可以投身内心真正渴求的工作,为自己的热爱而工作,生活体验将更加丰富多彩。人工智能将创造出更多的财富,大多数人可以更加自由的生活,将会有更好的新的社会福利体系。由于人工智能的出现,人再次确认自己的独特价值,就是有自主意识,可以解悟生命的意义和死亡的内涵,因为生命有限,才能使得思想和命运如此宝贵。书中引用法国哲学家布莱兹的话:“人只不过是一根芦苇草不过,人知道自己要死亡以及宇宙队他所具有的优势,而宇宙对此一无所知,因而我们的全部尊严在于思想”。不断提高自己,善于利用人类的特长,善于借助机器的能力,将是未来社会里各领域人才的必备特质。

同时,人工智能的发展必然会带来严重的问题,从历史上来看,生产力的发展,尤其是初期,会带来诸多社会问题,给当时的人们带来痛苦,新技术也未必会普惠到大多数人,可能会造成更大的社会不公。即使从目前来看,信息安全问题、接受的信息被过滤操纵(如剑桥分析事件)就非常严重,我们面临的危险更多了。

初识BioNano图谱技术

最近看文献,发现有的文章在组装过程中同时依赖了BioNano图谱和Hi-C技术来进行辅助组装,学习一下BioNano技术。

BioNano图谱也好,Hi-C也好,都是用来将Scaffold来锚定到染色体上,辅助组装。那么先回顾一下在这两个技术之前所用的方法。

1、传统锚定方法

传统的染色体锚定方法有基于物理图谱和遗传图谱的两种方式,前者主要是通过序列的重叠关系来确定Scaffolds在染色体上的位置信息,后者主要是利用减数分裂时期的姐妹染色单体联会后的重组率来判断Scaffolds在染色体的排序和方向。在实际操作过程中,传统的锚定方法存在实验难度大、成本高和实验误差大等问题。__

2、基于染色质构象捕获技术的锚定方法

Hi-C技术的基本原理如下:首先对处于生命状态的细胞使用交联剂将染色质固定,最常使用的交联剂是甲醛;接着利用限制性内切酶如HindIII酶切消化被固定的染色质;随后使用生物素标记的核苷酸填充黏性末端;在稀释环境中进行平末端填平反应,促进交联的染色质片段之间的连接;随后使用超声波对捕获_DNA片段进行打断处理,最后将被生物素标记的DNA片段通Illumina平台进行测序,得到全基因组染色质互作矩阵。将得到的DNA序列比对到参考基因组上,如果一对序列对应于不同位置的酶切片段,那么就认为这两个片段之间有一次染色质互作,从而能够构建基因组中所有酶切片段之间互作频率矩阵。

Hi-C技术产生的染色质互作呈现出随着距离增加而衰减的规律,也就是说染色体内部的相互作用强于染色体之间的相互作用,同一染色体上距离较近的互作强于距离较远的互作。正是基于这一规律,Hi-C技术可以用来锚定Scaffolds,同时可以指Scaffolds在染色体上的排序和定向。参考Hi-C测序及测序数据特征

3、基于光学谱图技术的锚定方法

光学图谱技术最早由Schwartz等(1993)发明,近期BioNanoGenomics公司推出的Irys光学图谱系统,才真正使光学图谱技术得到商业化应用(Lametal.,2021)。Irys系统利用特定的限制性内切酶和特殊的荧光标记对长达几百kb的单链DNA分子进行成像,利用高质量图像使基因组结构通过酶切图谱的形式展现。

光学图谱的基本原理如下:

在大量细胞溶液中,DNA分子被随机剪切成为500kb左右的片段,随后通过微孔道DNA片段被拉伸,并且被附着到一个带有正电荷的玻璃支架上,接着利用特定的限制性内切酶在相应酶切位点进行切割DNA。将切割后的DNA分子用荧光染料染色后,在显微镜下拍照(图a-d)。Irys系统特有的超长读长可以轻松地跨越重复序列区域和一些包含复杂元件的DNA片段,这极大地简化了基因组的组装过程,提高基因组的组装效率,并且也很好的解决拼接缺口问题。光学图谱(BioNano)沿着几百kb的DNA分子产生小序列结构的物理图谱(如限制酶识别位点)(Lametal.,2021),不仅可以对Scaffolds进行排序和确定方向,并且也可以进行基因组组装质量评估。光学图谱(BioNano)初期主要应用于基因组较小的微生物基因组组装领域,现在已经广泛地应用在植物基因组组装领域。

图a-dBioNano光学图谱构建示意图

Bionano技术简单来说,就是给分子加上荧光标记,然后拍照,所以最原始的下机数据就是TIFF格式,但是我们拿到的一般都是经AutoDetect/IrysView转换过的BNX格式。

Bionano光学图谱展现了天然DNA分子的真实景观。利用SPDNA分离试剂盒获得超长DNA分子,用直接标记染色法(DLS)进行无损荧光标记,通过纳米微流控芯片将每一条DNA分子线性化展开,并进行高分辨率荧光成像,为基因组学下游应用提供原始DNA景观。这一真实的基因组物理图谱,为基因组组装提供了染色体尺度的框架,并能高效检测到大片段纯合子和杂合子结构变异。

谷歌

白菜参考基因组升级与染色质互作分析,张磊,2018.

  • 声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
  • 本文地址:https://srwj168.com.cn/keji312/10182.html
IT七巨头CEO年薪曝光!库克6320万美元最高
搭载骁龙8 3再曝 Pad 预装新系统新动效 Gen3的平板