开始超摩尔定律的狂奔 阿里云大模型空前降价

让更便宜的大模型,成为全社会创新加速的基础设施。

作者 | ray

编辑 | 靖宇

5 月 21 日,武汉光谷万豪,阿里云「AI 智领者峰会」。

抵达现场后,与会嘉宾发现一丝不同寻常,一个已经在一个月时间里相继在杭州、北京、西安举办过的系列峰会,这次阿里云智能集团资深副总裁、公共云事业部总裁刘伟光亲自来了——阿里云这次,可能要搞个大的。

果不其然,发布会开始十多分钟,刘伟光便聊起了一个硬件领域老生常谈的话题 「摩尔定律」

极客最高级的致敬是「show me code」;商业教父最高级的致敬,是把他的观点,变成行业定律,摩尔定律就是其一。

1965 年,这位英特尔联合创始人的一句话,「单位面积上,晶体管的密度,每隔 18 个月就翻一番」,主导了迄今半导体行业 60 多年的发展。

然而,伴随摩尔故去,摩尔定律在微观晶体管领域,也逐渐褪色。冯诺依曼架构的原始限制、量子隧穿成为摆在眼前的拦路虎。

那将观察角度转为宏观,或者转为用户导向呢?这是阿里云思考了很多年的问题。

从用户角度出发,晶体管密度只是其次,摩尔定律最根本的意义是在于每过 18 个月,用户就能以相同价格买到翻倍的算力。

但很显然,实现越来越便宜的算力,不止有晶体管密度这一条路。

而公共云与 ,或许就是阿里云超越摩尔定律的尝试。

AI 推理成本,

开始指数级下降

「我觉得 AI 推理成本只有每年有十倍甚至百倍的降低,才能真正推动行业各行各业的 AI 应用的爆发。」

刘伟光话一出口,台下的人面面相觑:目前中国 80% 的科技企业,一半大模型公司都跑在阿里云之上。每年百倍,也就意味着,阿里云要一步将国产大模型的使用成本打到地板价。

紧随其后,阿里云官宣,旗下 9 款核心商业化及开源系列模型将全数降价,且都已经可以通过阿里云百炼官网开通使用。其中, 阿里云对标 GPT-4 级别的长文本模型 Qwen-Long,降价至 GPT-4 价格的 1/400,全球最低。

Qwen-Long 是通义千问的长文本增强版模型,主要适用最消耗 token 的长文本场景,上下文长度最高达 1 千万,可处理约 1500 万字或 1.5 万页的文档。

此次官宣后,其 API 输入价格从 0.02 元/千 tokens 降至 0.0005 元/千 tokens,直降 97%。这意味着,1 块钱可以买 200 万 tokens,相当于 5 本《新华字典》的文字量。相比之下,国内外厂商 GPT-4、Gemini1.5 Pro、Claude 3 Sonnet 及 Ernie-4.0 每千 tokens 输入价格分别为 0.22 元、0.025 元、0.022 元及 0.12 元,均远高于 Qwen-long。同时,Qwen-Long 输出价格也从 0.02 元/千 tokens 降至 0.002 元/千 tokens,降幅 90%。

不久前发布的通义千问旗舰款大模型,权威基准 OpenCompass 上性能追平 GPT-4-Turbo 的 Qwen-Max,同样参与此次降价,API 输入价格降至 0.04 元/千 tokens,降幅达 67%。

其他开源模型上,Qwen1.5-72B、Qwen1.5-110B 等 5 款开源模型的输入价格也分别直降 75% 以上。

从应用范围最广,到性能最佳,阿里云拿出的,都是最重磅的产品,决心可见一斑。

阿里云的决心:成为大模型

爆发的基础设施

为什么降价?

答案就写在这次活动的主题中: 「让天下没有难做的 AI 应用」,成为大模型时代的基础设施。

据多位内部人士表示,AI 的定位在阿里云已经上升到前所未有的战略高度。在多次内部会上,阿里云高管都将 2024 的 AI 类比 2017 年的短视频与 2012 年的移动支付。2012 年到 2013 年,3G 过渡到 4G 过程当中,中国的移动支付两年增长了 800%;在 2017 到 2018,多家短视频的爆发,实现了整个中国短视频呈现 8.5 倍的增长。

未来 AI 的爆发速度,也将远远超出所有人的想象——现在,中国所有大模型公司 API 的日调用量不超过一个亿,年底这一数据量将达 100 亿次,增长百倍。

为达成「 基础设施」这一目标,阿里云给自身的定位是做到四有

一有,有实力提供全球领先的模型服务。不久前,OpenAI 的 Sam Altman 转发了 Chatbot Arena 榜单来印证 GPT-4o 的能力,其中全球排名前 20 的模型中,三款通义千问代表中国模型实力跻身世界前列。

Sam Altman 在 X 上转发 GPT-4o 测试成绩|X

二有,有能力建设国内最大的推理集群。全球三十处公共云地域分布、共计 89 个可用区,可做到 4X 推理吞吐提升,8X 计算资源节省,以及分钟级快速动态扩容。

三有,有态度坚持开放、持续开源。作为首个提出 MaaS(模型即服务)理念的云厂商,目前,瞄着让模型更好的服务的目标,阿里云百炼模型服务平台已可以调用众多三方及垂直领域大模型、魔塔社区则是中国最大的模型社区,拥有 4500+模型总数以及 500 万+用户数;通义持续开源全模态全尺寸模型家族,共计 700 万开源模型下载量。

四有,有信心,迎接 AI 应用的爆发。财报数据显示,同比去年,阿里云的 AI 相关收入同比三位数增长。

而与阿里云的「四有」,形成对比的,则是行业内的「两贵」。

一方面是开发以及微调的人力成本贵。 大模型人才稀缺已是业内共识,某家消费电子巨头曾算了一笔账,大模型研发方向,公司平均平均税后人才成本为 100 万元。而对普通企业来说,即便跳过基模这一步,采用开源大模型微调,成本同样高企。

另一方面则是硬件成本「硅谷卡贵」。 一个创业公司,拥抱大模型,起步价实买 50 台 GPU 服务器,甚至 100 台、200 台乃至更大尺寸的集群。如果对标全球顶级水平,训练一个 100B 规模的 LLM,以 Falcon 系列模型为例,其资源消耗量 3.5 万亿 token,约 4096 个 A100 组成的集群,训练时长约 70 天。其中,一张 A100 的价格,通常在一万美金乃至更多。而构建集群,除了 GPU 的采购,还有包括软件部署、网络费用、电费、运维成本,以及不断投入的试错成本,成本远非普通企业可以承受。

那么,对阿里云来说,接下来的核心目标,就是如何用阿里云的「四有」,解决 爆发遇到的「两贵」。

决定 API 价值的要素:

技术高度+普惠能力

不难发现,本次活动,阿里云的重点有二,其一是强调 价值,其二是降价普惠的能力。

很好理解,互联网发展没必要重复造轮子,大模型发展,也不是人人都需要从基模开始。通过 API 与公共云相组合,不仅可以降低大模型开发的人力成本,更是通往大模型普惠的必经之路。

一方面,云厂商天然的开放性,能为开发者提供私有部署所不具备的丰富模型和工具链。阿里云百炼平台上汇聚通义、百川、ChatGLM、Llama 系列等上百款国内外优质模型,内置大模型定制与应用开发工具链,开发者可以便捷地测试比较不同模型,开发专属大模型,并轻松搭建 RAG 等应用。从选模型、调模型、搭应用到对外服务,一站式搞定。

另一方面,云上更方便进行多模型调用,并提供企业级的数据安全保障。阿里云可以为每个企业提供专属 VPC 环境,做到计算隔离、存储隔离、网络隔离、数据加密,充分保障数据安全。目前,阿里云已主导或深度参与 10 多项大模型安全相关国际国内技术标准的制定。

降价背后的逻辑,则是具备普惠的能力。

在 PC 时代,主导行业不断发展的是安迪-比尔定律。其中,安迪代表的是英特尔卖 CPU 的,比尔则是微软,做 Windows 操作系统的。两者组合,随着操作系统为代表的软件的体量日益庞大,用户必须定期更新迭代新的硬件。

换到 AI 时代同理,大模型发展越好,云计算等算力的需求越高。「生成式 AI 所依赖的算力不仅仅是 CPU 和简单的技术带来的策略,更多是一个大规模集群,大规模 GPU 集群带来算力的基础,包括网络存储背后能力的提升。所以生成式 AI,无论是推理和训练,逐渐更多的走向云端,再一次的点燃了公共云的爆发」刘伟光直言。

而这次空前降价的底气,则是云计算本身超越摩尔定律的特性。

过去,摩尔定律主导单位面积下,芯片晶体管的密度 18 个月翻番。相同算力,用户的使用成本 18 个月降一半。

现如今,晶体管的摩尔定律失效,但公共云的技术红利和规模效应,依然能带来算力成本的继续优化。一个例证是,阿里云过去十年,算力成本降低 80%,存储成本降低 90%。

具体到 AI 方向,阿里云基于自研的异构芯片互联、高性能网络 HPN7.0、高性能存储 CPFS、人工智能平台 PAI 等核心技术和产品,构建了极致弹性的 AI 算力调度系统,结合百炼分布式推理加速引擎,大幅压缩了模型推理成本,并加快模型推理速度。

也是因此,即便同样的开源模型,在公共云上的调用价格也远远低于私有化部署。以使用 Qwen-72B 开源模型、每月 1 亿 tokens 用量为例,在阿里云百炼上直接调用 API 每月仅需 600 元,私有化部署的成本平均每月超 1 万元。

至此,大模型的爆发才刚刚开始,但如何打好这场持久战,阿里云的基础设施的铺垫,已然悄然酝酿完成。

阿里云开启的连锁反应

事实上,阿里云开始幅度如此激进的降价,不会是故事的结尾。

就在今天,上午阿里云大模型大幅降价后,下午随即百度两款轻量型主力大模型宣布免费。虽然这和阿里云降价的模型能力并不完全匹配,看起来是一种声势上的快速应对,但毫无疑问,阿里云开启的这一波大模型能力普惠将引发进一步的业界连锁反应。

对于应用创新,大模型 API 成本的下降,甚至开始可以接近免费试用,真正跑起来再算钱,对激发应用创新是一件好事。过去,中国在实体经济,有基建狂魔称号,「要致富先修路」也成为家喻户晓的常识。其背后的底层经济规律是,基础设施的价格与社会的创新总量,之间是一个微妙的跷跷板结构:

只有基础设施的价格下降,创新才会如成熟的蒲公英,借助风口,把种子播撒向远方。过去实体经济如此,期待 时代亦如此。

上周是 AI 行业疯狂的一周。OpenAI、Google 先后发布 GPT-4o、Project Astra 等「AI 全家桶」;字节的「豆包」大模型家族、腾讯的混元大模型集体亮相。不论是国际大模型明星公司,还是互联网大厂,他们都正在朝着 AI 狂奔。 但是,对于中小公司来说,能像当年「上云」一样一键部署 AI 的方案,还不多见。

5月22日(周三)20:00,极客公园创始人 & 总裁张鹏将对话矩阵起源创始人 & CEO王龙, 聊聊传统的 IDC 如何转型到 AIDC,以及通往 AGI 的路为什么绕不开「数据+算力」?

欢迎预约直播~


为什么说数据库在电子商务中占有重要的地位

电子商务需要数据的支持来完成,在复杂的数据中当然需要数据库来存储、查询、归类等操作了。

大数据处理对电子商务影响有哪些

定位更易 , 信息资源更丰富,营销更精准!

大数据处理对电子商务的影响有哪些?

电子商务:通俗来说就是企业通过网络,把线下的业务移到线上去开展,完成商品或者服务的销售交易。 大数据:指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。 近几年来,互联网产业高速发展,很多传统企业通过电子商务,开展网络营销,线上产生交易的数据量是线下无法比的,因而就产生了处理巨量资料,也就是大数据的急迫需求,解决不好,就成为电子商务发展的瓶颈。 反之,大数据处理的成功发展,也促进了企业加速开展电子商务,为互联网产业的发展注入新动力。 一、大数据处理模式在电子商务领域内,信息的大批量处理如果是以PB、EB、ZB为计量单位,则这些信息就构成了大数据。 以往的计算机处理模式已经很难对这些大数据进行高效率的处理,势必会影响电子商务的总体发展。 因此对大数据时代的计算机处理模式进行革新是获得电商行业整体突破的基本保证。 传统的数据处理模式是数据库集群模式,大数据处理模式的基本要求是建构云计算Map Reduce处理体系,使信息的分解处理和结果合并成为可能。 (一)数据库集群模式集群模式的基本运行原理是将同一种应用程序通过不同的工作方法相互协调共同完成,在面对客户端的数据请求时,为其提供单一映像,并将这些映像通过一定的连接技术和方法与硬件系统进行连接,整体上建构一个松散耦合的集合。 简单来说,数据库集群模式实现了数据库技术和集群技术的结合。 数据库集群模式的运行较为平稳,具有多方面的技术优势,例如强大的靠扩展性、整体的可靠性等等。 但是在面对大数据处理时,数据库集群也表现出了一定的缺陷。 这些缺陷主要包含以下方面:第一是可扩展性补不强。 如果系统功能节点的硬件基础设施选择的是Pc服务器,那么将会出现系统线缆繁杂、硬件高度复杂化和架设安装难度大等问题,对其扩展性造成了一定的限制;第二是数据通信受限。 目前运行高速互联网的必备条件是将 PCI插槽与主机进行连接。 但是PCI的数据传送能力有限,不能满足节点间的数据通信要求;第三是提升空间小。 这种空间主要是指数据库数据集的可扩展空间,在进行数据处理时如何解决系统的安全性、运算速度和可扩展性是数据库集群模式要面对的重要问题。 此外,数据库集群模式还存在兼容性、可靠性、容错性、对异质条件支持能力等方面的局限性。 (二)Map Reduce框架云计算构架主要是由低端服务器进行大规模集群构成的数据处理技术,在数据存储容量和数据处理能力上具有绝对的优势。 由于云计算平台在运行中的可靠性和可扩展性等功能,目前众多的大型企业或单位都将其作为web搜索和大数据分析的主要平台,如中国移动、淘宝、网易、网络等等。 Map Reduce框架主要包含三个方面的内容,即并行编程模型Map Reduce、分布式文件系统(HDFs)、并行执行引擎。 Map Reduce的设计是由google完成的,主要是进行大数据集的计算处理工作,代表了分析技术的整体发展状态。 Map Reduce在进行数据处理时,先将对象进行抽象化处理,使其以映射和化简操作对的形式呈现出来,其中映射部分进行数据的过滤,化简部分进行数据的聚集工作,在工作中均以良好的界面进行管理工作。 对Map Reduce计算过程进行分解,可以将其工作原理理解为将大数据集进行解构,解构之后的结果是形成了数量众多的小数据集,通过集群节点对这些小数据集进行分别处理,由此得出中间结果,将这些结果通过节点进行合并,就可以得出对整个大数据集的处理结果。 二、大数据时代电子商务IT技术设施的革新IT基础设施是保证电子商务系统运行的前提,对其进行技术革新能够使其快速适应电子商务大数据时代。 在后互联网技术时代,电子商务企业广泛采用的IT基础设施一般是PC服务器。 随着数据信息处理规模的扩大和处理能力的要求不断增强,电子商务企业对于IT基础设施的革新正朝着小型化和集群化方向发展,与此同时,电商企业还需要不断地投入大量的人力和技术实现IT基础设施的维护、升级和更新。 (一)数据仓库的发展从近期对电子商务信息处理数据的研究可以发现,在系统运行中出现的大数据仍在以惊人的速度发展和增长,其特点也表现为明显的分布式发展和异构性趋势。 传统的数据库如具备一般数据处理功能和信息分析技术的数据库以及BI技术已经很大程度上不能满足PB级的数据量处理要求。 这种大规模数据的发展促使电子商务数据仓库系统出现了非常明显的变革,也即是数据量数量级不断上调,目前已经实现了由TB向PB的迈进,并且仍呈现出爆炸性的增长态势。 根据对现今电商数据量发展状况及趋势的研究,可以发现电子商务数据仓库将会呈现以下特点:第一,未来两年电商数据仓库的最大数据量将会达到甚至超过 1OOPB,并且其增长速度也将呈现出前所未有的变化,远远超过摩尔定律;第二,对数据的分析方式实现质的变化,将从常规化分析向深度化分析转变;第三,中低端硬件组成的大规模集群硬件平台将会代替高端服务器构成的基础设施硬件支持平台,基础设施进一步向集群化发展;由于硬件系统的革新将会对并行数据库产生了重要影响,使其规模不断扩大,由此带来的成本也将逐渐增长。 总体来讲,目前电子商务将会出现大规模革新的直接因素是数据量的大规模增长和深度分析的现实要求。 (二)云计算构架云计算构架是一种针对分布式网络计算而设计的新型数据处理模式,在应用中已经表现出了良好的适应性。 在网络环境中进行计算、存储、软件等在线服务时较传统构架有显著的性能提升。 在目前应用于电子商务领域内的云计算构架来讲,其具备了以下特征:按需自助服务(on Demand self-service)、可度量服务(measured service)、池化资源(resource pooling)、泛化网络访问((broad network access)以及快速弹性(rapid elasticity)。 三、大数据处理对电子商务的影响云计算的发展历史并不长,首次引入云计算技术的是淘宝网,其所有交易都是基于自建系统完成的,而阿里云也成为我国首家开展云计算供应的公司。 云计算对于大数据的超强处理能力使其对电子商务的发展起到了推波助澜的作用,主要影响表现在以下方面。 (一)信息检索能力电子商务平台虽然很大程度上改变了消费者的购物方式,但是就营销方式来说,商品数量和种类依然是影响消费者选择商家的主要因素。 在电子商务领域内,商品数量和种类呈现出结构的繁杂化发展甚至是非结构化发展趋势。 这些都为 IT基础设施以及信息处理技术提出了挑战,大数据处理技术由于其具备的灵活性和功能强大的检索服务使其能够引领电子商务信息处理技术的新方向。 云计算的检索服务可以根据客户的实际需求和交易习惯对大量的信息进行筛选和显示,其智能性和高效性也是传统IT基础设施多不能比拟的。 此外,云平台还具有信息推荐功能,根据网上交易整体情况筛选热点商品予以展示,提高了交易的针对性和检索效率。 云计算性能的优势还体现在对人类部分思维进行描述的功能上,解决了长期以来计算机信息处理不能够准确把握人类语言和知识应用的难题,使数据的处理实现了功能的深度发掘。 这种技术优势表现在实际交易中就是电商平台能够对用户输入的语言进行迅速的反映,并能准确地提供用户所需耍的商品信息。 这种处理过程极大地提高了信息服务的效率和质量,使用户满意度得到了很大的提升。 (二)弹性处理能力电子商务信息处理系统的工作性质使其必须具有强大的弹性处理能力,并能够在极短的时间内做出反映以应对在系统运行中出现的各种问题。 这些问题的出现并不是偶然的,而是随着用户的并发访问以及商家集体营销活动造成的大量订单信息所导致的,这些情况在当前的电商系统运行中是比较常见的,这就需要系统在面临突然增长的业务量时具有强大的扩容能力和数据的存储能力。 云计算技术的出现在理论上实现了信息的无上限存储能力以及超大规模信息处理能力,使其能够轻松地应对TB数量级的信息乃至PB数量级的信息处理。 而这一功能的实施并不需要企业对硬件系统进行更换,而且能够以比较低的成本享用云计算存储处理信息服务,在此基础上对应用系统机型全方位的布局并保证了弹性处理能力的实现,使资源达到了最优化配置。 (三)信息处理安全性能网络系统面临的最大难题是信息安全问题,保证交易安全和用户信息安全更是电商企业应时刻关注的话题。 信息时代的一大特征是将信息转化为可利用的资源,甚至是直接创造经济价值的信息资本。 电子商务领域内,大数据就是企业生存发展的重要资本,对于大数据的掌控能力将成为衡量企业核心竞争力的主要标志。 但是大数据的出现同样给信息资源的安全带来了极大的挑战,由于其结构复杂,数量巨多,并且大多是具有敏感性的信息,很容易成为网络攻击的目标。 大数据处理技术在应对信息安全是进行了性能的全面评估,使其能够及时、精确地定位各类网络攻击或非正常现象,并将这些异常数据收集整理通过分析实施预防措施。 云计算技术的安全性还体现在将安全可靠的信息转化为云服务,并将这些信息托管在云端,为用户的信息提供了专业化的信息防护措施和保密方案。 四、大数据处理的发展趋势信息技术的发展历史并不长远,但是在每个发展阶段都会出现具有标志性的技术类型和产品。 在目前,信息技术的热点以及将会对信息产业产生重大影响的无疑是云计算技术和大数据处理f司题。 在电子商务环境中大数据处理将会发展出更多强大和多元的功能,具体发展趋势有以下几点。 (一)大数据处理服务和产品的多样化目前电子商务平台的服务和产品正在向着多元化的方向发展,除了电商企业之外,政府机构、大型集团企业、行政事业单位等都加入或正在加入构建云环境下的数据处理服务平台,并且可以实现对没有充足IT能力的小型电子商务企业进行服务和产品的输出。 (二)新型的电子商务运营模式云计算的出现不仅对IT技术设施进行了大规模和深度的革新,同时其带来的众多产品如长尾效应、经济效应、众包、个性化服务等对于经济学概念的再认知也产生了重大的影响。 这些变革有助于盈利性企业的经营模式做出重大的调整,进而加快了向服务经济社会发展的步伐。 随着信息技术的进一步发展和现有技术的逐步完善,传统经济模式必将会受到严重的冲击,商业模式也会随之产生整体性的变动甚至是根本性的改变,并且在变化中不断进行新技术、新方法和新思路的探索。 (三)IT设施将成为企业核心竞争力的重要组成部分企业的核心竞争力包含多方面的内容,但可以确定的是都是对企业发展具有重大影响的因素。 随着现代信息化时代的发展和信息技术在各个领域内的广泛使用,企业成产、管理、经营等模块的信息化将会对企业能否适应社会的发展以及在日益激烈的市场中保持其竞争力产生举足轻重的作用。 通过对IT基础设施进行引进和革新,能在最大限度内实现资源的最佳配置,提高生产质量和效率,降低企业运营成本,提升企业的整体管理水平。 特别是对于信息技术依赖程度高的电子商务企业,云计算构架和大数据处理技术的可扩展性相当可观,为海量信息的存储、整合和管理提供了安全可靠的环境,通过IT基础设施的技术优势,为突破电子商务行业的发展上限提供了可能。

  • 声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
  • 本文地址:https://srwj168.com.cn/chuangtou/10176.html
有市民反感 菏泽南站暂停直播!网红郭有才爆火 生活受到影响
韩国裁判朴景镇将替换李景焕 吹罚明晚CBA总决赛G4 媒体人