TAG标签
大模型终端部署新趋势 硬件直接支持混合矩阵乘法

大模型终端部署新趋势 硬件直接支持混合矩阵乘法

在人工智能领域,模型参数的增多往往意味着性能的提升,但随着模型规模的扩大,其对终端设备的算力与内存需求也日益增加,低比特量化技术,由于可以大幅降低存储和计算成本并提升推理效率,已成为实现大模型在资源受...

手机跑大模型提速4

手机跑大模型提速4

有CPU就能跑大模型,性能甚至超过NPU,GPU!没错,为了优化模型端侧部署,微软亚洲研究院提出了一种新技术——,这项技术主打性价比,不仅能让端侧模型跑得更快,而且资源消耗量更少,咋做到的,在CPU上...

1页 2