华为正式开源UCM技术:最大提升22倍 AI推理性能跃升
近日,华为宣布针对AI推理加速的关键技术——UCM(Unified Cache Manager)推理记忆数据管理正式开源。
UCM以KV Cache多级缓存和推理记忆管理为中心,通过推理框架、算力、存储的三层协同,破解长序列推理效率低、成本高的难题,为企业提供更优的AI推理体验。

据介绍,UCM融合了多类型缓存加速算法工具,可分级管理在推理过程中产生的KV Cache记忆数据。
UCM具备四大关键能力:稀疏注意力、前缀缓存、预填充卸载、异构PD解耦。
它实现首Token时延最高降低90%,系统吞吐最大提升22倍,并达到10倍级上下文窗口扩展,显著提升了AI推理性能。
目前,UCM已在ModelEngine社区开放基础框架与工具链,开发者可通过社区获取UCM源代码与技术文档。

UCM产品架构
-
微软承认Windows 11新问题:记事本、画图、截图通通打不开!好在已修复
近日,不少用户报告称,包括记事本、截图工具、画图甚至Windows 安全中心在内的系统应用均无法打开,并弹出错误代码“0x803F8001”。据用户描述,该错误提示应用在当前账户中“不可用”,并要求用
-
高德地图×数码宝贝联动:加布兽导航上线 全新可进化3D车标
高德地图再度加码IP联动,此次携手经典动漫《数码宝贝》推出重磅合作内容——加布兽定制导航语音包正式上线。同步解锁全新可进化3D车标,瞬间唤醒无数人的童年记忆,成为近期导航类APP的热门话题。此次联动精
-
微软正式推出全新命令行工具winapp!简化Windows应用开发
微软宣布正式推出开源命令行工具winapp的公开预览版,为开发者提供一个统一、高效的一站式开发环境。此前开发原生Windows应用,往往意味着要经历复杂的SDK管理、繁琐的清单(Manifest)编辑
[广告]赞助链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注KnowSafe微信公众号随时掌握互联网精彩
- 国内怎么上Google网站?(教您轻松打开谷歌网站)
- iTrustSSL证书夏季大促,最高直降92.5%!
- 研究人员在苹果查找网络中发现漏洞 借助漏洞可追踪其他蓝牙设备
- URLOS,基于Docker容器的服务器运维管理面板
- HTML走私活动冒充知名品牌传播恶意软件
- 看雪学苑兔年红包封面大放送!
- 库存告急!2022新款速干衣:Reverse everything
- 00 后博士获聘南大特任副研究员,曾 4 岁上小学,14 岁考入南大!
- PostgreSQL表现突出,MySQL 位居第二,11月份数据库排行榜出炉
- 全站 HTTPS 就一定安全了吗?
- 在吗?你有一条来自5G时代的未读消息
- 我国首次举办工业互联网“人机对抗”竞赛 检验独创理论独有技术有效性



