首页 关于我们 成功案例 网络营销 电商设计 新闻中心 联系方式
QQ联系
电话联系
手机联系

清华大学计算机系团队获得第23届USENIX文件与存储技术会议(FAST25)最佳论文奖

发布时间:2025-03-12 15:42
发布者:网络
浏览次数:

第23届usenix文件与存储技术会议(fast)在美国圣克拉拉落下帷幕,计算机系章明星、武永卫、郑纬民教授团队与月之暗面公司合作的论文荣获埃里克·里德尔最佳论文奖(erik riedel best paper award)。该论文题为“以键值缓存为中心的以存换算大语言模型推理架构”(mooncake: trading more storage for less computation-a kvcache-centric architecture for serving llm chatbot),第一作者为计算机系博士生秦若愚,指导老师为章明星助理教授。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

清华大学计算机系团队获得第23届USENIX文件与存储技术会议(FAST25)最佳论文奖

最佳论文:Mooncake架构

获奖论文提出的Mooncake系统是月之暗面公司大语言模型服务Kimi的底层推理平台。Mooncake采用独特的键值缓存(KVCache)为中心的分布式架构,巧妙分离预填充和解码集群,并充分利用推理集群中CPU、DRAM、SSD和NIC等资源,构建独立的KVCache缓存池。其核心创新在于以KVCache为中心的全局缓存和调度机制,在严格满足服务级别目标(SLOs)的前提下,最大限度地提升吞吐量。

Zyro AI Background Remover Zyro AI Background Remover

Zyro推出的AI图片背景移除工具

Zyro AI Background Remover 145 查看详情 Zyro AI Background Remover

实验结果表明,Mooncake在处理长上下文输入方面表现卓越。真实数据测试显示,与基线方法相比,Mooncake在满足SLOs的情况下,有效请求处理能力提升了59%到498%。目前,Mooncake已在数千个节点上稳定运行,每日处理超过千亿个token。实际部署中,Mooncake的创新架构使Kimi在NVIDIA A800和H800集群上的请求处理能力分别提升了115%和107%。

FAST会议是计算机存储领域的顶级盛会,拥有二十余年的历史,在业界享有盛誉,被中国计算机学会(CCF)评为A类国际学术会议。

以上就是清华大学计算机系团队获得第23届USENIX文件与存储技术会议(FAST25)最佳论文奖的详细内容,更多请关注其它相关文章!


# 清华大学  # 腾讯  # 亿元  # 键值  # 最新推出  # 五个月  # 梅赛德斯  # 二十  # 学术会议  # 享有盛誉  # 河南监理建设协会网站  # 潮牌海报文案网站推广  # 宿迁网站建设开户  # 海珠网站全网营销推广  # 芜湖流量推广营销公司  # 湛江网站开发如何做推广  # 郑州新站关键词点击排名  # 建设部网站视频配音  # 河南seo工具多少钱  # 网站推广与网络营销模块