CANN/ge异步KV缓存传输API
# transfer_cache_async【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge产品支持情况Atlas A3 训练系列产品/Atlas A3 推理系列产品支持Atlas A2 推理系列产品支持Atlas A2 训练系列产品不支持函数功能异步分层传输KV Cache。函数原型transfer_cache_async(src_cache: KvCache, layer_synchronizer: LayerSynchronizer, transfer_configs: Union[List[TransferConfig], Tuple[TransferConfig]], src_block_indices: Optional[Union[List[int], Tuple[int]]] None, dst_block_indices: Optional[Union[List[int], Tuple[int]]] None, dst_block_memory_size: Optional[int] None) - CacheTask参数说明参数名称数据类型取值说明src_cacheKvCache源Cache。layer_synchronizerLayerSynchronizerLayerSynchronizer的实现类对象transfer_configsUnion[List[TransferConfig], Tuple[TransferConfig]]传输配置列表或元组src_block_indicesOptional[Union[List[int], Tuple[int]]]源Cache的block indices当源Cache为PA场景时设置dst_block_indicesOptional[Union[List[int], Tuple[int]]]目的Cache的block indices当目的Cache为PA场景时设置dst_block_memory_sizeOptional[int]目的Cache每个block占用的内存大小当目的Cache为PA场景时设置。如果源Cache也为PA场景则可省略该参数此时会自动将其设置为源Cache每个block占用的内存大小。该参数设置为0时等同于省略该参数。调用示例from llm_datadist import * ... class LayerSynchronizerImpl(LayerSynchronizer): def synchronize_layer(self, layer_index: int, timeout_in_millis: Optional[int]) - bool: # need control time for transfer layer here. return True num_layers 40 dst_cluster_id 2 # need register decoder kv addr here. decoder_addrs ... assert(len(decoder_addrs) 2*num_layers) transfer_config TransferConfig(dst_cluster_id, decoder_addrs, range(0, num_layers), 0) cache_task kv_cache_manager.transfer_cache_async(kv_cache, LayerSynchronizerImpl(), [transfer_config]) cache_task.synchronize() cache_task.get_results()返回值正常情况下返回CacheTask。传入数据类型错误会抛出TypeError或ValueError异常。传入数据非法会抛出LLMException异常。约束说明当前仅支持src_cache与dst_cache都为连续cache的场景以及src_cache与dst_cache都为PA的场景。使用同一条链路时此接口和pull_cache、pull_blocks接口不支持并发。本接口不支持并发调用。单进程多卡模式下不支持调用该接口。【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关新闻

POI-TL多级列表渲染技术实现:基于Apache POI的文档自动化架构设计

POI-TL多级列表渲染技术实现:基于Apache POI的文档自动化架构设计

POI-TL多级列表渲染技术实现:基于Apache POI的文档自动化架构设计 【免费下载链接】poi-tl Generate awesome word(docx) with template 项目地址: https://gitcode.com/gh_mirrors/po/poi-tl POI-TL作为基于Apache POI的Java Word模板引擎,通过抽…

2026/7/4 7:37:07 阅读更多 →
3分钟快速部署:Docker SFTP服务器终极指南

3分钟快速部署:Docker SFTP服务器终极指南

3分钟快速部署:Docker SFTP服务器终极指南 【免费下载链接】sftp Securely share your files 项目地址: https://gitcode.com/gh_mirrors/sf/sftp 想要在团队中安全地共享文件,但又不想搭建复杂的FTP服务器?atmoz/sftp项目为你提供了一…

2026/7/4 7:33:05 阅读更多 →
DeepSeek-V2与GPT-4o真实对比:中文理解、代码生成与推理成本分析

DeepSeek-V2与GPT-4o真实对比:中文理解、代码生成与推理成本分析

我不能按照该标题生成相关内容。原因如下:标题中涉及虚构或不存在的模型名称:截至目前(2024年中),DeepSeek-V4 与 GPT-5.5 均非真实发布的公开模型。DeepSeek 官方最新公开版本为 DeepSeek-V2(2024年7月发布…

2026/7/4 7:33:05 阅读更多 →

最新新闻

用AI变声神器RVC实现10分钟语音转换:从零开始的完整实战指南

用AI变声神器RVC实现10分钟语音转换:从零开始的完整实战指南

用AI变声神器RVC实现10分钟语音转换&#xff1a;从零开始的完整实战指南 【免费下载链接】Retrieval-based-Voice-Conversion-WebUI Easily train a good VC model with voice data < 10 mins! 项目地址: https://gitcode.com/GitHub_Trending/re/Retrieval-based-Voice-C…

2026/7/4 8:31:20 阅读更多 →
从“是什么“到“为什么“:现代系统诊断工具witr如何重新定义进程分析范式

从“是什么“到“为什么“:现代系统诊断工具witr如何重新定义进程分析范式

从"是什么"到"为什么"&#xff1a;现代系统诊断工具witr如何重新定义进程分析范式 【免费下载链接】witr Why is this running? 项目地址: https://gitcode.com/GitHub_Trending/wi/witr 在当今复杂的系统环境中&#xff0c;当进程异常消耗资源、端…

2026/7/4 8:29:19 阅读更多 →
如何用Flask-profiler定位最耗时的API端点?实战案例分享

如何用Flask-profiler定位最耗时的API端点?实战案例分享

如何用Flask-profiler定位最耗时的API端点&#xff1f;实战案例分享 【免费下载链接】flask-profiler a flask profiler which watches endpoint calls and tries to make some analysis. 项目地址: https://gitcode.com/gh_mirrors/fl/flask-profiler Flask-profiler是…

2026/7/4 8:29:19 阅读更多 →
FlipperZeroHondaFirmware工作原理深度解析:433MHz RF信号捕获技术

FlipperZeroHondaFirmware工作原理深度解析:433MHz RF信号捕获技术

FlipperZeroHondaFirmware工作原理深度解析&#xff1a;433MHz RF信号捕获技术 【免费下载链接】FlipperZeroHondaFirmware Custom Firmware for the Flipper Zero, to add support for Honda key fobs (FCC ID: KR5V2X) 项目地址: https://gitcode.com/gh_mirrors/fl/Flippe…

2026/7/4 8:23:17 阅读更多 →
大模型‘养虾测试’:评估世界模型与长程一致性新标尺

大模型‘养虾测试’:评估世界模型与长程一致性新标尺

1. 项目概述&#xff1a;当“养虾”成为大模型能力测试的新标尺最近在好几个技术群和行业论坛里&#xff0c;频繁看到有人甩出一句&#xff1a;“来&#xff0c;养只虾试试&#xff1f;”——不是水产养殖交流&#xff0c;也不是美食探店邀约&#xff0c;而是工程师、产品经理、…

2026/7/4 8:19:17 阅读更多 →
智能解析技术赋能教育数字化转型:tchMaterial-parser的技术架构与应用实践

智能解析技术赋能教育数字化转型:tchMaterial-parser的技术架构与应用实践

智能解析技术赋能教育数字化转型&#xff1a;tchMaterial-parser的技术架构与应用实践 【免费下载链接】tchMaterial-parser 国家中小学智慧教育平台 电子课本下载工具&#xff0c;帮助您从智慧教育平台中获取电子课本的 PDF 文件网址并进行下载&#xff0c;让您更方便地获取课…

2026/7/4 8:15:16 阅读更多 →

日新闻

Memcached 1.6.43 发布:关键安全修复版本,多项问题得到解决

Memcached 1.6.43 发布:关键安全修复版本,多项问题得到解决

Memcached 1.6.43 正式发布&#xff0c;这是一个关键的安全修复版本&#xff0c;修复了多个方面的问题&#xff0c;还对部分功能进行了优化。 安全修复亮点 此次发布在安全修复上表现突出。binprot 避免了项目引用计数溢出&#xff0c;mcmc 因安全问题提升了上游版本号&#xf…

2026/7/4 0:04:29 阅读更多 →
终极指南:使用HMCL启动器跨平台畅玩Minecraft的完整解决方案

终极指南:使用HMCL启动器跨平台畅玩Minecraft的完整解决方案

终极指南&#xff1a;使用HMCL启动器跨平台畅玩Minecraft的完整解决方案 【免费下载链接】HMCL A Minecraft Launcher which is multi-functional, cross-platform and popular 项目地址: https://gitcode.com/gh_mirrors/hm/HMCL HMCL&#xff08;Hello Minecraft! Lau…

2026/7/4 0:06:29 阅读更多 →
KMX63与PIC18F66K40在嵌入式HMI中的硬件协同与低功耗设计

KMX63与PIC18F66K40在嵌入式HMI中的硬件协同与低功耗设计

1. KMX63与PIC18F66K40的硬件协同架构解析KMX63作为一款三轴加速度计和磁力计组合传感器&#xff0c;与PIC18F66K40微控制器的搭配堪称嵌入式HMI开发的黄金组合。这套硬件组合的核心优势在于KMX63提供的高精度运动感知能力与PIC18F66K40强大的信号处理能力形成了完美互补。KMX6…

2026/7/4 0:06:29 阅读更多 →

周新闻

月新闻