CANN / asc-devkit: asc_loadalign_brc_elem BRC搬入API
asc_loadalign_brc_elem【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit产品支持情况产品是否支持Ascend 950PR/Ascend 950DT√功能说明对齐数据搬运接口从UB连续对齐搬入目的操作数实现BRC搬入模式搬运一个b8/b16/b32类型的数据并Broadcast到所有元素位置。支持三种偏移方式偏移固定传入0由用户自行更新源操作数的地址。通过int32_t传入偏移用户可以选择更新偏移或者更新源操作数的地址。通过iter_reg地址寄存器传入偏移用户可以选择更新偏移或者更新源操作数的地址。函数原型偏移固定传入0由用户自行更新源操作数的地址__simd_callee__ inline void asc_loadalign_brc_elem(vector_int8_t dst, __ubuf__ int8_t* src) __simd_callee__ inline void asc_loadalign_brc_elem(vector_uint8_t dst, __ubuf__ uint8_t* src) __simd_callee__ inline void asc_loadalign_brc_elem(vector_fp4x2_e2m1_t dst, __ubuf__ fp4x2_e2m1_t* src) __simd_callee__ inline void asc_loadalign_brc_elem(vector_fp4x2_e1m2_t dst, __ubuf__ fp4x2_e1m2_t* src) __simd_callee__ inline void asc_loadalign_brc_elem(vector_fp8_e8m0_t dst, __ubuf__ fp8_e8m0_t* src) __simd_callee__ inline void asc_loadalign_brc_elem(vector_fp8_e5m2_t dst, __ubuf__ fp8_e5m2_t* src) __simd_callee__ inline void asc_loadalign_brc_elem(vector_fp8_e4m3fn_t dst, __ubuf__ fp8_e4m3fn_t* src) __simd_callee__ inline void asc_loadalign_brc_elem(vector_hifloat8_t dst, __ubuf__ hifloat8_t* src) __simd_callee__ inline void asc_loadalign_brc_elem(vector_int16_t dst, __ubuf__ int16_t* src) __simd_callee__ inline void asc_loadalign_brc_elem(vector_uint16_t dst, __ubuf__ uint16_t* src) __simd_callee__ inline void asc_loadalign_brc_elem(vector_half dst, __ubuf__ half* src) __simd_callee__ inline void asc_loadalign_brc_elem(vector_bfloat16_t dst, __ubuf__ bfloat16_t* src) __simd_callee__ inline void asc_loadalign_brc_elem(vector_int32_t dst, __ubuf__ int32_t* src) __simd_callee__ inline void asc_loadalign_brc_elem(vector_uint32_t dst, __ubuf__ uint32_t* src) __simd_callee__ inline void asc_loadalign_brc_elem(vector_float dst, __ubuf__ float* src) __simd_callee__ inline void asc_loadalign_brc_elem(vector_int4x2_t dst, __ubuf__ int4b_t* src)通过int32_t传入偏移__simd_callee__ inline void asc_loadalign_brc_elem(vector_int8_t dst, __ubuf__ int8_t* src, int32_t offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_uint8_t dst, __ubuf__ uint8_t* src, int32_t offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_fp4x2_e2m1_t dst, __ubuf__ fp4x2_e2m1_t* src, int32_t offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_fp4x2_e1m2_t dst, __ubuf__ fp4x2_e1m2_t* src, int32_t offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_fp8_e8m0_t dst, __ubuf__ fp8_e8m0_t* src, int32_t offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_fp8_e5m2_t dst, __ubuf__ fp8_e5m2_t* src, int32_t offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_fp8_e4m3fn_t dst, __ubuf__ fp8_e4m3fn_t* src, int32_t offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_hifloat8_t dst, __ubuf__ hifloat8_t* src, int32_t offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_int16_t dst, __ubuf__ int16_t* src, int32_t offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_uint16_t dst, __ubuf__ uint16_t* src, int32_t offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_half dst, __ubuf__ half* src, int32_t offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_bfloat16_t dst, __ubuf__ bfloat16_t* src, int32_t offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_int32_t dst, __ubuf__ int32_t* src, int32_t offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_uint32_t dst, __ubuf__ uint32_t* src, int32_t offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_float dst, __ubuf__ float* src, int32_t offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_int4x2_t dst, __ubuf__ int4b_t* src, int32_t offset)通过iter_reg地址寄存器传入偏移__simd_callee__ inline void asc_loadalign_brc_elem(vector_fp4x2_e1m2_t dst, __ubuf__ fp4x2_e1m2_t* src, iter_reg offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_fp4x2_e2m1_t dst, __ubuf__ fp4x2_e2m1_t* src, iter_reg offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_int4x2_t dst, __ubuf__ int4b_t* src, iter_reg offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_uint8_t dst, __ubuf__ uint8_t* src, iter_reg offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_int8_t dst, __ubuf__ int8_t* src, iter_reg offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_fp8_e4m3fn_t dst, __ubuf__ fp8_e4m3fn_t* src, iter_reg offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_hifloat8_t dst, __ubuf__ hifloat8_t* src, iter_reg offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_fp8_e5m2_t dst, __ubuf__ fp8_e5m2_t* src, iter_reg offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_fp8_e8m0_t dst, __ubuf__ fp8_e8m0_t* src, iter_reg offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_uint16_t dst, __ubuf__ uint16_t* src, iter_reg offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_int16_t dst, __ubuf__ int16_t* src, iter_reg offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_bfloat16_t dst, __ubuf__ bfloat16_t* src, iter_reg offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_half dst, __ubuf__ half* src, iter_reg offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_uint32_t dst, __ubuf__ uint32_t* src, iter_reg offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_int32_t dst, __ubuf__ int32_t* src, iter_reg offset) __simd_callee__ inline void asc_loadalign_brc_elem(vector_float dst, __ubuf__ float* src, iter_reg offset)参数说明参数名输入/输出描述dst输出目的操作数矢量数据寄存器。src输入源操作数矢量的起始地址。offset输入偏移量。矢量数据寄存器的详细说明请参见reg数据类型定义.md。返回值说明无流水类型PIPE_V约束说明无调用示例vector_half dst; __ubuf__ half* src; asc_loadalign_brc_elem(dst, src);【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关新闻

Krea-2 Turbo模型三分钟选择指南:bf16、fp8、nvfp4哪个最适合你?

Krea-2 Turbo模型三分钟选择指南:bf16、fp8、nvfp4哪个最适合你?

Krea-2 Turbo模型三分钟选择指南:bf16、fp8、nvfp4哪个最适合你? 【免费下载链接】Krea-2 项目地址: https://ai.gitcode.com/hf_mirrors/Comfy-Org/Krea-2 你是否在使用AI绘图时感到困惑,面对Krea-2 Turbo提供的多种模型格式不知如何…

2026/7/4 5:40:35 阅读更多 →
实战指南:如何用Rust高效构建Lua解释器类型系统与内存管理

实战指南:如何用Rust高效构建Lua解释器类型系统与内存管理

实战指南:如何用Rust高效构建Lua解释器类型系统与内存管理 【免费下载链接】build-lua-in-rust 《用Rust实现Lua解释器》 / _Build a Lua Interpreter in Rust_ 项目地址: https://gitcode.com/gh_mirrors/bu/build-lua-in-rust 想要深入理解编程语言解释器的…

2026/7/4 5:38:35 阅读更多 →
终极硬盘清理指南:用Krokiet轻松找回丢失的存储空间

终极硬盘清理指南:用Krokiet轻松找回丢失的存储空间

终极硬盘清理指南:用Krokiet轻松找回丢失的存储空间 【免费下载链接】czkawka Multi functional app to find duplicates, empty folders, similar images etc. 项目地址: https://gitcode.com/GitHub_Trending/cz/czkawka 还在为电脑硬盘空间不足而烦恼吗&a…

2026/7/4 5:36:34 阅读更多 →

最新新闻

SQL聚合函数实战:SQL Ultimate Course数据分析基础指南

SQL聚合函数实战:SQL Ultimate Course数据分析基础指南

SQL聚合函数实战:SQL Ultimate Course数据分析基础指南 【免费下载链接】sql-ultimate-course The most comprehensive SQL guide from a real-world expert! Learn everything from basics to advanced queries, optimizations, and real-world SQL 项目地址: h…

2026/7/4 6:46:51 阅读更多 →
switch.vim性能优化:大型代码库中的高效文本切换策略终极指南

switch.vim性能优化:大型代码库中的高效文本切换策略终极指南

switch.vim性能优化:大型代码库中的高效文本切换策略终极指南 【免费下载链接】switch.vim A simple Vim plugin to switch segments of text with predefined replacements 项目地址: https://gitcode.com/gh_mirrors/sw/switch.vim 你是否在大型代码库中频…

2026/7/4 6:46:51 阅读更多 →
如何智能切换DLSS版本:游戏性能优化的终极指南

如何智能切换DLSS版本:游戏性能优化的终极指南

如何智能切换DLSS版本:游戏性能优化的终极指南 【免费下载链接】dlss-swapper 项目地址: https://gitcode.com/GitHub_Trending/dl/dlss-swapper 还在为游戏卡顿而烦恼吗?想要提升游戏帧率却不知从何下手?DLSS Swapper正是你需要的游…

2026/7/4 6:44:51 阅读更多 →
CANN/asc-devkit LoadData矩阵搬运

CANN/asc-devkit LoadData矩阵搬运

# LoadData(2D矩阵搬运) 【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景…

2026/7/4 6:44:51 阅读更多 →
终极音乐解析指南:4个PHP文件搞定四大平台音乐地址

终极音乐解析指南:4个PHP文件搞定四大平台音乐地址

终极音乐解析指南:4个PHP文件搞定四大平台音乐地址 【免费下载链接】music-api Music API 项目地址: https://gitcode.com/gh_mirrors/mu/music-api 还在为音乐平台API接口复杂而头疼吗?今天我要介绍一个简单实用的开源工具——music-api&#xf…

2026/7/4 6:42:50 阅读更多 →
ftpserver故障排除手册:常见问题诊断与解决方案大全

ftpserver故障排除手册:常见问题诊断与解决方案大全

ftpserver故障排除手册:常见问题诊断与解决方案大全 【免费下载链接】ftpserver Golang based autonomous FTP server with SFTP, S3, Dropbox, and Google Drive connectors. 项目地址: https://gitcode.com/gh_mirrors/ftp/ftpserver 作为一名Go语言开发的…

2026/7/4 6:40:50 阅读更多 →

日新闻

Memcached 1.6.43 发布:关键安全修复版本,多项问题得到解决

Memcached 1.6.43 发布:关键安全修复版本,多项问题得到解决

Memcached 1.6.43 正式发布,这是一个关键的安全修复版本,修复了多个方面的问题,还对部分功能进行了优化。 安全修复亮点 此次发布在安全修复上表现突出。binprot 避免了项目引用计数溢出,mcmc 因安全问题提升了上游版本号&#xf…

2026/7/4 0:04:29 阅读更多 →
终极指南:使用HMCL启动器跨平台畅玩Minecraft的完整解决方案

终极指南:使用HMCL启动器跨平台畅玩Minecraft的完整解决方案

终极指南:使用HMCL启动器跨平台畅玩Minecraft的完整解决方案 【免费下载链接】HMCL A Minecraft Launcher which is multi-functional, cross-platform and popular 项目地址: https://gitcode.com/gh_mirrors/hm/HMCL HMCL(Hello Minecraft! Lau…

2026/7/4 0:06:29 阅读更多 →
KMX63与PIC18F66K40在嵌入式HMI中的硬件协同与低功耗设计

KMX63与PIC18F66K40在嵌入式HMI中的硬件协同与低功耗设计

1. KMX63与PIC18F66K40的硬件协同架构解析KMX63作为一款三轴加速度计和磁力计组合传感器,与PIC18F66K40微控制器的搭配堪称嵌入式HMI开发的黄金组合。这套硬件组合的核心优势在于KMX63提供的高精度运动感知能力与PIC18F66K40强大的信号处理能力形成了完美互补。KMX6…

2026/7/4 0:06:29 阅读更多 →

周新闻

月新闻