windows 虚拟环境编译flash_attn
要安装Bagel试试效果需要安装flash_attnwindows上flash_attn编译非常慢都是用网络上别人编译好的.whl文件Bagel要求的flash_attn2.5.8 torch2.5.1但网上找不到要求的版本就很难受其实不用完全符合要求的自己稍微适配一下也能用但我想试着编译编译做个记录所以就自己捣鼓捣鼓试试Microsoft Visual Studio 2022 版本17.13.5anaconda 版本2024.10-1python 版本3.10Microsoft Visual Studio里关于c的依赖我也不知道需要什么就都安装首先创建虚拟环境conda create -n flash_attn python3.10 -y conda activate flash_attn安装cuda-toolkitconda install cuda-toolkit12.4 -y -c conda-forgecuda-toolkit是虚拟环境内的cuda和本地安装的cuda不冲突使用nvcc -V可以看到版本我本机用的是11.7后来有些算法需要其他版本的cuda懒得搞多版本切换就使用虚拟环境的cuda了安装完后变成12.4了安装完后可以使用Get-Command nvcc | Select-Object -ExpandProperty Source查询路径我的路径是C:\python\envs\flash_attn\Library\bin\nvcc.exe这个路径一会儿要用先放着接下来安装torchBagel的torch的版本是2.5.1pip install torch2.5.1 torchvision0.20.1 --index-url https://download.pytorch.org/whl/cu124接下来创建一个python文件写上代码import os os.environ[CUDA_PATH] rC:\python\envs\flash_attn\Library def run(): os.system(pip install flash_attn2.5.8) if __name__ __main__: run()代码很简单把cuda的环境变量变成虚拟环境的再用子进程进行安装为什么要这么麻烦因为正常安装flash_attn时他会读取环境变量的cuda路径下面开始编译flash_attn编译要很久可以先看我遇到什么问题再自己试试也可以跟着我一步一步试错第一次运行这里有个前提网络必须能访问GitHub否则报错Guessing wheel URL:GitHub上whl的下载地址python main.py报错LINK : fatal error LNK1181: 无法打开输入文件“cudart.lib” error: command C:\\Program Files\\Microsoft Visual Studio\\2022\\Community\\VC\\Tools\\MSVC\\14.43.34808\\bin\\HostX86\\x64\\link.exe failed with exit code 1181打开我的cuda11.7文件夹通过查找找到cudart.lib文件在lib\x64文件夹下而C:\python\envs\flash_attn\Library\lib\x64文件下只有一个cmake文件夹再通过查找发现cudart.lib文件在C:\python\envs\flash_attn\Library\lib文件夹下将C:\python\envs\flash_attn\Library\lib文件夹下的除了文件夹的所有文件都复制到C:\python\envs\flash_attn\Library\lib\x64文件夹下也可以试试缺什么复制什么我嫌多次编译太费时间就都复制过来了再次执行python main.py编译完成有一个问题这次没遇到我就说一下在编译的时候会报cuda_fp16.h文件内找不到nv/target可以进入到C:\python\envs\flash_attn\Library\include\targets\x64文件夹内复制nv文件夹到C:\python\envs\flash_attn\Library\include文件下没报这个错误可以不用管接下来试试源码编译git clone --branch v2.7.4 https://github.com/Dao-AILab/flash-attention.git cd flash-attention选择v2.7.4是因为最新版cuda要12.8新建个python文件思路一样修改环境变量import os os.environ[CUDA_PATH] rC:\python\envs\flash_attn\Library def run(): os.system(python setup.py install) if __name__ __main__: run()报错Traceback (most recent call last): File K:\python\PycharmProjects\flash_attn\flash-attention\setup.py, line 150, in module subprocess.run([git, submodule, update, --init, csrc/composable_kernel], checkTrue) File C:\python\envs\flash_attn\lib\subprocess.py, line 526, in run raise CalledProcessError(retcode, process.args, subprocess.CalledProcessError: Command [git, submodule, update, --init, csrc/composable_kernel] returned non-zero exit status 1.手动执行一下命令行git submodule update --init csrc/composable_kernel再重新执行python main.py经过漫长的等待别人都要求安装对应的cuda什么的我这属于偷懒直接用虚拟环境的cuda为了不重复编译可以编译成whl文件import os os.environ[CUDA_PATH] rC:\python\envs\flash_attn\Library def run(): os.system(python setup.py bdist_wheel) if __name__ __main__: run()

相关新闻

如何使用PowerTOP交互式模式:3分钟掌握Linux功耗实时监控

如何使用PowerTOP交互式模式:3分钟掌握Linux功耗实时监控

如何使用PowerTOP交互式模式:3分钟掌握Linux功耗实时监控 【免费下载链接】powertop The Linux PowerTOP tool -- please post patches to the mailing list instead of using github pull requests 项目地址: https://gitcode.com/gh_mirrors/po/powertop P…

2026/7/3 22:48:43 阅读更多 →
负载均衡与keepalived高可用

负载均衡与keepalived高可用

1. ✅负载均衡处理用户的流程处理静态资源用户 -- >|bdns解析 -- 域名 --- >lb ip上.通过三次握手与负载均衡80端口建立连接.发出http请求报文:GETURI,Host头信息,UA.到达负载均衡lb,80端口,http区域,server区域多个server请求的Host信息与80端口server的server_name进行…

2026/7/3 22:48:51 阅读更多 →
彻底掌握Java 8日期时间API:从基础概念到实战应用

彻底掌握Java 8日期时间API:从基础概念到实战应用

彻底掌握Java 8日期时间API:从基础概念到实战应用 【免费下载链接】learn-java8 项目地址: https://gitcode.com/gh_mirrors/lea/learn-java8 Java 8引入的全新日期时间API是对传统java.util.Date和Calendar的重大改进,解决了线程不安全、API设计…

2026/5/17 11:58:49 阅读更多 →

最新新闻

联想拯救者BIOS高级设置一键解锁工具:3分钟开启隐藏功能终极指南

联想拯救者BIOS高级设置一键解锁工具:3分钟开启隐藏功能终极指南

联想拯救者BIOS高级设置一键解锁工具:3分钟开启隐藏功能终极指南 【免费下载链接】LEGION_Y7000Series_Insyde_Advanced_Settings_Tools 支持一键修改 Insyde BIOS 隐藏选项的小工具,例如关闭CFG LOCK、修改DVMT等等 项目地址: https://gitcode.com/gh…

2026/7/3 22:48:05 阅读更多 →
【小白也能轻松玩转龙虾】虾壳云一键部署全程图文对照,新手跟着操作零难度(附最新安装包)

【小白也能轻松玩转龙虾】虾壳云一键部署全程图文对照,新手跟着操作零难度(附最新安装包)

OpenClaw(小龙虾)Windows 一键部署实操手册|十分钟搭建专属本地数字员工 适配平台:Windows 10/11(64 位)|零基础友好|全可视化界面|无编程门槛 当下热度较高的开源 AI 智…

2026/7/3 22:46:05 阅读更多 →
WzComparerR2:深入解析冒险岛WZ文件资源的专业提取器

WzComparerR2:深入解析冒险岛WZ文件资源的专业提取器

WzComparerR2:深入解析冒险岛WZ文件资源的专业提取器 【免费下载链接】WzComparerR2 Maplestory online Extractor 项目地址: https://gitcode.com/gh_mirrors/wz/WzComparerR2 WzComparerR2是一款专业的冒险岛游戏资源提取器,专门用于解密、分析…

2026/7/3 22:46:05 阅读更多 →
QtScrcpy终极指南:如何在电脑上免费流畅控制安卓手机

QtScrcpy终极指南:如何在电脑上免费流畅控制安卓手机

QtScrcpy终极指南:如何在电脑上免费流畅控制安卓手机 【免费下载链接】QtScrcpy Android实时投屏软件,此应用程序提供USB(或通过TCP/IP)连接的Android设备的显示和控制。它不需要任何root访问权限 项目地址: https://gitcode.com/barry-ran/QtScrcpy …

2026/7/3 22:44:05 阅读更多 →
LiteLLM代理配置优化:解决DeepSeek API Token异常消耗问题

LiteLLM代理配置优化:解决DeepSeek API Token异常消耗问题

🚀 30款热门AI模型一站整合,DeepSeek/GLM/Claude 随心用,限时 5 折。 👉 点击领海量免费额度 如果你正在使用 Codex 或类似的开源 AI 编程助手,并且通过 LiteLLM 等代理工具接入了 DeepSeek 的 API,那么…

2026/7/3 22:44:05 阅读更多 →
缠论自动化分析革命:ChanlunX让技术分析从复杂到简单

缠论自动化分析革命:ChanlunX让技术分析从复杂到简单

缠论自动化分析革命:ChanlunX让技术分析从复杂到简单 【免费下载链接】ChanlunX 缠中说禅炒股缠论可视化插件 项目地址: https://gitcode.com/gh_mirrors/ch/ChanlunX 你是否曾在K线图中迷失方向,面对缠论复杂的笔段划分和中枢识别感到无从下手&a…

2026/7/3 22:40:03 阅读更多 →

日新闻

Nginx防御TLS重协商攻击实战:从原理到配置与监控

Nginx防御TLS重协商攻击实战:从原理到配置与监控

1. 项目概述:为什么TLS重协商攻击至今仍需警惕十多年前的CVE-2011-1473,一个关于TLS/SSL协议重协商机制的漏洞,现在提起来还有必要吗?很多运维和开发朋友可能会觉得,这都老掉牙了,现代服务器和客户端不都默…

2026/7/3 0:03:59 阅读更多 →
华为防火墙双通道远程管理实战:Web与SSH配置详解

华为防火墙双通道远程管理实战:Web与SSH配置详解

1. 项目概述:为什么需要双通道远程管理防火墙?在任何一个稍具规模的企业网络里,防火墙都是那个默默守护在边界的关键角色。作为网络工程师,我们不可能每次都跑到机房,插上console线去配置它。远程管理能力,…

2026/7/3 0:03:59 阅读更多 →
AD74413R与PIC18F65K40的高精度工业数据采集方案

AD74413R与PIC18F65K40的高精度工业数据采集方案

1. 项目概述:AD74413R与PIC18F65K40的协同工作在工业自动化和精密测量领域,同时实现高精度模数转换(ADC)和数模转换(DAC)功能是许多复杂系统的核心需求。AD74413R作为一款四通道可配置模拟输入/输出器件,与PIC18F65K40微控制器的组合&#xf…

2026/7/3 0:05:59 阅读更多 →

周新闻

月新闻