使用conda进行funasr本地部署从环境配置到避坑指南一、为什么要在本地折腾 FunASR第一次接到“把 FunASR 跑在笔记本上”的任务时我的内心是拒绝的“不是有现成的 SaaS 吗”甲方一句话把我怼回来“数据不能出内网还得离线改模型。”FunASR 是阿里达摩院开源的语音识别工具包支持中文、方言、甚至带点口头禅的语音转文字效果比通用 API 好一截。可它依赖的 PyTorch、CUDA、kaldi 三方库版本互相掐架本地部署最常出现的画面就是pip 装完 torchimport 报错libcublas.so.x找不到conda 装完 cudatoolkit运行却提示CUDA capability sm_86 is not supported好不容易跑起来一推理就 OOMGPU 显存比钱包还干净这篇文章把我踩过的坑一次性铺平给只想“让它先跑起来”的新手一条活路。二、为什么选 conda而不是 venv / docker / pipx工具优点缺点结论venvPython 自带轻量无法管理二进制依赖如 CUDA不适合pipx无需要手动编译镜像大新手劝退conda一条命令搞定 PythonCUDAcuDNN体积大、源慢最稳poetry依赖解析漂亮对系统库无能为力后续可迁一句话先 conda 让环境“能跑”再考虑迁移到 poetry 或容器。三、全流程实战从 0 到第一次成功识别1. 安装 Miniconda已装请跳过去官网选Miniconda别装臃肿的 Anaconda。Windows 记得勾选 “Add Anaconda to my PATH”否则后面conda命令找不到。2. 创建隔离环境# 新建一个专门给 FunASR 的 3.9 环境名字随便取 conda create -n funasr python3.9 -y conda activate funasrTipsPython≥3.8 即可但 3.9 目前兼容性最好。环境名别用中文Linux 下容易乱码。3. 一次性装好 GPU 全家桶# 以 CUDA 11.8 为例30/40 系显卡通用 conda install pytorch2.0.1 torchvision torchaudio pytorch-cuda11.8 -c pytorch -c nvidia验证是否成功python - PY import torch, torchaudio print(torch.__version__, torchaudio.__version__) print(CUDA available:, torch.cuda.is_available()) PY看到True再继续否则后面全是泪。4. 装 FunASR 主包 模型仓库# 官方源 pip install funasr -i https://pypi.org/simple # 国内镜像加速清华 pip install funasr -i https://pypi.tuna.tsinghua.edu.cn/simple装完顺手把常用模型拖下来省得推理时再下载from funasr import AutoModel # 这句会缓存到 ~/.cache/modelscope model AutoModel(modelparaformer-zh, vad_modelfsmn-vad, punc_modelct-punc) print(模型下载完成大小约 1.2 G)5. 写个最小可运行脚本# test_funasr.py from funasr import AutoModel model AutoModel( modelparaformer-zh, # 中文通用 vad_modelfsmn-vad, # 语音活动检测 punc_modelct-punc, # 加标点 devicecuda:0 ) wav_path demo_16k.wav # 16kHz 单声道 result model.generate(inputwav_path) print(识别结果, result[0][text])把随便一段 16k 的 wav 扔进去能出汉字就说明环境 OK。四、conda 环境配置文件可复现把下面内容保存成funasr-gpu.yaml一键重建name: funasr channels: - pytorch - nvidia - conda-forge dependencies: - python3.9 - pytorch2.0.1 - torchvision - torchaudio - pytorch-cuda11.8 - pip - pip: - funasr - modelscope # 模型管理使用conda env create -f funasr-gpu.yaml conda activate funasr五、避坑 FAQ持续更新显卡驱动太老报错CUDA driver version is insufficient→ 升级驱动 ≥ 525或干脆用 CPU 推理devicecpu。CUDA 11.8 与系统 12.x 冲突→ conda 环境里pytorch-cuda自带运行库不影响系统目录放心装。ffmpeg 缺失报错ffprobe not found→conda install ffmpeg -c conda-forge别用 apt 版容易版本错位。推理爆显存→ 长音频先切分加batch_size_s300单位秒或者干脆用vad_model自动切段。Windows 下路径空格→ 把模型缓存目录改到没空格的盘set MODELSCOPE_CACHED:\models六、性能调优小贴士纯 CPU 机子装onnxruntime版模型推理速度 ×2pip install funasr[onnx]显存 6 G 以下加--chunk_size 16流式识别牺牲一点精度换稳定显存 24 G 以上把batch_size_s拉到 600并发跑多个文件GPU 利用率 90%笔记本散热差export CUDA_LAUNCH_BLOCKING1可降温度但速度略慢七、小结与下一步跟着上面六步你应该已经能在本地把一段 wav 扔给 FunASR然后看到整整齐齐的中文。conda 的好处就是“装得全、回滚快”先把环境跑通再去折腾微调、热词、流式接口。如果你卡在了其他奇怪的错误欢迎留言贴 traceback一起把坑填平。跑通后不妨试试点播一段方言音频看看 FunASR 能不能把你家那边的“儿化音”也抠出来——有惊喜。