SAM3模型来了,手把手带你运行SAM3模型代码,SAM3模型初探!
SAM3模型简介SAM3Segment Anything Model 3是Meta推出的第三代通用图像分割模型具备零样本迁移能力支持多模态输入如图像、文本提示。相比前代SAM3在精度、速度和交互方式上均有显著提升适用于复杂场景分割任务。环境准备Python 3.8和PyTorch 1.11是基础依赖。安装SAM3的官方库及相关工具pip install segment-anything pip install opencv-python matplotlib确保CUDA版本与PyTorch匹配以启用GPU加速。模型下载与加载SAM3提供预训练权重默认基于ViT-H backbone。通过官方仓库下载权重文件如sam_vit_h_4b8939.pth并加载模型from segment_anything import sam_model_registry model sam_model_registry[vit_h](checkpointpath/to/sam_vit_h_4b8939.pth).to(cuda)图像分割示例使用OpenCV读取图像并生成分割掩码import cv2 import numpy as np from segment_anything import SamPredictor predictor SamPredictor(model) image cv2.imread(image.jpg) image cv2.cvtColor(image, cv2.COLOR_BGR2RGB) predictor.set_image(image) # 通过点提示分割前景点坐标 input_point np.array([[x, y]]) # 替换为实际坐标 input_label np.array([1]) # 1表示前景点 masks, scores, _ predictor.predict(point_coordsinput_point, point_labelsinput_label)多模态提示支持SAM3支持文本提示分割需结合CLIP等模型生成文本嵌入。示例代码需调用多模态接口text_prompt a red car text_embedding get_text_embedding(text_prompt) # 需自定义文本编码函数 masks predictor.predict(text_embeddingtext_embedding)结果可视化使用Matplotlib显示分割结果import matplotlib.pyplot as plt plt.imshow(image) plt.imshow(masks[0], alpha0.5) # 叠加掩码 plt.scatter(input_point[:,0], input_point[:,1], cr, marker*) plt.show()性能优化技巧批处理对多张图像使用predictor.predict_batch提升效率。量化加载量化模型减少显存占用model sam_model_registry[vit_h](checkpointpath/to/sam_vit_h_4b8939.pth, quantTrue)ONNX导出转换为ONNX格式部署至边缘设备。常见问题显存不足尝试使用vit_b或vit_l等轻量版模型。分割不准确增加更多交互提示点或调整提示文本的粒度。通过以上步骤可快速体验SAM3的核心功能更多高级用法参考官方文档和开源社区示例。SAM3模型来了手把手带你运行SAM3模型代码SAM3模型初探Meta 终于把 SAM3 开源了 虽然论文和模型架构早就放出来了但权重一直锁着直到前两天才真正公开。 我第一时间冲去跑通效果真的逆天——纯文本提示就能精准分割多个同类目标还带 ID 和置信度完爆 SAM2 的点框交互方式。先直接上干货下方是原始图像输入提示词 shoe结果再换提示词 child结果这才是真正的“语义理解分割”啊 支持文本、参考图像、视频追踪等多模态提示潜力巨大。下面我把整个 Windows 本地跑通过程手把手写成最详细图文教程包含我踩过的所有坑 解决方案跟着做100%能跑起来。环境要求必须满足NVIDIA 独显AMD/核显无解CUDA ≥ 12.6强烈建议更新到最新显卡驱动已安装 CondaMiniconda 或 Anaconda 都行完整步骤已亲测 4090 Win11 完美运行创建并激活环境conda create -n sam3 python3.12 -y conda activate sam3安装 PyTorch必须这个版本官方指定pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126下载源码推荐直接下载 zip避免 git 克隆不稳定GitHub 地址https://github.com/facebookresearch/sam3下载 ZIP → 解压 → 打开文件夹进入项目目录安装核心依赖cd path\to\sam3-main pip install -e .安装示例所需额外包pip install opencv-python matplotlib pandas tqdm重大坑位一Windows 下缺少 triton 包直接运行会报 No module named triton 官方 triton 不支持 Windows但社区大佬已编译好替代版pip install triton-windows3.3.0.post19装完这步基本解决 90% 人的卡死问题重大坑位二权重无法下载最致命SAM3 权重放在 Hugging Face需要申请访问权限。 我申请了 → 被拒了 很多人也一样被拒目前 Meta 不知道按什么标准批。好在社区已经有人放出了直链我下载好了 文件sam3.pt 大小约 3.2GB把 sam3.pt 复制到项目根目录和 sam3 文件夹同级然后修改源码让它加载本地权重否则默认去 HF 下载会一直网络错误打开文件sam3/model_builder.py找到以下两处CtrlF 搜索关键字load_from_hf True → 改成 Falsecheckpoint_path None → 改成 sam3.pt改完保存。最终测试代码新建 main.py 文件粘贴以下代码import torch import matplotlib.pyplot as plt from PIL import Image from sam3.model_builder import build_sam3_image_model from sam3.model.sam3_image_processor import Sam3Processor from sam3.visualization_utils import plot_results # 加载模型会自动读取本地 sam3.pt model build_sam3_image_model() processor Sam3Processor(model) # 加载测试图片 image Image.open(assets/images/test_image.jpg) # 设置图像这一步会做全图编码 inference_state processor.set_image(image) # 文本提示分割换成你想要的词 inference_state processor.set_text_prompt(stateinference_state, promptchild) # 或者分割鞋子promptshoe # 或者试试promptfoot / sock / person / hat 都好使 # 可视化结果我修复了官方 plot_results 没 plt.show() 的 bug plot_results(image, inference_state) plt.show() # 加上这句才能弹出图片运行 python main.py第一次运行会稍微慢一点加载模型之后就很快了。至此SAM3 就在你本地完美跑起来了 后续我还会继续出参考图像分割视频目标追踪结合 CLIP 做更复杂提示自定义数据集微调等进阶玩法系列都会持续更新建议关注 收藏随时来看最新进展最后关于权重文件 sam3.pt我这里已经下载好了3.2GB完整官方权重

相关新闻

强烈建议立即搞个软考证!(政策风口)

强烈建议立即搞个软考证!(政策风口)

🔊注意:2026软考生恭喜了!让你一次上岸的机会来了!「2026软考上岸学习群」正式开放!25年软考已结束!你是不是也踩了这些坑😭:❎考点又多又杂,复习毫无重点;❎…

2026/7/2 20:12:34 阅读更多 →
140+页神奇的逻辑图(橄榄绿)

140+页神奇的逻辑图(橄榄绿)

扫描下载文档详情页: https://www.didaidea.com/wenku/16416.html

2026/7/3 15:03:09 阅读更多 →
LeetCode 热题 100--字母异位词分组

LeetCode 热题 100--字母异位词分组

题目:解析:核心思路字母异位词的特征:相同字母组成的不同单词,排序后会得到相同的字符串使用排序字符串作为哈希键:将每个单词排序后作为分组的唯一标识哈希表存储分组:键是排序后的字符串,值是…

2026/7/3 15:03:11 阅读更多 →

最新新闻

5分钟掌握CSS变体管理神器:CVA终极指南

5分钟掌握CSS变体管理神器:CVA终极指南

5分钟掌握CSS变体管理神器:CVA终极指南 【免费下载链接】cva Class Variance Authority 项目地址: https://gitcode.com/gh_mirrors/cv/cva 你是否曾为UI组件的CSS类名管理而头疼?😫 面对不同尺寸、颜色、状态的按钮变体,手…

2026/7/4 8:05:14 阅读更多 →
wiliwili:专为手柄用户打造的跨平台B站客户端完全指南

wiliwili:专为手柄用户打造的跨平台B站客户端完全指南

wiliwili:专为手柄用户打造的跨平台B站客户端完全指南 【免费下载链接】wiliwili 第三方B站客户端,目前可以运行在PC全平台、PSVita、PS4 、Xbox 和 Nintendo Switch上 项目地址: https://gitcode.com/GitHub_Trending/wi/wiliwili 你是否厌倦了在…

2026/7/4 8:05:14 阅读更多 →
豆包与元宝深度对比:AI工具背后的生态能力拆解

豆包与元宝深度对比:AI工具背后的生态能力拆解

1. 这不是“选APP”,而是一场生态级能力的现场拆解你刷到这条内容时,大概率正躺在沙发上,左手握着手机,右手刚点开豆包准备扒拉一段抖音口播文案;或者刚在视频号看完一篇深度长文,顺手把链接甩进元宝&#…

2026/7/4 8:05:14 阅读更多 →
Optimus钩子(Hooks)机制详解:实现数据转换后处理的完整教程

Optimus钩子(Hooks)机制详解:实现数据转换后处理的完整教程

Optimus钩子(Hooks)机制详解:实现数据转换后处理的完整教程 【免费下载链接】optimus Optimus is an easy-to-use, reliable, and performant workflow orchestrator for data transformation, data modeling, pipelines, and data quality m…

2026/7/4 8:01:13 阅读更多 →
CANN/ge LLM集群连接API

CANN/ge LLM集群连接API

# link_clusters 【免费下载链接】ge GE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorc…

2026/7/4 8:01:13 阅读更多 →
计算机毕业设计之springboot营养配餐管理系统

计算机毕业设计之springboot营养配餐管理系统

随着当今网络的发展,时代的进步,各行各业也在发生着变化,于是网络已经逐步进入人们的生活,给我们生活或者工作提供了新的方向新的可能。 本毕业设计的内容是设计实现一个基于springboot框架的营养配餐管理系统。它是以java语言&am…

2026/7/4 7:59:12 阅读更多 →

日新闻

Memcached 1.6.43 发布:关键安全修复版本,多项问题得到解决

Memcached 1.6.43 发布:关键安全修复版本,多项问题得到解决

Memcached 1.6.43 正式发布,这是一个关键的安全修复版本,修复了多个方面的问题,还对部分功能进行了优化。 安全修复亮点 此次发布在安全修复上表现突出。binprot 避免了项目引用计数溢出,mcmc 因安全问题提升了上游版本号&#xf…

2026/7/4 0:04:29 阅读更多 →
终极指南:使用HMCL启动器跨平台畅玩Minecraft的完整解决方案

终极指南:使用HMCL启动器跨平台畅玩Minecraft的完整解决方案

终极指南:使用HMCL启动器跨平台畅玩Minecraft的完整解决方案 【免费下载链接】HMCL A Minecraft Launcher which is multi-functional, cross-platform and popular 项目地址: https://gitcode.com/gh_mirrors/hm/HMCL HMCL(Hello Minecraft! Lau…

2026/7/4 0:06:29 阅读更多 →
KMX63与PIC18F66K40在嵌入式HMI中的硬件协同与低功耗设计

KMX63与PIC18F66K40在嵌入式HMI中的硬件协同与低功耗设计

1. KMX63与PIC18F66K40的硬件协同架构解析KMX63作为一款三轴加速度计和磁力计组合传感器,与PIC18F66K40微控制器的搭配堪称嵌入式HMI开发的黄金组合。这套硬件组合的核心优势在于KMX63提供的高精度运动感知能力与PIC18F66K40强大的信号处理能力形成了完美互补。KMX6…

2026/7/4 0:06:29 阅读更多 →

周新闻

月新闻