模型导出为 ONNX/TensorRT 格式-尧图手机网站定制

将训练好的 YOLOv8 模型轻量化并导出为 ONNX/TensorRT 格式最终部署到 Jetson Nano 这类嵌入式设备上加速推理这是实际落地中非常关键的一步能显著提升模型在边缘设备上的运行速度。下面我会从模型导出、TensorRT 优化、Jetson Nano 部署三个核心环节给出完整的可执行步骤和代码确保你能一步步落地。一、核心原理ONNX是一种跨框架的模型格式作为中间桥梁能实现 PyTorch/TensorFlow 等框架到 TensorRT 的转换。TensorRTNVIDIA 推出的高性能推理引擎通过层融合、精度校准FP16/INT8、内核自动调优等方式优化模型大幅提升 NVIDIA 设备如 Jetson Nano的推理速度。轻量化核心除了格式转换还包括精度降低从 FP32 到 FP16/INT8、模型裁剪等在精度损失可控的前提下提升速度。二、完整实现步骤前置条件Jetson Nano 环境准备刷入 JetPack 系统推荐 JetPack 5.0自带 TensorRT、CUDA。确认已安装ultralytics、onnx、tensorrtbash运行# Jetson Nano 安装 ultralytics pip3 install ultralytics onnx # TensorRT 随 JetPack 自带无需额外安装验证是否安装成功 python3 -c import tensorrt; print(tensorrt.__version__)准备好训练好的 YOLOv8 模型best.pt。步骤 1导出 YOLOv8 模型为 ONNX 格式YOLOv8 内置了一键导出功能无需手动编写转换代码直接导出 ONNX 格式兼容 TensorRT。python运行from ultralytics import YOLO # 加载训练好的 YOLOv8 模型 model YOLO(best.pt) # 导出为 ONNX 格式关键参数说明 # format: 导出格式指定为 onnx # imgsz: 输入图像尺寸需和训练时一致如 640 # opset: ONNX 算子版本推荐 12兼容 TensorRT # dynamic: 动态输入尺寸可选嵌入式设备建议固定尺寸以提升速度 # half: 导出 FP16 精度轻量化核心减少显存占用 model.export( formatonnx, imgsz640, opset12, dynamicFalse, halfTrue # 导出 FP16 精度Jetson Nano 支持 )执行后会在模型同目录生成best.onnx文件这是中间格式模型。步骤 2将 ONNX 转为 TensorRT 引擎核心加速TensorRT 引擎.engine文件是针对 NVIDIA 硬件优化后的模型推理速度最快。有两种方式实现方式 1使用 YOLOv8 内置的 TensorRT 导出最简单python运行# 直接从 YOLOv8 模型导出 TensorRT 引擎 model.export( formatengine, imgsz640, device0, # Jetson Nano 的 GPU 设备号 halfTrue # FP16 精度 )执行后生成best.engine文件直接用于推理。方式 2手动用 TensorRT API 转换更灵活适合自定义优化python运行import tensorrt as trt import os # TensorRT 日志设置 TRT_LOGGER trt.Logger(trt.Logger.INFO) EXPLICIT_BATCH 1 (int)(trt.NetworkDefinitionCreationFlag.EXPLICIT_BATCH) def build_engine(onnx_file_path, engine_file_path): # 构建 TensorRT 引擎 builder trt.Builder(TRT_LOGGER) network builder.create_network(EXPLICIT_BATCH) parser trt.OnnxParser(network, TRT_LOGGER) config builder.create_builder_config() # 设置最大工作空间Jetson Nano 建议 1GB 以内 config.max_workspace_size 1 30 # 1GB # 启用 FP16 精度Jetson Nano 支持 config.set_flag(trt.BuilderFlag.FP16) # 解析 ONNX 文件 with open(onnx_file_path, rb) as f: if not parser.parse(f.read()): for error in range(parser.num_errors): print(parser.get_error(error)) return None # 构建并保存引擎 serialized_engine builder.build_serialized_network(network, config) with open(engine_file_path, wb) as f: f.write(serialized_engine) return engine_file_path # 转换 ONNX 到 TensorRT 引擎 onnx_file best.onnx engine_file best.engine if not os.path.exists(engine_file): build_engine(onnx_file, engine_file) print(fTensorRT 引擎已生成{engine_file}) else: print(f引擎文件已存在{engine_file})步骤 3在 Jetson Nano 上用 TensorRT 引擎推理使用生成的.engine文件进行推理速度远快于原始.pt模型python运行from ultralytics import YOLO # 加载 TensorRT 引擎模型 model YOLO(best.engine) # 推理单张图像Jetson Nano 上实测速度比 PT 模型快 2-5 倍 results model(test.jpg, imgsz640) # 解析位置结果和之前 PT 模型推理代码完全兼容 for r in results: boxes r.boxes for box in boxes: x1, y1, x2, y2 box.xyxy[0].tolist() cls_name model.names[box.cls[0].item()] conf box.conf[0].item() print(f类别{cls_name}, 置信度{conf:.2f}, 位置({x1:.1f},{y1:.1f})-({x2:.1f},{y2:.1f})) # 可视化结果 results[0].save(result_trt.jpg)步骤 4进阶优化INT8 精度极致轻量化如果追求更快速度可将模型转为 INT8 精度需准备校准数据集python运行# YOLOv8 导出 INT8 精度的 TensorRT 引擎 model.export( formatengine, imgsz640, device0, int8True, # 启用 INT8 精度 datadata.yaml # 校准数据集配置文件用于 INT8 量化 )注意INT8 精度会有轻微精度损失但速度比 FP16 再提升 30%-50%适合对精度要求不极致的场景。三、Jetson Nano 部署注意事项显存限制Jetson Nano 只有 4GB 显存建议使用 YOLOv8n轻量版、imgsz640 或更小如 480。电源供电必须用 5V/3A 电源否则会因供电不足导致推理卡顿或设备重启。散热Jetson Nano 推理时发热明显需加装散热风扇避免因过热降频。推理速度参考YOLOv8n FP32PT 模型~5 FPSYOLOv8n FP16TensorRT~15 FPSYOLOv8n INT8TensorRT~20 FPS总结模型轻量化到 Jetson Nano 部署的核心流程YOLOv8 PT 模型 → ONNX 中间格式 → TensorRT 引擎其中 TensorRT 是嵌入式设备加速的关键。优先选择FP16 精度导出 TensorRT 引擎在精度损失可控的前提下能让推理速度提升 2-5 倍。Jetson Nano 部署需注意显存、供电和散热建议使用轻量版模型YOLOv8n和固定输入尺寸。

通过神经网络识别图像位置

神经网络实现视觉图像位置识别，核心是目标检测（Object Detection） 技术，其本质是让模型同时完成目标分类（识别图像里有什么）和位置回归（预测目标的坐标框）。以下是从技术原理到落地实…

2026/7/3 18:31:44 阅读更多 →

北京首个AI教育实训基地！摩尔线程联合北京市十一学校赋能创新人才培养

2026年1月23日，摩尔线程与北京市十一学校共同宣布，双方战略合作的“AI教育实训基地”已正式启用。作为首个落地北京的AI实训示范项目，该基地部署了摩尔线程MTT AIBOOK及云端算力，为学校多元化的人工智能课程体系注入了坚实的国产算…

2026/7/4 22:03:58 阅读更多 →

浅谈 OpenAI Agents SDK

一、OpenAI Agents SDK是什么？ OpenAI Agents SDK是一个轻量级且易于使用的工具包，用于构建基于代理的AI应用程序。提供了一些基本构建块，包括具备指令和工具的代理（Agents）、用于代理间任务委托的交接（…

2026/7/5 0:40:29 阅读更多 →

【信息科学与工程学】【数据中心】【容灾备份】第三十一篇云数据中心各类CPU计算型业务跨数据中心容灾设计方案

一、云数据中心各类CPU计算型业务跨数据中心指标 1. Web应用服务设计领域设计子类特征/函数参数/指标用途说明数据中心内设计数据中心间设计网络设计数据中心内网络 1. 负载均衡网络 2. 应用层网络 3. 数据库网络 4. 缓存网络 5. 管理网络 1. 带宽：>…

2026/7/5 15:44:38 阅读更多 →

K-Means 聚类的目标函数：簇内误差平方和

1. 什么是 K-Means？ K-Means 是一种无监督、迭代式的聚类算法： 给定数据集 {x₁, x₂, …, xₙ} 与预设簇数 K，算法把样本划分为 K 个不相交的簇 C₁, C₂, …, Cₖ，使得同一簇内样本尽可能相似，不同簇间样本尽可能远离…

2026/7/5 15:44:38 阅读更多 →

【信息科学与工程学】计算机科学与自动化——第三十八篇质量工程 02 云数据中心质量工程

云数据中心质量工程体系（规划-评估-测试-验证-交付）编码阶段层级核心领域子领域质量属性/活动关键交付物/指标核心方法/工具评估标准挑战与风险 1 核心理念战略层质量哲学可靠性即产品将数据中心可靠性、性能、安全作为可销售、可承诺的服务产品…

2026/7/5 15:42:38 阅读更多 →

net 跨平台也是一句谎言

以前很热炒跨平台，主要是由于硅谷挑战微软霸主地位的热情，但是冷静下来后，跨平台往往不是那么一回事。假设你有个软件，所谓的跨平台，你只需要为第二个平台上重新编译一次就行了，这样很难么？ c语…

2026/7/5 15:40:38 阅读更多 →

终极指南：如何用CSUR程序化生成系统打造真实城市道路网络

终极指南：如何用CSUR程序化生成系统打造真实城市道路网络【免费下载链接】CSUR Offline procedural generation of realistic road environments in Cities: Skylines 项目地址: https://gitcode.com/gh_mirrors/cs/CSUR Cities: Skylines Urban Road (CSUR…

2026/7/5 15:38:37 阅读更多 →

121、SPPF 的核大小与级联次数消融：3/5/7 核与 2/3/4 次级联的 12 组实验

121、SPPF 的核大小与级联次数消融：3/5/7 核与 2/3/4 次级联的 12 组实验从一次线上事故说起去年秋天，我在给一个工业质检项目调优YOLOv11时，遇到了一个诡异的精度抖动问题。模型在验证集上mAP@0.5:0.95从0.723跳到0.738又跳回0.719，每次训练结果都不一样，但训练曲线看…

2026/7/5 15:38:37 阅读更多 →

日新闻

B站视频下载神器BiliTools：5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools：5分钟学会轻松保存任何B站内容【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱，支持下载视频、番剧等等各类资源项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →

威胁模型全解析：从新手入门到实战应用，助你构建安全产品！

威胁模型的陌生现状在忙碌疲惫的一天里，参与了关于混合后量子密码学的讨论，应付端点攻击找茬的人，还参与留言板讨论后，发现“威胁模型”对多数人仍是陌生概念，且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →

渗透测试入门指南：从零基础到实战环境搭建

1. 从“看热闹”到“入门”：我理解的渗透测试到底是什么？每次看到新闻里说某个大公司的数据被“黑”了，或者某个网站被攻击导致服务瘫痪，你是不是和我一样，心里会冒出两个念头：一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

周新闻

B站视频下载神器BiliTools：5分钟学会轻松保存任何B站内容

2026/7/5 0:03:34 阅读更多 →

威胁模型全解析：从新手入门到实战应用，助你构建安全产品！

2026/7/5 0:03:34 阅读更多 →

渗透测试入门指南：从零基础到实战环境搭建

2026/7/5 0:07:38 阅读更多 →

模型导出为 ONNX/TensorRT 格式

相关新闻

通过神经网络识别图像位置

北京首个AI教育实训基地！摩尔线程联合北京市十一学校赋能创新人才培养

浅谈 OpenAI Agents SDK

最新新闻

【信息科学与工程学】【数据中心】【容灾备份】第三十一篇云数据中心各类CPU计算型业务跨数据中心容灾设计方案

K-Means 聚类的目标函数：簇内误差平方和

【信息科学与工程学】计算机科学与自动化——第三十八篇质量工程 02 云数据中心质量工程

net 跨平台也是一句谎言

终极指南：如何用CSUR程序化生成系统打造真实城市道路网络

121、SPPF 的核大小与级联次数消融：3/5/7 核与 2/3/4 次级联的 12 组实验

日新闻

B站视频下载神器BiliTools：5分钟学会轻松保存任何B站内容

威胁模型全解析：从新手入门到实战应用，助你构建安全产品！

渗透测试入门指南：从零基础到实战环境搭建

周新闻

B站视频下载神器BiliTools：5分钟学会轻松保存任何B站内容

威胁模型全解析：从新手入门到实战应用，助你构建安全产品！

渗透测试入门指南：从零基础到实战环境搭建

月新闻

模型导出为 ONNX/TensorRT 格式

相关新闻

通过神经网络识别图像位置

北京首个AI教育实训基地！摩尔线程联合北京市十一学校赋能创新人才培养

浅谈 OpenAI Agents SDK

最新新闻

【信息科学与工程学】【数据中心】【容灾备份】第三十一篇 云数据中心各类CPU计算型业务跨数据中心容灾设计方案

K-Means 聚类的目标函数：簇内误差平方和

【信息科学与工程学】计算机科学与自动化——第三十八篇 质量工程 02 云数据中心质量工程

net 跨平台也是一句谎言

终极指南：如何用CSUR程序化生成系统打造真实城市道路网络

121、SPPF 的核大小与级联次数消融：3/5/7 核与 2/3/4 次级联的 12 组实验

日新闻

B站视频下载神器BiliTools：5分钟学会轻松保存任何B站内容

威胁模型全解析：从新手入门到实战应用，助你构建安全产品！

渗透测试入门指南：从零基础到实战环境搭建

周新闻

B站视频下载神器BiliTools：5分钟学会轻松保存任何B站内容

威胁模型全解析：从新手入门到实战应用，助你构建安全产品！

渗透测试入门指南：从零基础到实战环境搭建

月新闻

【信息科学与工程学】【数据中心】【容灾备份】第三十一篇云数据中心各类CPU计算型业务跨数据中心容灾设计方案

【信息科学与工程学】计算机科学与自动化——第三十八篇质量工程 02 云数据中心质量工程