热红外视觉下的车辆/船舶重识别新方法:Vc-fes
在监控与海事安防等场景中,如何在**热红外图像**(灰度、无色彩、纹理弱)中准确识别同一辆车或同一艘船,是一个长期悬而未决的难题。近期发表于《International Journal of Machine Learning and Cybernetics》(2026年)的论文《Vc-fes: viewpoint-conditioned feature selection for vehicle re-identification in thermal vision》针对这一问题提出了一套完整的解决方案。## 问题:热红外域重识别为什么难传统的重识别(Re-ID)方法大多在RGB图像上训练,依赖颜色和纹理这类跨视角通用的线索来判断两张图片是否为同一目标。但在热红外图像中:- 没有颜色信息,只剩灰度强度;- 纹理细节被大幅削弱;- 可获取的视角数量有限(不像RGB场景那样容易采集多角度样本)。这导致同类目标(比如两艘外形相近的渔船)在缺乏颜色线索时高度相似,而同一目标从不同视角(前、侧、后)拍摄时特征差异又很大——这两个矛盾叠加,使得直接套用RGB域的重识别算法效果很差。## 方法:视角条件化的特征选择论文提出的核心思路是**将目标的前景图像按可见侧面(前、侧、后)拆分,分别提取特征并分空间比较**,再用各视角的面积占比作为置信度权重融合最终结果。整体流程分为两个子系统:**1. 目标检测与跟踪**基于 TraDeS 算法,针对热红外域做了适配与微调,先用转灰度的COCO数据预训练,再用新采集的热红外海事数据集及 Singapore Maritime Dataset 进行微调,使模型能够在缺乏颜色特征的情况下完成检测与跟踪。**2. 视角条件化重识别**- 首先用一个自建的编码器-解码器网络提取目标前景掩码(实验表明这一步比传统的 GrabCut 方法更适合热红外图像,尤其是在处理船体细小凸出部分和海面反光干扰时表现更好);- 用预训练的 Dino-ViT 提取特征,并通过四个并行线性层将特征映射到全局、前、侧、后四个隐空间,每个空间用 ArcFace 损失增强类间可分性;- 借助与 SPAN 模型类似的思路计算每个视角的**面积占比**(该视角前景掩码占总前景的比例),以此对各空间的 L2 距离加权求和,得到最终的置信度得分;- 训练时联合使用身份分类损失和三元组损失。这种设计的关键优势在于:当查询图像只能看到某一两个侧面时,面积占比会自动把不可见视角的权重降为零,避免了无效比较对最终结果的干扰。## 数据集:首个公开的热红外海事重识别数据集为验证方法,作者用 FLIR M232 热像仪自行采集了一个海事监控数据集,涵盖白天和夜晚场景,标注了船只、大型船舶、行人、水上摩托艇等4类目标的检测框,并整理出用于重识别评估的40艘小型船舶和32艘大型船舶的多视角图像子集。据作者所述,这是目前首个公开的热红外海事监控数据集,同时支持检测、跟踪与重识别三类任务的COCO格式标注。## 结果在跟踪任务上,改进后的 TraDeS 在热红外数据上取得了约 61.2% 的 MOTA,与其在RGB域的表现基本持平,同时保持 30fps 的处理速度,证明了域适配的有效性。在重识别任务上,该方法在RGBNT100(热红外车辆数据集)和作者自建的海事数据集上分别以 mAP 提升 19.7% 和 12.8% 超过此前的最优方法(SPAN)。消融实验也表明:引入 ViT 特征提取、ArcFace 视角空间映射、以及多视角特征融合(相较仅用面积占比最大的单一视角)均能带来稳定的性能提升,尤其在热红外域收益最为明显。## 链接- 论文原文:https://link.springer.com/article/10.1007/s13042-026-03049-w- 数据集主页:https://hevidra.github.io/- 代码仓库:https://github.com/YasodGinige/VCFeS-Maritime-Surveillance

相关新闻

本地AI完全指南①:我把ChatGPT退了,一年省2400——为什么越来越多人把大模型搬回家

本地AI完全指南①:我把ChatGPT退了,一年省2400——为什么越来越多人把大模型搬回家

title: 本地AI完全指南①:我把ChatGPT退了,一年省2400——为什么越来越多人把大模型搬回家? tags: 本地AI,私有大模型,Ollama,DeepSeek,大模型部署,AI隐私,离线AI,本地部署大模型,DeepSeek本地部署 category: 人工智能 本地AI完全指南①&…

2026/7/5 9:10:34 阅读更多 →
同一个模型,三个平台:OpenRouter - SiliconFlow - DeepInfra 实测对比

同一个模型,三个平台:OpenRouter - SiliconFlow - DeepInfra 实测对比

前面几期测的都是模型官方 API。但你实际用的时候,大概率走的不是官方——而是通过某个聚合平台。 为什么?几个现实原因: 不想每个模型绑一张信用卡公司采购要求统一结算官方 API 在某些地区不稳定想用一个 API Key 调所有模型 所以这期我不测…

2026/7/5 9:10:34 阅读更多 →
GRPO训练燃料:把Hermes Agent Feedback变成强化学习信号

GRPO训练燃料:把Hermes Agent Feedback变成强化学习信号

GRPO训练燃料:把Agent Feedback变成强化学习信号 「Hermes Agent自进化智能体深度解析」系列 | 模块十六 第3篇 你的Agent积累了1000条执行轨迹。500条成功,500条失败。成功的路径有的快、有的慢,失败的失败方式各不相同。你盯着这些数据&a…

2026/7/5 9:08:34 阅读更多 →

最新新闻

3分钟解锁网易云音乐:NCM转MP3的完全免费解决方案

3分钟解锁网易云音乐:NCM转MP3的完全免费解决方案

3分钟解锁网易云音乐:NCM转MP3的完全免费解决方案 【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 你是否曾经遇到过这样的尴尬:在网易云音乐下载了心爱的歌曲,却只能在特定App里播放?车…

2026/7/5 10:15:07 阅读更多 →
RK3576芯片架构与AIoT应用开发全解析

RK3576芯片架构与AIoT应用开发全解析

1. RK3576/RK3576J芯片架构解析 Rockchip RK3576系列是瑞芯微面向AIoT和工业市场推出的高性能应用处理器,采用"44"大小核设计: 4个Cortex-A72性能核心2.2GHz(工业版2.1GHz) 4个Cortex-A53能效核心2.0GHz(工…

2026/7/5 10:15:07 阅读更多 →
RK3588核心板硬件架构与AI加速技术解析

RK3588核心板硬件架构与AI加速技术解析

1. RK3588核心板的硬件架构解析 作为当前ARM架构中的旗舰级SoC,RK3588采用了创新的"44"大小核设计。具体由4个Cortex-A76性能核心(主频2.4GHz)和4个Cortex-A55能效核心(主频1.8GHz)组成,这种组合…

2026/7/5 10:15:07 阅读更多 →
昂瑞微OM662X低功耗蓝牙SoC芯片解析与应用指南

昂瑞微OM662X低功耗蓝牙SoC芯片解析与应用指南

1. 昂瑞微OM662X系列芯片概述 OM662X系列是昂瑞微电子推出的低功耗蓝牙SoC产品线,专为物联网终端设备设计。这个系列目前包含OM6621、OM6626和最新发布的OM6629三款主力型号,采用ARM Cortex-M0/M4双核架构,在保持超低功耗特性的同时&#xff…

2026/7/5 10:15:07 阅读更多 →
ALU性能演进史:从74181芯片到现代CPU的并行计算单元

ALU性能演进史:从74181芯片到现代CPU的并行计算单元

ALU性能演进史:从74181芯片到现代CPU的并行计算单元在计算机体系结构的漫长发展历程中,算术逻辑单元(ALU)作为CPU的核心执行部件,其技术演进直接反映了计算能力的跃迁。从早期只能处理4位运算的独立集成电路,到今天多核处理器中高…

2026/7/5 10:13:06 阅读更多 →
铷原子频率标准:高精度时间同步的核心技术解析

铷原子频率标准:高精度时间同步的核心技术解析

1. 铷原子频率标准:数字时代的隐形基石在煤矿井下,46台5G基站正在以微秒级精度同步工作,确保巡检机器人传回的瓦斯浓度数据不会因为时间偏差而误判;证券交易所里,高频交易系统依赖纳秒级时间戳维持着公平的交易顺序&am…

2026/7/5 10:11:05 阅读更多 →

日新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

周新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

月新闻