从零理解卷积神经网络(CNN):比全连接强在哪?
从零理解卷积神经网络CNN比全连接强在哪深入浅出解析CNN核心原理一文读懂卷积、填充、步幅与特征图引言为什么需要CNN在图像识别、自动驾驶、医疗影像分析等领域卷积神经网络CNN已经成为不可或缺的核心技术。那么它与我们之前介绍的全连接神经网络究竟有何不同为什么在图像处理任务中CNN的表现总是更加出色今天我们将一起揭开CNN的神秘面纱从整体结构到卷积层的每一个细节让你彻底理解这个强大的深度学习模型。一、整体结构对比CNN vs 全连接网络1.1 全连接网络结构首先回顾一下传统的全连接神经网络图7-1层间完全连接每个神经元都与相邻层的所有神经元相连典型结构Affine层全连接层 ReLU激活函数最终输出Affine层 Softmax层输出概率关键问题全连接层会“拉平”输入数据忽略图像的空间结构信息。1.2 CNN的创新结构CNN引入了两个革命性的新层图7-2卷积层Convolution Layer- 核心特征提取器池化层Pooling Layer- 降维与特征增强典型的CNN连接顺序输入 → [卷积层 → ReLU → (池化层)] × N → Affine → ReLU → ... → Softmax输出二、卷积层详解CNN的核心引擎2.1 全连接层的根本缺陷想象一下当你看到一张人脸照片时你的大脑并不是将每个像素独立分析的。你会注意到眼睛、鼻子、嘴巴的相对位置关系以及局部特征的组合。这正是全连接层做不到的空间信息丢失将3D图像高×宽×通道强行拉平成1D向量参数爆炸对于高分辨率图像参数数量会变得极其庞大缺乏平移不变性同一特征在不同位置需要重新学习2.2 卷积运算滤波器的妙用卷积运算可以理解为在图像上滑动一个特征探测器图7-3。基本概念滤波器Filter/核Kernel一个小的权重矩阵用于检测特定特征特征图Feature Map卷积运算的输出结果计算过程图7-4将滤波器与输入图像的对应区域逐元素相乘将所有乘积结果求和将结果写入输出特征图的对应位置滑动滤波器重复上述过程加入偏置图7-5每个滤波器通常有一个偏置项会加到所有输出元素上。2.3 填充Padding控制输出尺寸的技巧为什么需要填充防止信息流失每次卷积都会缩小特征图尺寸保持空间维度对于深层网络避免特征图过小填充方式图7-6在输入数据周围添加固定值通常是0填充幅度p表示每边添加的像素行/列数2.4 步幅Stride滑动滤波器的步长步幅的作用控制下采样率减少计算量增大感受野步幅的影响图7-7步幅越大输出特征图尺寸越小。2.5 输出尺寸计算公式给定输入尺寸(H,W)(H, W)(H,W)滤波器尺寸(FH,FW)(FH, FW)(FH,FW)填充PPP步幅SSS则输出尺寸(OH,OW)(OH, OW)(OH,OW)为OHH2P−FHS1OWW2P−FWS1 \begin{aligned} OH \frac{H 2P - FH}{S} 1 \\ OW \frac{W 2P - FW}{S} 1 \end{aligned}OHOW​SH2P−FH​1SW2P−FW​1​重要提示如果计算结果不是整数需要根据深度学习框架采取相应策略如报错或四舍五入。三、3D数据的卷积运算处理彩色图像3.1 通道维度的引入真实图像通常是3D的高度 × 宽度 × 通道如RGB三通道。关键原则滤波器的通道数必须与输入数据的通道数相同。3.2 多通道卷积计算图7-8、7-9滤波器在每个通道上进行独立的卷积运算将各通道的结果相加得到单通道输出加上偏置生成最终的特征图3.3 从3D视角理解图7-10输入数据(C,H,W)(C, H, W)(C,H,W)其中C通道数滤波器(C,FH,FW)(C, FH, FW)(C,FH,FW)输出(1,OH,OW)(1, OH, OW)(1,OH,OW)单特征图四、多个滤波器提取丰富特征4.1 为什么需要多个滤波器单个滤波器只能检测一种特征如边缘、纹理。为了识别复杂模式我们需要滤波器组。4.2 多滤波器卷积图7-11应用FN个不同的滤波器生成FN个特征图输出形状(FN,OH,OW)(FN, OH, OW)(FN,OH,OW)4.3 滤波器的4D表示滤波器权重按以下顺序组织(输出通道数, 输入通道数, 高度, 宽度)即(FN,C,FH,FW)(FN, C, FH, FW)(FN,C,FH,FW)4.4 偏置的广播机制图7-12每个滤波器有一个偏置值偏置形状(FN,1,1)(FN, 1, 1)(FN,1,1)通过NumPy广播加到对应滤波器的所有输出元素上五、批处理高效训练的关键5.1 4D数据流图7-13为了高效处理多个样本CNN使用4D数据表示(批大小N, 通道数C, 高度H, 宽度W)5.2 批处理的优势计算效率并行处理多个样本内存优化合理利用GPU资源训练稳定基于mini-batch的梯度更新更平滑六、总结CNN的核心优势保持空间结构以3D形式处理数据保留局部特征关系局部连接每个神经元只连接输入数据的局部区域权值共享同一滤波器在整个图像上滑动使用大幅减少参数量平移不变性同一特征在不同位置被同一滤波器检测层次化特征从低级特征边缘到高级特征形状、物体的逐层提取结语CNN的设计灵感源自生物视觉系统通过模拟人类观察世界的方式实现了对图像数据的高效理解。从LeNet到ResNet、EfficientNetCNN的变体不断推动着计算机视觉的发展。理解CNN的基本原理是掌握现代深度学习的关键第一步。在后续的文章中我们将深入探讨池化层、经典CNN架构以及实践应用。思考题如果将步幅设置为2填充设置为1对于100×100的输入图像使用3×3的滤波器输出特征图的尺寸是多少欢迎在评论区留下你的答案

相关新闻

卷积神经网络(整体结构)

卷积神经网络(整体结构)

整体结构 首先,来看一下CNN的网络结构,了解CNN的大致框架。CNN和之 前介绍的神经网络一样,可以像乐高积木一样通过组装层来构建。不过, CNN中新出现了卷积层(Convolution 层)和池化层(Pooling 层…

2026/7/4 5:56:31 阅读更多 →
2023年信奥赛C++提高组csp-s初赛真题及答案解析(完善程序第2题)

2023年信奥赛C++提高组csp-s初赛真题及答案解析(完善程序第2题)

2023年信奥赛C提高组csp-s初赛真题及答案解析(完善程序第2题) #### 第2题 (最大值之和)给定整数序列 a0,⋯,an−1a_0,⋯,a_{n−1}a0​,⋯,an−1​,求该序列所有非空连续子序列的最大值之和。上述参数满足 1≤n≤105和…

2026/5/17 3:55:15 阅读更多 →
【完整源码+数据集+部署教程】交通标线车道线分割系统源码&数据集分享 [yolov8-seg-C2f-EMSC&yolov8-seg-SPPF-LSKA等50+全套改进创新点发刊_一键训练教程_We

【完整源码+数据集+部署教程】交通标线车道线分割系统源码&数据集分享 [yolov8-seg-C2f-EMSC&yolov8-seg-SPPF-LSKA等50+全套改进创新点发刊_一键训练教程_We

背景意义 随着城市化进程的加快,交通管理面临着日益严峻的挑战。交通标线作为道路交通管理的重要组成部分,不仅为驾驶员提供了行驶指引,还在交通安全中发挥着不可或缺的作用。传统的交通标线检测方法多依赖于人工标注和规则识别,效…

2026/5/17 3:55:14 阅读更多 →

最新新闻

LLM Embedding 模型训练实战:对比学习、难负样本与领域适配

LLM Embedding 模型训练实战:对比学习、难负样本与领域适配

在 RAG 系统和多模态应用中,Embedding 模型是决定检索质量的天花板。通用 Embedding 模型在垂直领域中表现往往不尽如人意——医疗、法律、金融等领域的专业术语和语义结构使得召回率大幅下降。本文从工程实践角度,系统讲解如何训练一个高质量的领域 Emb…

2026/7/5 8:48:30 阅读更多 →
好用的多层实木浴室柜厂家

好用的多层实木浴室柜厂家

嘿,朋友们!今天咱来聊聊多层实木浴室柜这个事儿。现在市面上的多层实木浴室柜厂家还真不少,那怎么才能找到好用的呢?咱先得说说这行业的一些情况。很多人在选择浴室柜的时候,最头疼的就是质量问题。有些浴室柜用不了多…

2026/7/5 8:48:30 阅读更多 →
2026免费视频去水印工具教程:电脑手机在线无需下载工具汇总

2026免费视频去水印工具教程:电脑手机在线无需下载工具汇总

在日常素材整理、个人学习内容收藏的过程中,视频水印、平台LOGO、浮动字幕往往会影响画面观感,很多用户都在寻找适配电脑、手机双端,或是无需下载客户端的免费去水印方案。2026年市面上各类去水印工具繁杂,部分工具存在广告弹窗、…

2026/7/5 8:48:30 阅读更多 →
2026免费在线去水印软件推荐,主流工具对比实测教程

2026免费在线去水印软件推荐,主流工具对比实测教程

在日常办公、素材整理、个人学习的场景中,图片、短视频素材自带的水印、logo、文字遮挡,常常会影响素材观感与使用效果。对于普通个人用户而言,无需下载笨重的电脑客户端、不用付费开通会员,免费在线去水印软件是性价比最高的选择…

2026/7/5 8:46:29 阅读更多 →
DHDMS-Lang 自举编译器形式化验证

DHDMS-Lang 自举编译器形式化验证

(* ) ( DHDMS-Lang 自举编译器形式化验证 - 四大特性证明 ) ( https://www.dhdmslang.com/ ) ( 基于 DHDMS 数学原生体系 ) ( 作者:孙立佳 ) ( 迭代日期:2026.06.22 ) ( *) Require Import ZArith. Require Import List. Require Import Bool. Require…

2026/7/5 8:46:29 阅读更多 →
XUnity.AutoTranslator:5分钟搞定Unity游戏多语言翻译的终极方案

XUnity.AutoTranslator:5分钟搞定Unity游戏多语言翻译的终极方案

XUnity.AutoTranslator:5分钟搞定Unity游戏多语言翻译的终极方案 【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator 你是否曾经因为语言障碍而无法畅玩心仪的Unity游戏?XUnity.AutoTr…

2026/7/5 8:46:29 阅读更多 →

日新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

周新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

月新闻