信息论与编码篇---变换编码
一、什么是变换编码变换编码Transform Coding是一种把信号从原始空间变换到另一个空间然后在变换域中进行压缩的方法。核心思想太聪明了就像用筛子筛面粉重要的颗粒低频留下不重要的细末高频去掉举个直观例子原始信号像一团乱麻很难直接压缩变换后能量集中在少数地方其他地方接近0然后保留大的扔掉小的二、为什么要做变换原始数据的问题假设一段音频平稳的声音突然有个小杂音时域上看整体变化不大但有个小毛刺很难压缩因为毛刺破坏了规律性变换后的好处变换到频域后主要能量集中在低频代表平稳声音杂音变成高频小系数扔掉小系数几乎不影响听觉这就是变换编码的魔法能量集中三、常见的变换方法1. DCT离散余弦变换—— 最常用工作原理用不同频率的余弦波来分解信号原始信号 直流分量 低频分量 中频分量 高频分量 ↓ ↓ ↓ ↓ 最重要 很重要 有点重要 不太重要特点能量集中能力极强计算相对简单JPEG、H.264都在用2. DWT离散小波变换工作原理同时分析频率和时间信息原始信号 → [低通滤波] → 近似系数低频信息 → [高通滤波] → 细节系数高频信息 ↓ 可以继续分解特点多分辨率分析抗块效应JPEG2000使用3. KLT卡洛南-洛伊变换—— 理论最优工作原理根据数据特性自适应变换特点理论上能量最集中计算太复杂主要用于理论分析四、变换编码的完整流程以JPEG为例第1步分块把图像分成8×8的小块[像素块 8×8] [像素块 8×8] [像素块 8×8]第2步变换DCT每个8×8块做DCT得到64个系数左上角直流低频数值大 右下角高频数值接近0 数值分布 [100 80 60 40 20 10 5 2] [80 60 40 20 10 5 2 1] [60 40 20 10 5 2 1 0] ...越往右下越小第3步量化关键步骤用量化表去除不重要的高频信息量化前 [100 80 60 40 20 10 5 2] 量化表 [16 11 10 16 24 40 51 61] 量化后 [6 7 6 2 0 0 0 0]第4步编码用Zig-zag扫描把二维变一维游程编码处理连续的0霍夫曼编码进一步压缩五、生活中的例子例子1JPEG照片你的手机拍的照片原始1920×1080×3字节 ≈ 6MB压缩后2MB压缩率66%肉眼看几乎没差别秘诀DCT变换 量化例子2MP3音乐原始CD音质1411kbpsMP3128kbps压缩率90%秘诀变换到频域去掉人耳不敏感的频率例子3视频通话原始视频几十Mbps压缩后1-2Mbps还能看清人脸秘诀帧内DCT 帧间预测六、量化的艺术量化是变换编码唯一造成失真的步骤也是压缩率的关键量化表的设计低频区域人眼敏感量化步长小保留细节 系数100 80 60 量化÷16 → 6 5 4 高频区域人不敏感量化步长大大量舍去 系数5 2 1 量化÷51 → 0 0 0量化参数QPQP小保留更多细节高质量QP大舍弃更多高压缩率视频编码中可以动态调整七、变换编码的优缺点优点✅能量集中把信息浓缩到少量系数✅符合感知可以针对人类感知特性设计✅压缩率高比单纯统计编码高得多✅可扩展可以渐进传输先传大概再传细节缺点❌有失真量化过程不可逆❌计算量大特别是大尺寸图像❌块效应分块处理可能导致块边界不连续❌不适合所有数据对噪声敏感八、应用中的技巧1. Zig-zag扫描把二维系数转成一维把零集中在一起原矩阵 扫描顺序 [1 2 6] 1→2→6→7→5→3→4→8→9 [3 5 7] → ↙↘↙↘↙↘ [4 8 9] zig-zag路径2. 自适应量化根据不同区域调整量化强度平坦区域量化狠一点看不出纹理区域量化轻一点保留细节边缘区域特别保护防止锯齿3. 率失真优化在码率和质量之间找平衡给更多比特给重要系数给更少比特给不重要系数九、Mermaid总结框图十、JPEG 8×8 DCT示例假设一个8×8像素块所有像素值128均匀灰色变换前 [128 128 128 ...] 全部一样时域冗余大 DCT变换后 [1024 0 0 0 ...] 只有一个直流系数非零 [ 0 0 0 0 ...] 其他交流系数全0 [ 0 0 0 0 ...] ... 压缩结果只需存一个数十一、核心启示换个角度看世界时域难压缩频域好压缩能量集中是关键把信息浓缩到少数系数量化是双刃剑产生失真但带来高压缩率感知模型很重要扔掉人看不见/听不见的信息组合拳威力大变换量化熵编码强大压缩打个比方原始数据像一锅乱炖的汤各种材料混在一起变换用筛子把汤过滤固体重要信息留在筛子上液体不重要信息流下去量化固体里再分肉块最重要留着葱姜次要可以少要点熵编码最后把留下的材料打包变换编码就是这样一个换个角度看问题然后有选择地舍弃的聪明方法

相关新闻

LingBot-Depth实战教程:OpenCV预处理+LingBot-Depth+PCL点云重建流水线

LingBot-Depth实战教程:OpenCV预处理+LingBot-Depth+PCL点云重建流水线

LingBot-Depth实战教程:OpenCV预处理LingBot-DepthPCL点云重建流水线 1. 教程概述 本教程将带您完成从原始图像到3D点云重建的完整流程,使用OpenCV进行图像预处理,通过LingBot-Depth模型生成高质量深度图,最后利用PCL库实现点云…

2026/7/3 7:56:38 阅读更多 →
StructBERT快速上手:中文句子相似度计算保姆级教程

StructBERT快速上手:中文句子相似度计算保姆级教程

StructBERT快速上手:中文句子相似度计算保姆级教程 引言:为什么需要专业的中文句子相似度工具? 在日常工作中,我们经常遇到需要判断两个中文句子是否表达相同意思的场景。比如客服系统要自动匹配用户问题和标准答案,…

2026/5/17 4:55:07 阅读更多 →
Qwen3-ASR-1.7B实战案例:Qwen3-ASR-1.7B构建企业级语音知识图谱底座

Qwen3-ASR-1.7B实战案例:Qwen3-ASR-1.7B构建企业级语音知识图谱底座

Qwen3-ASR-1.7B实战案例:Qwen3-ASR-1.7B构建企业级语音知识图谱底座 1. 企业语音智能化的新机遇 在当今企业数字化转型浪潮中,语音数据正成为重要的信息资产。从客户服务录音到内部会议记录,从培训讲座到产品演示,海量的语音内容…

2026/5/17 4:55:06 阅读更多 →

最新新闻

国际期货日内交易最佳交易时段

国际期货日内交易最佳交易时段

国际期货全天近 24 小时连续交易,不同时段资金量、波动幅度、流动性差异巨大,日内短线想要降低滑点、把握有效行情,优先选择欧美重叠盘,分三档时段区分优劣。最差时段为亚盘,北京时间 7:00 至 15:00,仅有亚…

2026/7/3 7:52:11 阅读更多 →
第19章:Celery 分布式任务队列深度解析

第19章:Celery 分布式任务队列深度解析

1. 项目背景 "我上传了一份 200 页的 PDF 到知识库,点击’保存并处理’后页面显示索引进度 0%。等了 30 分钟终于跳到 100%,中间我刷新了 5 次页面,每次都以为卡死了。"这是新手使用 Dify 知识库最常见的困惑。30 分钟里,Dify 的后台 Celery Worker 一直在拼命工…

2026/7/3 7:52:11 阅读更多 →
如何快速提升你的英雄联盟游戏体验:League Akari的完整指南

如何快速提升你的英雄联盟游戏体验:League Akari的完整指南

如何快速提升你的英雄联盟游戏体验:League Akari的完整指南 【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit 你是否曾在英雄选择阶段…

2026/7/3 7:52:11 阅读更多 →
解决Linux下802.11ac无线网卡驱动兼容性难题:rtl8812AU_8821AU内核模块深度解析

解决Linux下802.11ac无线网卡驱动兼容性难题:rtl8812AU_8821AU内核模块深度解析

解决Linux下802.11ac无线网卡驱动兼容性难题:rtl8812AU_8821AU内核模块深度解析 【免费下载链接】rtl8812AU_8821AU_linux rtl8812AU_8821AU linux kernel driver for AC1200 (801.11ac) Wireless Dual-Band USB Adapter 项目地址: https://gitcode.com/gh_mirror…

2026/7/3 7:50:10 阅读更多 →
江西大诺营造私人住宅、度假酒店设计全案落地服务实测

江西大诺营造私人住宅、度假酒店设计全案落地服务实测

赣州室内设计行业现状痛点在赣州室内设计市场,诸多痛点困扰着消费者。首先是设计同质化严重,缺乏专属感。多数设计机构依赖模板化方案,无论是赣州别墅设计,还是普通住宅设计,都难以匹配高净值人群的个性化生活需求&…

2026/7/3 7:48:07 阅读更多 →
【ChatGPT编程提效黄金法则】:20年资深工程师亲授7大不可外传的代码生成实战技巧

【ChatGPT编程提效黄金法则】:20年资深工程师亲授7大不可外传的代码生成实战技巧

更多请点击: https://codechina.net 第一章:ChatGPT编程提效的底层认知革命 传统编程范式中,开发者习惯于“先构思逻辑 → 再手写代码 → 后调试验证”的线性流程。而ChatGPT的介入,并非仅提供代码补全或语法纠错,它实…

2026/7/3 7:46:06 阅读更多 →

日新闻

Nginx防御TLS重协商攻击实战:从原理到配置与监控

Nginx防御TLS重协商攻击实战:从原理到配置与监控

1. 项目概述:为什么TLS重协商攻击至今仍需警惕十多年前的CVE-2011-1473,一个关于TLS/SSL协议重协商机制的漏洞,现在提起来还有必要吗?很多运维和开发朋友可能会觉得,这都老掉牙了,现代服务器和客户端不都默…

2026/7/3 0:03:59 阅读更多 →
华为防火墙双通道远程管理实战:Web与SSH配置详解

华为防火墙双通道远程管理实战:Web与SSH配置详解

1. 项目概述:为什么需要双通道远程管理防火墙?在任何一个稍具规模的企业网络里,防火墙都是那个默默守护在边界的关键角色。作为网络工程师,我们不可能每次都跑到机房,插上console线去配置它。远程管理能力,…

2026/7/3 0:03:59 阅读更多 →
AD74413R与PIC18F65K40的高精度工业数据采集方案

AD74413R与PIC18F65K40的高精度工业数据采集方案

1. 项目概述:AD74413R与PIC18F65K40的协同工作在工业自动化和精密测量领域,同时实现高精度模数转换(ADC)和数模转换(DAC)功能是许多复杂系统的核心需求。AD74413R作为一款四通道可配置模拟输入/输出器件,与PIC18F65K40微控制器的组合&#xf…

2026/7/3 0:05:59 阅读更多 →

周新闻

月新闻