信息论与编码篇---矢量量化
一、什么是矢量量化矢量量化Vector Quantization简称VQ是一种把一组数据矢量作为一个整体进行量化的压缩方法。核心思想太巧妙了不单独处理每个数而是把一群数当成一个块用模板来代替就像这样原始数据[15, 16, 15, 14]4个像素码本中找最像的模板[15, 15, 15, 15]索引#42传输只需要传42这个索引号二、为什么要用矢量量化标量量化的局限传统方法标量量化是一个个数单独处理像素值15 16 15 14 量化后15 16 15 14还是4个数矢量量化的优势矢量量化是把一组数一起处理把这4个像素看成一个块 从码本中找到最接近的模板 只需要存模板的编号 4个数 → 1个索引巨大压缩三、矢量量化的核心概念1. 矢量Vector把一组数据放在一起形成一个矢量一维连续几个语音采样二维图像的一个小块如4×4像素三维视频的一个小立方体2. 码本Codebook预先训练好的模板库包含K个典型矢量码本 { 第1个模板: [10,10,10,10] 平坦区域 第2个模板: [10,20,10,20] 纹理区域 第3个模板: [0,0,0,255] 边缘区域 ... 第N个模板: [x1,x2,x3,x4] }3. 索引Index每个模板的编号用log₂K个比特表示码本大小K256 → 每个索引8比特原来4个像素×8比特32比特压缩后8比特 → 压缩率75%四、矢量量化工作原理编码过程压缩原始数据流 ──→ 分矢量 ──→ 在码本中找最近模板 ──→ 输出索引 [大量数据] [块1] ↓ [索引1] [块2] [计算距离] [索引2] [块3] (欧氏距离/绝对值) [索引3]解码过程解压收到索引 ──→ 查码本 ──→ 取出模板 ──→ 重建数据 [索引1] ↓ [模板1] [块1] [索引2] [码本] [模板2] [块2] [索引3] [模板3] [块3]五、如何构建码本码本构建是矢量量化的核心最常用的是LBG算法Linde-Buzo-GrayLBG算法步骤第1步初始化 选择一个初始码本可随机选或用分裂法 第2步迭代优化 ┌─────────────────────────────────────┐ │ 重复直到收敛 │ │ 1. 分配把所有训练矢量分到最近的码字 │ │ 2. 更新重新计算每个类的中心作为新码字 │ │ 3. 检查如果变化很小停止 │ └─────────────────────────────────────┘ 第3步输出最终码本码本分裂初始化初始只有一个码字全体中心 分裂×2加微小扰动 分裂×4 ...直到达到所需码本大小六、矢量量化的类型1. 基本VQ最简单的形式一个矢量用一个索引表示。2. 多级VQMSVQ第一级VQ → 残差 → 第二级VQ → 残差 → 第三级VQ 索引1 差值 索引2 差值 索引3优点减少码本大小渐进传输3. 分裂VQSplit VQ把大矢量分成几个子矢量分别量化[特征矢量32维] → [16维]VQ [16维]VQ优点降低复杂度4. 增益-形状VQGSVQ分别量化矢量的方向和大小形状码本单位长度的方向模板增益缩放因子单独量化七、实际应用1. 语音编码CELP编码器语音压缩的核心把语音帧如20ms作为一个矢量压缩率极高64kbps PCM → 8kbps CELP2. 图像压缩早期彩色图像压缩把颜色矢量量化纹理压缩手机GPU用VQ压缩纹理3. 特征压缩人脸识别把人脸特征矢量量化图像检索SIFT特征用VQ建视觉词袋4. 数据聚类K-means聚类本质就是矢量量化数据挖掘把相似数据归为一类八、矢量量化的优缺点优点✅压缩率极高多个数用一个索引代替✅解码极快只需查表没有计算✅率失真最优理论上优于标量量化✅适合低码率极低比特率下的最佳选择缺点❌编码复杂需要在码本中搜索最近模板❌码本训练耗时需要大量训练数据❌码本存储开销需要传输或存储码本❌对码本敏感不匹配的数据效果差九、生活中的例子例子1彩色量化一张真彩色图片1600万色转成256色GIF原始每个像素24比特GIF每个像素8比特索引压缩率66%秘诀把相似颜色用一个代表色代替例子2手机语音你在微信发语音原始语音128kbps压缩后8kbps还能听清秘诀用VQ把语音特征量化例子3人脸聚类手机相册自动归类提取人脸特征128维矢量用VQ思想把相似人脸聚在一起张三、李四自动分好十、Mermaid总结框图十一、完整的例子图像VQ假设有一张灰度图用VQ压缩训练阶段收集大量图像块4×416维 用LBG算法训练256个码字 码本大小256 × 16 × 1字节 4KB编码阶段原始图像512×512像素 262144像素 分成4×4块128×128 16384块 每块在码本中找最近模板 - 计算块与256个模板的欧氏距离 - 找最小距离的模板索引0-255 - 输出16384个索引 压缩率计算 原始262144字节 压缩后16384字节索引 4KB码本 20KB 压缩率92%20KB/256KB解码阶段收到16384个索引 用索引查码本得到模板 拼成512×512图像十二、核心启示整体优于局部联合量化比独立量化效率高模板匹配思想用有限模板代表无限可能训练是关键好码本决定好效果不对称复杂度编码复杂解码快适合一次编码多次解码率失真理论最优理论上限极高打个比方标量量化像给每个人单独做衣服每个数单独处理矢量量化像服装店卖S/M/L/XL码用模板代替码本训练像设计师研究大量人体数据确定最合适的几个尺码编码像顾客试穿找最合身的码最近邻搜索解码像直接从货架拿对应尺码的衣服查表矢量量化就是这样一个用有限模板代表无限可能的聪明方法

相关新闻

信息论与编码篇---变换编码

信息论与编码篇---变换编码

一、什么是变换编码?变换编码(Transform Coding)是一种把信号从原始空间变换到另一个空间,然后在变换域中进行压缩的方法。核心思想太聪明了:就像用筛子筛面粉,重要的颗粒(低频)留下…

2026/5/17 4:55:08 阅读更多 →
LingBot-Depth实战教程:OpenCV预处理+LingBot-Depth+PCL点云重建流水线

LingBot-Depth实战教程:OpenCV预处理+LingBot-Depth+PCL点云重建流水线

LingBot-Depth实战教程:OpenCV预处理LingBot-DepthPCL点云重建流水线 1. 教程概述 本教程将带您完成从原始图像到3D点云重建的完整流程,使用OpenCV进行图像预处理,通过LingBot-Depth模型生成高质量深度图,最后利用PCL库实现点云…

2026/5/17 4:55:07 阅读更多 →
StructBERT快速上手:中文句子相似度计算保姆级教程

StructBERT快速上手:中文句子相似度计算保姆级教程

StructBERT快速上手:中文句子相似度计算保姆级教程 引言:为什么需要专业的中文句子相似度工具? 在日常工作中,我们经常遇到需要判断两个中文句子是否表达相同意思的场景。比如客服系统要自动匹配用户问题和标准答案,…

2026/5/17 4:55:07 阅读更多 →

最新新闻

国际期货日内交易最佳交易时段

国际期货日内交易最佳交易时段

国际期货全天近 24 小时连续交易,不同时段资金量、波动幅度、流动性差异巨大,日内短线想要降低滑点、把握有效行情,优先选择欧美重叠盘,分三档时段区分优劣。最差时段为亚盘,北京时间 7:00 至 15:00,仅有亚…

2026/7/3 7:52:11 阅读更多 →
第19章:Celery 分布式任务队列深度解析

第19章:Celery 分布式任务队列深度解析

1. 项目背景 "我上传了一份 200 页的 PDF 到知识库,点击’保存并处理’后页面显示索引进度 0%。等了 30 分钟终于跳到 100%,中间我刷新了 5 次页面,每次都以为卡死了。"这是新手使用 Dify 知识库最常见的困惑。30 分钟里,Dify 的后台 Celery Worker 一直在拼命工…

2026/7/3 7:52:11 阅读更多 →
如何快速提升你的英雄联盟游戏体验:League Akari的完整指南

如何快速提升你的英雄联盟游戏体验:League Akari的完整指南

如何快速提升你的英雄联盟游戏体验:League Akari的完整指南 【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit 你是否曾在英雄选择阶段…

2026/7/3 7:52:11 阅读更多 →
解决Linux下802.11ac无线网卡驱动兼容性难题:rtl8812AU_8821AU内核模块深度解析

解决Linux下802.11ac无线网卡驱动兼容性难题:rtl8812AU_8821AU内核模块深度解析

解决Linux下802.11ac无线网卡驱动兼容性难题:rtl8812AU_8821AU内核模块深度解析 【免费下载链接】rtl8812AU_8821AU_linux rtl8812AU_8821AU linux kernel driver for AC1200 (801.11ac) Wireless Dual-Band USB Adapter 项目地址: https://gitcode.com/gh_mirror…

2026/7/3 7:50:10 阅读更多 →
江西大诺营造私人住宅、度假酒店设计全案落地服务实测

江西大诺营造私人住宅、度假酒店设计全案落地服务实测

赣州室内设计行业现状痛点在赣州室内设计市场,诸多痛点困扰着消费者。首先是设计同质化严重,缺乏专属感。多数设计机构依赖模板化方案,无论是赣州别墅设计,还是普通住宅设计,都难以匹配高净值人群的个性化生活需求&…

2026/7/3 7:48:07 阅读更多 →
【ChatGPT编程提效黄金法则】:20年资深工程师亲授7大不可外传的代码生成实战技巧

【ChatGPT编程提效黄金法则】:20年资深工程师亲授7大不可外传的代码生成实战技巧

更多请点击: https://codechina.net 第一章:ChatGPT编程提效的底层认知革命 传统编程范式中,开发者习惯于“先构思逻辑 → 再手写代码 → 后调试验证”的线性流程。而ChatGPT的介入,并非仅提供代码补全或语法纠错,它实…

2026/7/3 7:46:06 阅读更多 →

日新闻

Nginx防御TLS重协商攻击实战:从原理到配置与监控

Nginx防御TLS重协商攻击实战:从原理到配置与监控

1. 项目概述:为什么TLS重协商攻击至今仍需警惕十多年前的CVE-2011-1473,一个关于TLS/SSL协议重协商机制的漏洞,现在提起来还有必要吗?很多运维和开发朋友可能会觉得,这都老掉牙了,现代服务器和客户端不都默…

2026/7/3 0:03:59 阅读更多 →
华为防火墙双通道远程管理实战:Web与SSH配置详解

华为防火墙双通道远程管理实战:Web与SSH配置详解

1. 项目概述:为什么需要双通道远程管理防火墙?在任何一个稍具规模的企业网络里,防火墙都是那个默默守护在边界的关键角色。作为网络工程师,我们不可能每次都跑到机房,插上console线去配置它。远程管理能力,…

2026/7/3 0:03:59 阅读更多 →
AD74413R与PIC18F65K40的高精度工业数据采集方案

AD74413R与PIC18F65K40的高精度工业数据采集方案

1. 项目概述:AD74413R与PIC18F65K40的协同工作在工业自动化和精密测量领域,同时实现高精度模数转换(ADC)和数模转换(DAC)功能是许多复杂系统的核心需求。AD74413R作为一款四通道可配置模拟输入/输出器件,与PIC18F65K40微控制器的组合&#xf…

2026/7/3 0:05:59 阅读更多 →

周新闻

月新闻