机器学习与模式识别 第八章 MAP与偏方差 考点压缩
第八章Regression (Cont.) and Bias-Variance Trade-off — 知识点笔记综合来源Lecture 08 PDF55页、课堂笔记CSDN占位图8.1 先验信念与MAP ⭐⭐MLE的问题MLE仅用数据→小数据/噪声多→可能拟合极端权重MLE没有机制编码权重应该较小/合理MAP最大后验估计贝叶斯法则p(w∣t)∝p(t∣w)×p(w)p(\mathbf{w}|\mathbf{t}) \propto p(\mathbf{t}|\mathbf{w}) \times p(\mathbf{w})p(w∣t)∝p(t∣w)×p(w)w^MAParg⁡max⁡wp(w∣t)arg⁡max⁡w[p(t∣w)×p(w)]\hat{\mathbf{w}}_{MAP} \arg\max_{\mathbf{w}} p(\mathbf{w}|\mathbf{t}) \arg\max_{\mathbf{w}} [p(\mathbf{t}|\mathbf{w}) \times p(\mathbf{w})]w^MAP​argwmax​p(w∣t)argwmax​[p(t∣w)×p(w)]取负对数→最大化→最小化w^MAParg⁡min⁡w[−ln⁡p(t∣w)−ln⁡p(w)]\hat{\mathbf{w}}_{MAP} \arg\min_{\mathbf{w}} [-\ln p(\mathbf{t}|\mathbf{w}) - \ln p(\mathbf{w})]w^MAP​argwmin​[−lnp(t∣w)−lnp(w)]高斯先验 → Ridge ⭐⭐⭐先验假设wj∼N(0,τ2)w_j \sim \mathcal{N}(0, \tau^2)wj​∼N(0,τ2)权重小、中心在0p(w)∏j12πτ2e−wj2/2τ2p(\mathbf{w}) \prod_j \frac{1}{\sqrt{2\pi\tau^2}} e^{-w_j^2/2\tau^2}p(w)j∏​2πτ2​1​e−wj2​/2τ2MAP目标w^MAParg⁡min⁡w[12σ2∑n(tn−wTϕ(xn))212τ2∥w∥22]\hat{\mathbf{w}}_{MAP} \arg\min_{\mathbf{w}} \left[\frac{1}{2\sigma^2}\sum_n(t_n - \mathbf{w}^T\phi(\mathbf{x}_n))^2 \frac{1}{2\tau^2}\|\mathbf{w}\|_2^2\right]w^MAP​argwmin​[2σ21​n∑​(tn​−wTϕ(xn​))22τ21​∥w∥22​]乘以σ2\sigma^2σ2arg⁡min⁡w[12∑n(tn−wTϕ(xn))2σ22τ2∥w∥22] \arg\min_{\mathbf{w}} \left[\frac{1}{2}\sum_n(t_n - \mathbf{w}^T\phi(\mathbf{x}_n))^2 \frac{\sigma^2}{2\tau^2}\|\mathbf{w}\|_2^2\right]argwmin​[21​n∑​(tn​−wTϕ(xn​))22τ2σ2​∥w∥22​]λσ2τ2\lambda \frac{\sigma^2}{\tau^2}λτ2σ2​核心结论MAP高斯先验 Ridge回归L2正则化 假设权重服从高斯先验分布λσ2/τ2\lambda \sigma^2/\tau^2λσ2/τ2数据噪声大→λ\lambdaλ大先验强(τ2\tau^2τ2小)→λ\lambdaλ大MLE vs MAP 类比频率学派(MLE)贝叶斯学派(MAP)使用仅数据数据 先验信念硬币例子MLE1.0(仅HH)后验均值0.58(结合先验5/10)回归最小二乘Ridge回归8.2 偏差-方差分解 ⭐⭐⭐学习的基本挑战拟合数据解释已观测到的泛化到世界预测未来、解释未观测到的三个误差来源来源定义可控噪声Noise数据固有随机波动❌ 不可控通常偏差Bias期望预测值与真实值之间的偏差✅ 模型选择方差Variance不同训练集下预测值的变异性✅ 模型复杂度推导 ⭐假设th(x)ϵt h(\mathbf{x}) \epsilonth(x)ϵE[ϵ]0\mathbb{E}[\epsilon]0E[ϵ]0var[ϵ]σ2\text{var}[\epsilon]\sigma^2var[ϵ]σ2E[(t−fw(x))2]E[(t−h(x))2]⏟Noise(h(x)−E[fw(x)])2⏟Bias2E[(E[fw(x)]−fw(x))2]⏟Variance\mathbb{E}[(t - f_{\mathbf{w}}(\mathbf{x}))^2] \underbrace{\mathbb{E}[(t - h(\mathbf{x}))^2]}_{\text{Noise}} \underbrace{(h(\mathbf{x}) - \mathbb{E}[f_{\mathbf{w}}(\mathbf{x})])^2}_{\text{Bias}^2} \underbrace{\mathbb{E}[(\mathbb{E}[f_{\mathbf{w}}(\mathbf{x})] - f_{\mathbf{w}}(\mathbf{x}))^2]}_{\text{Variance}}E[(t−fw​(x))2]NoiseE[(t−h(x))2]​​Bias2(h(x)−E[fw​(x)])2​​VarianceE[(E[fw​(x)]−fw​(x))2]​​期望预测误差 噪声 偏差² 方差偏差-方差权衡图误差 ↑ | Total Error | / \ | / \_____ Variance | / Bias² \ |/______________________\____ | Model Complexity → 简单 复杂如何控制模型复杂度方法效果特征数量减少→更简单→更高偏差更低方差特征选择选不同基函数→不同偏置正则化λ\lambdaλλ\lambdaλ↑→更简单→更高偏差更低方差λ\lambdaλ的偏差-方差效应λ\lambdaλ小→模型复杂→低偏差高方差过拟合λ\lambdaλ大→模型简单→高偏差低方差欠拟合最优λ\lambdaλ通过验证集确定8.3 双重下降Double Descent预览来自CSDN笔记传统U型曲线模型复杂度↑→测试误差先降后升双重下降过参数化后→测试误差再次下降大模型继续训练→可能获得更低测试误差实操建议大模型不一定需要早停笔记中的图片索引序号图片内容描述来源位置图1硬币例子先验→后验更新Lecture 08 第4页图2偏差-方差分解推导过程Lecture 08 第20-36页图3偏差-方差权衡经典U型图Lecture 08 第37页图4λ\lambdaλ对偏差-方差的影响Lecture 08 第39页图5sin(2πx)拟合示例Lecture 08 第40页笔记整理时间2026年6月28日

相关新闻

GDSDecomp技术实现:PCK文件极速修改与Godot逆向工程架构设计

GDSDecomp技术实现:PCK文件极速修改与Godot逆向工程架构设计

GDSDecomp技术实现:PCK文件极速修改与Godot逆向工程架构设计 【免费下载链接】gdsdecomp Godot reverse engineering tools 项目地址: https://gitcode.com/GitHub_Trending/gd/gdsdecomp GDSDecomp是一款专为Godot引擎设计的逆向工程工具,提供PC…

2026/7/4 20:11:39 阅读更多 →
掌握专业级Windows Defender控制:高效系统安全防护管理实战指南

掌握专业级Windows Defender控制:高效系统安全防护管理实战指南

掌握专业级Windows Defender控制:高效系统安全防护管理实战指南 【免费下载链接】defender-control An open-source windows defender manager. Now you can disable windows defender permanently. 项目地址: https://gitcode.com/gh_mirrors/de/defender-contr…

2026/7/4 20:07:38 阅读更多 →
角谷猜想的弗洛伊德算法的同构映射:数论映射图论 Version6.6

角谷猜想的弗洛伊德算法的同构映射:数论映射图论 Version6.6

角谷猜想的弗洛伊德算法的同构映射:数论映射图论 Version6.6上古天真论 2026-06-30AI得到的矩阵,我测试不合我意,不知对错,暂当成错的。 于是,我象配方法一样,配方阵法,配矩阵法,一…

2026/7/4 20:05:38 阅读更多 →

最新新闻

ThinkPHP 6.0.8反序列化漏洞深度剖析:从POP链原理到实战利用

ThinkPHP 6.0.8反序列化漏洞深度剖析:从POP链原理到实战利用

1. 项目概述:一次对ThinkPHP6.0.8反序列化漏洞的深度剖析最近在复盘一些经典的PHP框架漏洞案例,ThinkPHP6.0.8的反序列化漏洞(CVE-2021-36542)绝对是一个绕不开的经典。这个漏洞的利用链(POP Chain)设计得非…

2026/7/4 21:05:52 阅读更多 →
LiveViewJS生命周期完全解析:从Mount到HandleEvent的完整流程

LiveViewJS生命周期完全解析:从Mount到HandleEvent的完整流程

LiveViewJS生命周期完全解析:从Mount到HandleEvent的完整流程 【免费下载链接】liveviewjs LiveView-based library for reactive app development in NodeJS and Deno 项目地址: https://gitcode.com/gh_mirrors/li/liveviewjs 想要构建实时、响应式的Web应…

2026/7/4 21:05:52 阅读更多 →
天龙八部GM工具:3分钟掌握游戏数据自由编辑的终极方法

天龙八部GM工具:3分钟掌握游戏数据自由编辑的终极方法

天龙八部GM工具:3分钟掌握游戏数据自由编辑的终极方法 【免费下载链接】TlbbGmTool 某网络游戏的单机版本GM工具 项目地址: https://gitcode.com/gh_mirrors/tl/TlbbGmTool 还在为游戏中重复刷怪升级而烦恼?想要快速体验天龙八部单机版的全部内容…

2026/7/4 21:03:51 阅读更多 →
Vault-Operator在生产环境中的最佳实践:来自实际部署的经验分享

Vault-Operator在生产环境中的最佳实践:来自实际部署的经验分享

Vault-Operator在生产环境中的最佳实践:来自实际部署的经验分享 【免费下载链接】vault-operator Run and manage Vault on Kubernetes simply and securely 项目地址: https://gitcode.com/gh_mirrors/va/vault-operator Vault-Operator是一款在Kubernetes环…

2026/7/4 21:03:51 阅读更多 →
智能绕过限制:永久免费使用Cursor AI编程助手的完整方案

智能绕过限制:永久免费使用Cursor AI编程助手的完整方案

智能绕过限制:永久免费使用Cursor AI编程助手的完整方案 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached your t…

2026/7/4 21:01:50 阅读更多 →
毕设分享 深度学习yolo藻类细胞检测识别(科研辅助系统)(源码+论文)

毕设分享 深度学习yolo藻类细胞检测识别(科研辅助系统)(源码+论文)

👆👆 完整项目获取方式👆👆完整项目获取方式👆👆完整项目获取方式👆👆完整项目获取方式👆👆 文章目录 👆👆 完整项目获取方式&#x1…

2026/7/4 21:01:50 阅读更多 →

日新闻

Memcached 1.6.43 发布:关键安全修复版本,多项问题得到解决

Memcached 1.6.43 发布:关键安全修复版本,多项问题得到解决

Memcached 1.6.43 正式发布,这是一个关键的安全修复版本,修复了多个方面的问题,还对部分功能进行了优化。 安全修复亮点 此次发布在安全修复上表现突出。binprot 避免了项目引用计数溢出,mcmc 因安全问题提升了上游版本号&#xf…

2026/7/4 0:04:29 阅读更多 →
终极指南:使用HMCL启动器跨平台畅玩Minecraft的完整解决方案

终极指南:使用HMCL启动器跨平台畅玩Minecraft的完整解决方案

终极指南:使用HMCL启动器跨平台畅玩Minecraft的完整解决方案 【免费下载链接】HMCL A Minecraft Launcher which is multi-functional, cross-platform and popular 项目地址: https://gitcode.com/gh_mirrors/hm/HMCL HMCL(Hello Minecraft! Lau…

2026/7/4 0:06:29 阅读更多 →
KMX63与PIC18F66K40在嵌入式HMI中的硬件协同与低功耗设计

KMX63与PIC18F66K40在嵌入式HMI中的硬件协同与低功耗设计

1. KMX63与PIC18F66K40的硬件协同架构解析KMX63作为一款三轴加速度计和磁力计组合传感器,与PIC18F66K40微控制器的搭配堪称嵌入式HMI开发的黄金组合。这套硬件组合的核心优势在于KMX63提供的高精度运动感知能力与PIC18F66K40强大的信号处理能力形成了完美互补。KMX6…

2026/7/4 0:06:29 阅读更多 →

周新闻

月新闻