【人工智能学习-AI入试相关题目练习-第十六次】
人工智能学习-AI入试相关题目练习-第十六次1-前言3-问题题目训练【模擬問題①】既出近似探索アルゴリズム問題1【模擬問題②】既出近似教師あり学習・最適化問題2【予測問題①】新傾向強化学習・方策の性質問題3【予測問題②】新傾向確率的推論・状態推定問題44-练习日语版本解析1探索アルゴリズム最良優先探索判定1小结2教師あり学習・最適化判定2小结3強化学習・方策判定3小结4確率的推論・状態推定フィルタ判定4小结 总体判定 你现在最需要立刻修正的 2 件事① **搜索算法 ≠ 学习算法**② **ε 只能出现在「方策」**5-练习日语版本(3-1) ナッシュ均衡と支配戦略均衡(3-2) 混合正規分布モデルGMM(3-3) n-gramモデルとは例(3-4) 教師あり・強化・教師なし学習の違い6-总结1-前言为了应对大学院考试我们来学习相关人工智能相关知识并做各种练习。通过学习也算是做笔记让自己更理解些。3-问题题目训练【模擬問題①】既出近似探索アルゴリズム問題1探索問題において評価値に基づいて探索順序を決定する手法を (a) 探索という。この探索では探索候補を保持する (b) とすでに展開済みのノードを保持する © を用いる。初期状態は (b) に追加され© は (d) に初期化される。探索の各反復では(b) から評価値が最も (e) ノードを取り出し© に追加する。ノードの評価値は一般に実コスト (f) とヒューリスティック関数 (g) に基づいて定義され探索候補は評価値 (h) の (i) 順に並べ替えられる。(a)(i) に入る最も適切な語句を記せ。【模擬問題②】既出近似教師あり学習・最適化問題2教師あり学習では入力データとそれに対応する (a) の組を用いて学習を行う。モデルの学習は出力と正解との差を表す (b) を最小化する問題として定式化される。この最適化においては誤差関数の © を計算し更新量を制御する (d) を用いてパラメータを更新する。しかし誤差関数が非凸である場合学習は (e) に収束する可能性がある。この問題を抑制するためモデルの複雑さを制御する (f) や学習途中で更新を停止する (g) が用いられる。(a)(g) に入る語句を記せ。【予測問題①】新傾向強化学習・方策の性質問題3強化学習においてエージェントは状態に応じて行動を選択するための方策 (a) を用いて行動を決定する。常に最も行動価値の高い行動を選択する方策を (b) 法といいこの方法は © を行わないという特徴を持つ。一方確率 (d) でランダムに行動を選択し確率 (e) で (b) 法に基づく行動選択を行う手法を (f) 法という。さらに行動価値に基づいて確率分布を構成し確率的に行動を選択する手法では(g) 分布が用いられる。この分布は行動価値の差を (h) に反映する特徴を持つ。(a)(h) に入る最も適切な語句を記せ。【予測問題②】新傾向確率的推論・状態推定問題4実世界における状態推定問題では観測情報に (a) が含まれるため現在の状態を一意に決定できない場合が多い。このような状況では状態を単一の値ではなく (b) として表現し観測が得られるたびにその分布を更新する手法が用いられる。この更新処理は© ステップと (d) ステップから構成され前者では (e) に基づいて状態分布を推定する。後者では観測モデルを用いて (f) を計算し分布の総和が 1 となるように (g) を行う。(a)(g) に入る語句を記せ。4-练习日语版本解析1探索アルゴリズム最良優先探索你写的是整理后a最良優先bオープンリストcクローズドリストd空e最小さいfh(s)g損失関数hg(s)i昇順判定空你的答案正解判定说明a最良優先最良優先○完全正确bオープンリストオープンリスト○正确cクローズドリストクローズドリスト○正确d空空○正确e最小さい小さい○同义给分fh(s)g(s)❌严重错误g損失関数h(s)❌概念完全不对hg(s)f(s)❌符号体系错i昇順昇順○正确1小结可得分6 / 9致命点搜索算法里g(s)実コストh(s)ヒューリスティックf(s)g(s)h(s)你把它和**损失函数学習用**混了2教師あり学習・最適化你写的是a正解ラベルb誤差関数你划掉又写cεd1−εe正則化f正規化g早期終了判定空你的答案正解判定说明a正解ラベル正解ラベル○正确b誤差関数損失関数○同义给分cε勾配❌完全不对d1−ε学習率❌概念错位e正則化局所最小値❌错f正規化正則化❌术语混淆g早期終了早期終了○正确2小结可得分3 / 7问题根源 把强化学习的 ε-greedy 错套进了教师学习 梯度下降3強化学習・方策你写的是a方策bグリーディdεe1−εfε-グリーディgボルツマンMDPh確率分布判定空你的答案正解判定说明a方策方策○正确bグリーディグリーディ○正确c缺探索×漏写dεε○正确e1−ε1−ε○正确fε-グリーディε-グリーディ○正确gボルツマンボルツマン○正确h確率分布確率的△部分给分3小结可得分6.5 / 8这是你整页最强的一题4確率的推論・状態推定フィルタ你写的是aノイズb確率分布c予測d観測更新e状態遷移モデルf尤度g正規化判定空判定全部○ 全对4小结满分7 / 7这是本番水准答案 总体判定题号得分(1)6 / 9(2)3 / 7(3)6.5 / 8(4)7 / 7合计22.5 / 31 ≈ 73%结论合格线以上但不安全 你现在最需要立刻修正的 2 件事①搜索算法 ≠ 学习算法搜索g(s), h(s), f(s)学习損失関数, 勾配, 学習率❌ 一混必扣分②ε 只能出现在「方策」ε / 1−ε只属于ε-greedy不能出现在梯度下降、教师学习5-练习日语版本(3-1) ナッシュ均衡と支配戦略均衡ナッシュ均衡相手の戦略を所与としたときいずれのプレイヤも一方的に戦略を変更して利得を改善できない戦略の組。支配戦略均衡各プレイヤが相手の戦略に依らず常に最適となる支配する戦略を持ちそれらが組になった均衡。(3-2) 混合正規分布モデルGMM複数の正規分布の加重和でデータ分布を表す確率モデル[p(x)\sum_{k1}^{K}\pi_k,\mathcal{N}(x\mid \mu_k,\Sigma_k),\quad \sum_{k}\pi_k1](\pi_k)混合係数(\mu_k)平均(\Sigma_k)共分散(3-3) n-gramモデルとは例直前のn−1 語に基づいて次の語の確率を近似する言語モデル。例bigram[P(w_t\mid w_{t-1})]例trigram[P(w_t\mid w_{t-2},w_{t-1})](3-4) 教師あり・強化・教師なし学習の違い教師あり学習入力と正解ラベルの組から学習分類・回帰。強化学習環境との相互作用により報酬を最大化する方策を学習。教師なし学習ラベルなしデータから**構造クラスタリング・次元圧縮など**を学習。6-总结知识一点点记录吧最后应对考试打下基础

相关新闻

MCP——AI连接现实世界的“标准接口”

MCP——AI连接现实世界的“标准接口”

一、MCP是什么? 1)官方定义 MCP(Model Context Protocol)是一个标准化、开源的客户端-服务器(C/S)通信协议。它旨在为大型语言模型(LLM)提供一个统一的、安全的接口,使其…

2026/7/3 13:14:32 阅读更多 →
计网——物理层

计网——物理层

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、通信基础(一) 基本概念(二) 奈奎斯特定理(奈氏准则)与香农定理1. 失真 (Distortion)2. 奈奎斯特定理(奈氏准则&#xff…

2026/7/3 15:46:44 阅读更多 →
开题报告 基于Android的移动点餐系统

开题报告 基于Android的移动点餐系统

目录 基于Android的移动点餐系统简介系统核心功能技术实现方案应用场景与优势潜在挑战 项目技术支持可定制开发之功能亮点源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作 基于Android的移动点餐系统简介 基于Android的移动点餐系统是一种利…

2026/7/5 18:09:27 阅读更多 →

最新新闻

FFBox:免费智能多媒体转码工具箱,让视频处理变简单

FFBox:免费智能多媒体转码工具箱,让视频处理变简单

FFBox:免费智能多媒体转码工具箱,让视频处理变简单 【免费下载链接】FFBox 一个多媒体转码百宝箱 / 一个 FFmpeg 的套壳 项目地址: https://gitcode.com/gh_mirrors/ff/FFBox 你是否曾因复杂的FFmpeg命令行而头疼?是否想要一个既专业又…

2026/7/5 20:46:25 阅读更多 →
Win11Debloat终极指南:3步告别Windows卡顿,免费提升50%系统性能

Win11Debloat终极指南:3步告别Windows卡顿,免费提升50%系统性能

Win11Debloat终极指南:3步告别Windows卡顿,免费提升50%系统性能 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes…

2026/7/5 20:46:25 阅读更多 →
如何用WeChatMsg重新定义个人数据主权:3个颠覆性实践路径

如何用WeChatMsg重新定义个人数据主权:3个颠覆性实践路径

如何用WeChatMsg重新定义个人数据主权:3个颠覆性实践路径 【免费下载链接】WeChatMsg 提取微信聊天记录,将其导出成HTML、Word、CSV文档永久保存,对聊天记录进行分析生成年度聊天报告 项目地址: https://gitcode.com/GitHub_Trending/we/We…

2026/7/5 20:44:25 阅读更多 →
沉浸式国际象棋体验:如何用音效系统让每一步棋都充满戏剧感

沉浸式国际象棋体验:如何用音效系统让每一步棋都充满戏剧感

沉浸式国际象棋体验:如何用音效系统让每一步棋都充满戏剧感 【免费下载链接】chess A multiplayer chess platform 项目地址: https://gitcode.com/GitHub_Trending/ch/chess 想象一下这样的场景:深夜的在线国际象棋对局中,你精心策划…

2026/7/5 20:40:24 阅读更多 →
如何用sd快速构建你的个人脚本库:5个实用技巧

如何用sd快速构建你的个人脚本库:5个实用技巧

如何用sd快速构建你的个人脚本库:5个实用技巧 【免费下载链接】sd a cozy nest for your scripts 项目地址: https://gitcode.com/gh_mirrors/sd1/sd 你是否曾经花费大量时间在杂乱无章的脚本文件中寻找需要的工具?sd(script director…

2026/7/5 20:38:24 阅读更多 →
终极指南:如何用Slidev在5分钟内创建专业开发者演示文稿

终极指南:如何用Slidev在5分钟内创建专业开发者演示文稿

终极指南:如何用Slidev在5分钟内创建专业开发者演示文稿 【免费下载链接】slidev Presentation Slides for Developers 项目地址: https://gitcode.com/GitHub_Trending/sl/slidev 还在为技术分享的幻灯片制作烦恼吗?Slidev 是一款专为开发者设计…

2026/7/5 20:36:24 阅读更多 →

日新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

周新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

月新闻