目录智能的本质与AI模型基础1. 什么是智能2. 人工智能的基本概念人工智能发展历程1. 符号主义上世纪50年代2. 联结主义与感知器感知器与神经网络基础多层感知器MLP1. 解决线性不可分问题2. 万能近似定理神经网络训练原理1. 损失函数与参数优化2. 激活函数特殊神经网络结构1. 卷积神经网络CNN2. 残差连接3. 层归一化核心计算算子与硬件支持1. 矩阵乘法2. 神经网络与智能芯片AI模型的任务类型分类1. 输入类型2. 输出任务类型总结与展望智能的本质与AI模型基础1. 什么是智能• 定义针对不同情景给出合理输出反应• 生物实验案例草履虫应激性实验• AI应用实例图像识别、AlphaGo、聊天机器人2. 人工智能的基本概念• 图灵测试原理• AI模型的黑盒子比喻• 函数表示法输入情景→输出反应人工智能发展历程1. 符号主义上世纪50年代• 核心思想智能是对符号的处理• 专家系统架构知识库推理机• 成功案例MYCIN医疗诊断系统• 局限性分析2. 联结主义与感知器• 核心思想智能源于人脑神经元结构• 感知器原理模拟生物神经元• 线性计算与非线性计算结合感知器与神经网络基础1. 感知器工作原理• 特征权重分配原理• 阈值判断机制• 实例分析水果识别系统2. 感知器的优势与局限• 数值表示的灵活性• 参数可调性• 异或问题线性不可分性多层感知器MLP1. 解决线性不可分问题• 多层结构原理• 异或问题的多层解决方案• 区域划分策略2. 万能近似定理• 三层神经网络近似任意复杂决策边界• 输入维度与输出种类的关系• 深度神经网络的形成原理神经网络训练原理1. 损失函数与参数优化• 损失函数的作用• 梯度下降法原理• 高维空间优化比喻2. 激活函数• 符号函数的局限性• 常用激活函数类型• 连续性与可导性要求特殊神经网络结构1. 卷积神经网络CNN• 特征提取效率优化• 图像识别中的应用2. 残差连接• 信息损失问题• 跨层连接原理3. 层归一化• 解决内部协变量偏移• LayerNorm与RMSNorm• 加速模型收敛并提高训练稳定性核心计算算子与硬件支持1. 矩阵乘法• 神经网络中的核心计算• 并行计算特性2. 神经网络与智能芯片• 专用硬件优化• 主流芯片介绍A100、昇腾等AI模型的任务类型分类1. 输入类型• 向量输入• 矩阵输入• 序列输入2. 输出任务类型• 回归任务regression气温预测、概率• 分类任务classification图像识别• 生成任务generation文本翻译、图片生成总结与展望这节课搭建了理解AI模型的理论基石接下来我们将深入大模型内部学习如何优化其推理性能。