一、研究背景随着大数据时代的到来如何从高维、非线性、时序数据中提取有效特征并进行准确分类成为研究热点。传统 K-Means 聚类易陷入局部最优而深度学习模型如 Transformer 和 BiLSTM在序列建模中表现优异。本文结合两者提出WOA-K-Means 聚类 Transformer-BiLSTM 分类的混合模型提升数据分类的准确性和鲁棒性。二、主要功能1.main1_WOA_Kmeansplus.m使用WOA鲸鱼优化算法优化 K-Means 的初始质心选择。对输入数据进行聚类分析输出聚类标签和质心。可视化聚类结果、成本变化曲线、簇分配变化、轮廓系数等。2.main2_Transformer_BiLSTM.m读取聚类结果作为标签构建分类模型。使用Transformer BiLSTM混合网络进行分类训练与预测。输出分类准确率、混淆矩阵、ROC 曲线、评价指标精确率、召回率、F1 分数等。三、算法步骤与技术路线第一阶段WOA-K-Means 聚类数据读取与预处理读取 Excel 数据转换为数组。设置聚类数 K、种群数量、迭代次数等。WOA 优化 K-Means初始化鲸鱼种群每个个体代表一组质心。定义目标函数为 K-Means 聚类成本如欧氏距离平方和。WOA 迭代更新质心位置寻找最优聚类中心。聚类与可视化使用最优质心初始化 K-Means 聚类。绘制成本变化曲线、聚类分布、簇大小变化、轮廓系数、质心距离矩阵等。第二阶段Transformer-BiLSTM 分类数据划分根据聚类标签按类别比例划分训练集和测试集分层抽样。数据归一化并转换为序列格式。网络构建位置嵌入层为序列添加位置信息。自注意力层捕捉序列内部依赖关系。BiLSTM 层双向长短期记忆网络提取时序特征。全连接层 Softmax输出分类结果。训练与评估使用 Adam 优化器设置学习率调度。绘制训练过程曲线准确率与损失。输出混淆矩阵、ROC 曲线、六边形图、评价指标柱状图等。四、公式原理1. WOA 优化算法模拟座头鲸捕食行为包括包围猎物X⃗(t1)X⃗∗(t)−A⃗⋅D⃗\vec{X}(t1) \vec{X}^*(t) - \vec{A} \cdot \vec{D}X(t1)X∗(t)−A⋅D螺旋更新$\vec{X}(t1) \vec{D}’ \cdot e^{bl} \cdot \cos(2\pi l) \vec{X}^*(t) $随机搜索$ \vec{X}(t1) \vec{X}_{\text{rand}} - \vec{A} \cdot \vec{D}$2. K-Means 成本函数J∑i1K∑x∈Ci∥x−μi∥2 J \sum_{i1}^{K} \sum_{x \in C_i} \|x - \mu_i\|^2Ji1∑Kx∈Ci∑∥x−μi∥23. 自注意力机制TransformerAttention(Q,K,V)softmax(QKTdk)V \text{Attention}(Q, K, V) \text{softmax}\left(\frac{QK^T}{\sqrt{d_k}}\right)VAttention(Q,K,V)softmax(dkQKT)V4. BiLSTM结合前向和后向 LSTM捕捉双向时序依赖。五、参数设定参数值说明聚类数 K4数据分为 4 类WOA 种群数30鲸鱼个体数最大迭代次数100WOA 优化迭代次数训练集比例70%分层抽样批大小64训练批次样本数最大训练轮数500Transformer-BiLSTM 训练轮数初始学习率0.01Adam 优化器学习率下降因子0.1每 10 轮下降一次注意力头数4多头自注意力机制BiLSTM 单元数128隐藏层节点数六、运行环境操作系统Windows软件平台MATLABR2024b七、应用场景金融风控客户行为聚类与信用等级分类医疗诊断病人症状聚类与疾病分类预测工业故障诊断设备运行状态聚类与故障类型识别完整代码私信回复WOA-Kmeans结合Transformer-BiLSTM组合模型MATLAB代码