机器学习 —— 关联规则
摘要关联规则挖掘是机器学习中用于发现数据集中项目间关联关系的技术主要应用于购物篮分析等领域。该方法通过支持度和置信度指标衡量规则强度其中支持度反映规则普遍性置信度表示规则可靠性。使用Python的mlxtend库可实现关联规则挖掘包括数据编码、Apriori算法查找频繁项集和生成关联规则等步骤。该技术可应用于医疗、金融等多个领域帮助从大型数据集中提取有价值的模式。核心概念包括前件、后件、频繁项集等Apriori算法是其经典实现方法之一。目录机器学习 —— 关联规则示例输出结果频繁项集输出关联规则输出术语说明机器学习 —— 关联规则关联规则挖掘Association Rule Mining是机器学习中的一种技术用于从大型数据集中发现有价值的模式。这些模式以关联规则的形式呈现代表数据集中不同项目或属性之间的关联关系。关联规则挖掘最常见的应用场景是购物篮分析Market Basket Analysis其目的是识别出经常被一起购买的商品。关联规则由前件antecedents集合和后件consequents集合组成。前件代表规则适用所需满足的条件或存在的项目后件则代表与前件相关联的结果或可能出现的项目。关联规则的强度通过两个指标衡量支持度support和置信度confidence。支持度是数据集中同时包含前件和后件的交易占比置信度是在包含前件的交易中同时包含后件的交易占比。示例在 Python 中mlxtend库提供了多个用于关联规则挖掘的函数。以下是使用mlxtend中的apriori函数实现关联规则挖掘的示例代码# 导入所需库 import pandas as pd from mlxtend.preprocessing import TransactionEncoder from mlxtend.frequent_patterns import apriori, association_rules # 创建样本数据集购物交易记录 data [ [牛奶, 面包, 黄油], [牛奶, 面包], [牛奶, 黄油], [面包, 黄油], [牛奶, 面包, 黄油, 奶酪], [牛奶, 奶酪] ] # 对数据集进行编码 te TransactionEncoder() te_ary te.fit(data).transform(data) # 拟合并转换数据 df pd.DataFrame(te_ary, columnste.columns_) # 构建编码后的DataFrame # 使用Apriori算法查找频繁项集 frequent_itemsets apriori(df, min_support0.5, use_colnamesTrue) # 生成关联规则以置信度为指标最小阈值设为0.5 rules association_rules(frequent_itemsets, metricconfidence, min_threshold0.5) # 输出结果 print(频繁项集) print(frequent_itemsets) print(\n关联规则) print(rules)在上述示例中我们首先创建了一个购物交易样本数据集然后通过mlxtend的TransactionEncoder对数据进行编码处理。接着使用apriori函数查找最小支持度为 0.5 的频繁项集Frequent Itemsets最后通过association_rules函数生成最小置信度为 0.5 的关联规则。apriori函数接收两个核心参数编码后的数据集和最小支持度阈值。use_colnames参数设为True时将使用原始项目名称如 “牛奶”“面包”作为列名而非布尔值True/False。association_rules函数接收三个关键参数频繁项集、评估指标本示例使用置信度和最小阈值本示例设为 0.5。输出结果上述代码的输出将包含频繁项集和生成的关联规则。频繁项集代表数据集中经常同时出现的项目组合关联规则则代表频繁项集中各项目之间的关联关系。频繁项集输出supportitemsets0.666667(面包)0.666667(黄油)0.833333(牛奶)0.500000(面包黄油)0.500000(面包牛奶)0.500000(黄油牛奶)关联规则输出antecedentsconsequentsantecedent supportconsequent supportsupportconfidenceliftleverageconvictionzhangs_metric(面包)(黄油)0.6666670.6666670.50.751.1250.0555561.3333330.333333(黄油)(面包)0.6666670.6666670.50.751.1250.0555561.3333330.333333(面包)(牛奶)0.6666670.8333330.50.750.900-0.0555560.666667-0.250000(牛奶)(面包)0.8333330.6666670.50.600.900-0.0555560.833333-0.400000(黄油)(牛奶)0.6666670.8333330.50.750.900-0.0555560.666667-0.250000(牛奶)(黄油)0.8333330.6666670.50.600.900-0.0555560.833333-0.400000关联规则挖掘是一种功能强大的技术可应用于多种类型的数据集。除了常用于购物篮分析以识别共同购买的商品外它还能应用于医疗保健、金融、社交媒体等多个领域。借助mlxtend等 Python 库我们可以轻松实现关联规则挖掘并从大型数据集中提取有价值的洞察。术语说明关联规则Association Rule描述数据集中项目之间关联关系的规则形式为 “前件→后件”。前件Antecedent规则的前提条件即触发规则的项目集合如 “购买面包”。后件Consequent规则的结果即与前件相关联的项目集合如 “购买黄油”。支持度Support数据集中同时包含前件和后件的交易比例反映规则的普遍程度。置信度Confidence包含前件的交易中同时包含后件的比例反映规则的可靠程度。频繁项集Frequent Itemset支持度达到或超过最小支持度阈值的项目组合。Apriori 算法关联规则挖掘中用于查找频繁项集的经典算法核心思想是 “频繁项集的子集必为频繁项集”。

相关新闻

【课程设计/毕业设计】基于Java web的酒店管理系统设计与实现客房预订、入住登记、房态管理【附源码、数据库、万字文档】

【课程设计/毕业设计】基于Java web的酒店管理系统设计与实现客房预订、入住登记、房态管理【附源码、数据库、万字文档】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

2026/7/5 22:21:34 阅读更多 →
车灯控制与报警系统设计

车灯控制与报警系统设计

车灯控制与报警系统设计 一、设计背景与意义 车灯是汽车行驶安全的关键保障,负责照明、信号提示与故障预警,传统车灯控制系统多采用机械开关与继电器控制,存在响应滞后、功能单一、故障诊断能力弱等问题。在复杂路况(如暴雨、浓…

2026/7/5 22:19:44 阅读更多 →
P6KE11CA双向 TVS瞬态抑制二极管:11V钳位电压,600W峰值脉冲功率

P6KE11CA双向 TVS瞬态抑制二极管:11V钳位电压,600W峰值脉冲功率

双向P6KE11CAtvs瞬态电压抑制二极管 P6KE11CA双向 TVS瞬态抑制二极管 二极管产品已经跟我们的生活有着密不可分的联系了, TVS瞬态抑制二极管,是一种高效能保护二极管,产品体积小、功率大、响应快等诸多优点,产品应用广泛 TVS瞬态…

2026/7/5 1:46:12 阅读更多 →

最新新闻

Python 爬虫实战:汽车之家 50,524 条车型数据入库,MySQL 与 MongoDB 性能对比

Python 爬虫实战:汽车之家 50,524 条车型数据入库,MySQL 与 MongoDB 性能对比

Python 爬虫实战:汽车之家 50,524 条车型数据入库与数据库选型指南1. 爬虫数据存储的核心挑战在数据驱动的互联网时代,爬虫技术已成为获取信息的重要手段。但许多开发者在完成数据抓取后,往往面临一个关键问题:如何高效、可靠地存…

2026/7/5 22:20:51 阅读更多 →
红外与可见光图像配准:基于斜率一致性的创新方法

红外与可见光图像配准:基于斜率一致性的创新方法

1. 红外与可见光图像配准的核心挑战在计算机视觉领域,红外与可见光图像的配准一直是个棘手问题。我十年前第一次尝试用传统SIFT算法匹配这两种模态的图像时,匹配点对少得可怜——红外图像主要反映温度分布,可见光图像则依赖光学反射&#xff…

2026/7/5 22:20:51 阅读更多 →
Apache .htaccess文件上传漏洞:原理、利用与防御实战

Apache .htaccess文件上传漏洞:原理、利用与防御实战

1. 项目概述:.htaccess文件上传漏洞的攻防本质 在Web安全渗透测试的日常工作中,文件上传漏洞一直是一个“兵家必争之地”。它直接、有效,一旦利用成功,往往意味着可以直接获取Web服务器的控制权。而 .htaccess 文件,…

2026/7/5 22:18:51 阅读更多 →
AI创意工作流深度解析:MiniMax Hub如何重塑内容创作与设计流程

AI创意工作流深度解析:MiniMax Hub如何重塑内容创作与设计流程

🚀 30款热门AI模型一站整合,DeepSeek/GLM/Qwen 随心用,限时 5 折。 👉 点击领海量免费额度 这次我们来看一个面向创意工作的AI工具——MiniMax Hub。它被描述为“创意工作的Claude Code”,这个定位很有意思。Claude…

2026/7/5 22:16:50 阅读更多 →
AI客服系统选型实战指南:实时性、方言识别与合规性深度解析

AI客服系统选型实战指南:实时性、方言识别与合规性深度解析

1. 这不是“软件排行榜”,而是一份AI客服系统选型实战手记 我做智能客服系统集成和落地已经九年,从最早给银行部署基于规则的IVR语音导航,到后来带团队在电商大促期间扛住单日300万通AI外呼峰值,再到去年帮一家跨境SaaS公司把人工…

2026/7/5 22:14:50 阅读更多 →
步进电机全闭环控制与EtherCAT总线技术详解

步进电机全闭环控制与EtherCAT总线技术详解

1. 步进控制全闭环系统概述 在工业自动化领域,步进电机因其结构简单、控制方便而广受欢迎,但传统开环控制存在丢步风险。ZMC432CL-V2运动控制器通过光栅尺全闭环反馈和EtherCAT总线技术,完美解决了这一问题。这套系统的工作原理是&#xff1a…

2026/7/5 22:12:49 阅读更多 →

日新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

周新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

月新闻