DB 监控 不是我不聪明系列--只从技术角度考虑监控问题是要挨骂的(2)
❝开头还是介绍一下群如果感兴趣PolarDB ,MongoDB ,MySQL ,PostgreSQL ,Redis, OceanBase, Sql Server等有问题有需求都可以加群群内有各大数据库行业大咖可以解决你的问题。加群请联系 liuaustin3 共3400人左右 1 2 3 4 5 6 7 8 9(1 2 3 4 5 6 7 8群已经爆满 9群 300开10群PolarDB专业学习群110)这是一个新的系列名字叫未卜先知。数据库运维工作中其中有一项重要的工作是数据库的监控和告警的搭建工作。这项工作看似都是技术指标和阀值的搭建同时已经有了成熟的方案和体系-比如 prometheus Grafana可我们看到的文章作品等等都是讲述技术特征的很少有针对具体的公司中的数据库告警问题有成系列成体系的内容出现。DB 监控-告警老明白了但就是搞不好 老挨骂-- 不是我不聪明系列1本着2026年Austindatabases公众号的主旨是利他同时公司也要对数据库的整体的告警和数据库监控进行重大的调整所以新开了这个系列叫不是我不聪明系列那么如果你不清楚这个系列要做什么我们先假设你有如下的问题。1 数据库告警的时候数据库已经down机了领导责问为什么不能更早的发现问题处理问题。2 数据库告警的时候通过短信的方式来告警我晚上睡觉没有听见3 数据库告警的频率太高了我们虽然对数据库告警的阀值进行了调整但是一些数据库还是经常触发阀值比如内存超过85%进行告警但是很长时间都没有出问题大家逐渐对内存超过85%占用失去敏感性而一次内存达到了90%后很快系统就OOM了导致严重的生产事故。4 数据库监控通过Grafana进行展示通过监控图我们例行进行监控突发有一天内存从30%到50%没有注意而后某天出现问题被问责为什么某天内存的占用率从30%突然到50%后没有发现其中的问题导致后面更严重的生产事故。5 数据库的告警和监控是否仅仅围绕技术指标并且同一类型的数据库产品都是一个阀值都是一个监控的选择项而一些业务就是每天有稍短的时间会触发阀值进行告警而这不会出现生产事故大家都知道告警在这个数据库就是鸡肋。各种的数据库告警和监控的问题其实细分后问题多如牛毛正是每天对这些看似小问题或者不是问题的问题再或者由于我们没有注意这些最后导致严重的生产事故的问题。那么我们该怎么办仅仅从技术的角度专研一个数据库的某个技术参数并不能解决问题怎么进行体系化的研究有效的对公司的数据库进行行之有效的监控和告警整体的方案是什么就是我们这个系列要和大家探讨和讨论的如果你也有这方面的问题欢迎关注我们也可以群里去讨论问题通过大家各种问题的提出来寻找在当下最适合你的行之有效的解决方案。好了下期我们将开始针对数据库的分类分级进行讨论告警和监控要做好的第一步是什么

相关新闻

基于嵌入式Linux的毕业设计:从系统裁剪到应用部署的完整技术路径

基于嵌入式Linux的毕业设计:从系统裁剪到应用部署的完整技术路径

很多同学在做嵌入式Linux相关的毕业设计时,常常会感到无从下手。面对一块开发板,从点亮第一个LED到跑起一个完整的应用,中间似乎隔着千山万水。内核怎么编译?文件系统怎么裁剪?驱动怎么适配?这些问题往往让…

2026/7/3 4:46:31 阅读更多 →
Qwen3-ASR-1.7B在PS软件中的语音辅助设计插件

Qwen3-ASR-1.7B在PS软件中的语音辅助设计插件

Qwen3-ASR-1.7B在PS软件中的语音辅助设计插件 1. 设计师的语音助手:为什么需要在Photoshop里说话? 你有没有过这样的时刻:正专注调整一张海报的图层顺序,手却卡在键盘和鼠标之间动弹不得;或者反复点击“滤镜→模糊→…

2026/7/3 4:46:29 阅读更多 →
PL2303老旧芯片驱动修复:开源方案让Windows 10串口设备重获新生

PL2303老旧芯片驱动修复:开源方案让Windows 10串口设备重获新生

PL2303老旧芯片驱动修复:开源方案让Windows 10串口设备重获新生 【免费下载链接】pl2303-win10 Windows 10 driver for end-of-life PL-2303 chipsets. 项目地址: https://gitcode.com/gh_mirrors/pl/pl2303-win10 问题溯源:老旧PL2303设备的Wind…

2026/7/3 4:46:26 阅读更多 →

最新新闻

智驾不是自动驾驶:L2级辅助驾驶的本质与安全边界

智驾不是自动驾驶:L2级辅助驾驶的本质与安全边界

1. 项目概述:一场被误读的技术概念纠偏“智驾”不是“自动驾驶”——这句话从公安部官网发布后,迅速登上各大平台热搜。但很多人点进去只扫了一眼标题就划走,以为又是官媒在喊口号、打预防针。其实这短短十个字背后,是一次对行业术…

2026/7/3 15:27:29 阅读更多 →
AD74413R与PIC32MX675F512L的高精度混合信号系统设计

AD74413R与PIC32MX675F512L的高精度混合信号系统设计

1. 项目概述:AD74413R与PIC32MX675F512L的协同工作 在嵌入式系统设计中,同时实现高精度模拟信号采集(ADC)和输出(DAC)是工业控制、测试测量等领域的常见需求。AD74413R作为ADI公司推出的软件可配置输入/输出…

2026/7/3 15:27:29 阅读更多 →
SIP工艺在电流频率转换模块中的应用:陶瓷封装、金丝键合与气密性设计的技术优势

SIP工艺在电流频率转换模块中的应用:陶瓷封装、金丝键合与气密性设计的技术优势

电流频率(I/F)转换模块作为测控系统中的关键信号链路器件,其封装形式直接影响整体系统的集成度、可靠性和环境适应性。本文从SIP(System in Package)封装工艺的角度,分析将I/F转换电路集成到SIP模块中的技术…

2026/7/3 15:25:28 阅读更多 →
4-20mA电流环原理与INA196工业检测方案

4-20mA电流环原理与INA196工业检测方案

1. 4-20mA电流环基础与行业应用工业现场最让人头疼的莫过于信号传输过程中的干扰问题。记得我第一次在化工厂调试传感器时,电压信号在长距离传输后衰减严重,导致控制室显示的数值和现场实际值相差甚远。这正是4-20mA电流环标准在工业领域经久不衰的根本原…

2026/7/3 15:23:28 阅读更多 →
Windows端微信QQ防撤回原理与实战:RevokeMsgPatcher工具深度解析

Windows端微信QQ防撤回原理与实战:RevokeMsgPatcher工具深度解析

1. 项目概述:为什么我们需要一个“防撤回”工具? 在即时通讯软件成为工作与生活核心的今天,微信和QQ的“消息撤回”功能,就像一把双刃剑。一方面,它给了我们修正口误、弥补失误的机会;另一方面,…

2026/7/3 15:23:28 阅读更多 →
工业4-20mA电流环设计:XTR116与PIC18LF26K22实战解析

工业4-20mA电流环设计:XTR116与PIC18LF26K22实战解析

1. 工业电流环发射器的核心价值与应用场景在工业自动化领域,4-20mA电流环传输堪称模拟信号传输的"黄金标准"。这种传输方式之所以能历经数十年而不衰,关键在于其独特的抗干扰能力——电流信号在长距离传输时几乎不受线路电阻和电磁噪声的影响。…

2026/7/3 15:21:27 阅读更多 →

日新闻

Nginx防御TLS重协商攻击实战:从原理到配置与监控

Nginx防御TLS重协商攻击实战:从原理到配置与监控

1. 项目概述:为什么TLS重协商攻击至今仍需警惕十多年前的CVE-2011-1473,一个关于TLS/SSL协议重协商机制的漏洞,现在提起来还有必要吗?很多运维和开发朋友可能会觉得,这都老掉牙了,现代服务器和客户端不都默…

2026/7/3 0:03:59 阅读更多 →
华为防火墙双通道远程管理实战:Web与SSH配置详解

华为防火墙双通道远程管理实战:Web与SSH配置详解

1. 项目概述:为什么需要双通道远程管理防火墙?在任何一个稍具规模的企业网络里,防火墙都是那个默默守护在边界的关键角色。作为网络工程师,我们不可能每次都跑到机房,插上console线去配置它。远程管理能力,…

2026/7/3 0:03:59 阅读更多 →
AD74413R与PIC18F65K40的高精度工业数据采集方案

AD74413R与PIC18F65K40的高精度工业数据采集方案

1. 项目概述:AD74413R与PIC18F65K40的协同工作在工业自动化和精密测量领域,同时实现高精度模数转换(ADC)和数模转换(DAC)功能是许多复杂系统的核心需求。AD74413R作为一款四通道可配置模拟输入/输出器件,与PIC18F65K40微控制器的组合&#xf…

2026/7/3 0:05:59 阅读更多 →

周新闻

月新闻