运维人员应该多学习一些理论知识
原创
白鳝
白鳝的洞穴
白鳝的洞穴
老白个人交流平台,系统优化、Oracle和架构及驴行天下
2021年02月18日 00:26
过年的时候孩儿他妈在学习一个视频转场的制作技巧,我儿子站在旁边看了一会儿说,你没搞懂啥是蒙版,所以你搞不好关键帧。用到运维领域,也是如此。经常有朋友问我:“老白,为什么你做优化的时候总是有神来之笔,而我虽然大致也了解咋回事,但是总是抓不住关键呢?”
其实在十年前,我在创作《DBA的思想天空》的时候,就是希望DBA能从原理出发去考虑运维与优化。在九十年代末的时候,DBA圈子就有两个观点,一个观点是必须深入理解ORACLE的一些算法,才能把ORACLE运维做好,持这种观点的人在不断深入的研究ORACLE INTERNALS;另外一个观点是,对于内部原理,大致清楚就行了,没必要太深入,重要的学习运维与优化的一些方法和技巧,这些人在收集运维的“葵花宝典”。过于深入的分析原理,实际上也是存在瓶颈的,没有目的的学习原理并不能让原理为运维带来帮助。而不考虑原理的情况下去学习技巧,也会学成教条主义。老白是倾向于运维人员需要多学习一些理论知识的,因此在《DBA的思想天空》中都是以原理的学习为出发点,通过原理去分析该如何分析与操作。
只有把原理的理论研究和实际操作结合起来,才能发挥最大的作用。
举个例子,如果你不懂WRITE AHEAD LOG的基本原理,那么你就很难理解数据库CHECKPOINT方面的优化该怎么去做。但是仅仅理解一些初步的理论知识,而没有更为深入的了解Oracle、达梦、PostgreSQL数据库的REDO日志在算法上的不同。这时候你用优化ORACLE日志切换的技巧去优化达梦数据库或者PostgreSQL数据库的日志性能,那么你可能很难很快找到正确的方法。
Oracle数据库的日志切换是一种十分高开销的工作,因此如果日志切换引起了数据库的性能抖动,那么我们通过加大REDO LOG文件的大小就可以缓解这个问题。而PostgreSQL的日志切换只是换了一个新的日志文件去写入WAL数据,整个WAL写入操作并没有受到很大的影响,因此加大WAL LOG BUFFER的大小和增加WAL LOG 文件的大小,对WAL性能的影响并不大,而加大MAX WAL SIZE,对于提高并发事务的能力的效果十分明显。虽然如果我们不知道这个原理,通过实践也能够试出来,不过通过原理去分析出来的方法,肯定会更为精准。
二十多年前,我在学习ORACLE的时候,老DBA总是告诫我,除非是十分紧急的情况,千万不要shutdown abort去关闭数据库,否则容易出事。当时我对数据库的日志和故障恢复的原理也是一知半解,因此就小心谨慎的按照前辈教导我的方法去做。遇到过几次十分紧急的情况,需要立即关闭数据库,shutdown immediate无法关闭数据库,也不敢强制关闭数据可靠,有时候甚至差点酿成严重的后果。后来理解了REDO和数据库故障恢复的原理后,才发现以前前辈教给我的方法是错误的,shutdown abort仅仅会丢失当前没有提交的一些数据而已,数据库重启后就可以恢复。于是再遇到类似问题的时候,就可以有更多的选择了。
知其然,知其所以然,不仅对于运维人员来说是十分关键的,在我们做智能化运维的时候就更为重要了。我们通过异常检测发现的异常点,如果无法确定这些异常点到底异常在哪,那么这些异常点就无法被正确的标注,那么后续的模型训练也就无法高质量的完成了。一个故障场景被发现后,如果无法对该场景通过原理进行抽象,那么我们就无法让这个故障场景变成一个通用的,能够在更为普遍的范围内发现问题,进行故障预警的模型,因为可能下一次发生类似问题的时候,现象又不太一样了。只有有懂得这些原理的专家参与到故障模型的抽象工作中去,才能够举一反三,把某个故障现象抽象成更为普遍与通用的故障模型。只有这种模型才是能够多次重现的,才对我们的日常运维有价值。
2021年新年假期很快的就结束了,对于中国人来说,新的一年才真正的展开。牛年也可能是智能化运维真正在实际生产中落地的元年,很多业务都可能出现颠覆性的变化。前两天老白看到了一个老美对于疫情后高等教育变化的研判,他认为当前各个高校正在上的网课今后可能是高等教育的新常态,就像疫情过去后,电话会议变成了大多数会议的新常态一样。而这种变化会导致全美超过30%的高校破产,而同时谷歌等大企业会借机进入高等教育领域,学生在高等教育上需要获得的除了文凭,更重要的是获得工作机会的能力。
和高等教育与网络电话会议一样,2020年的疫情让我们的更多的运维服务工作变成了离线工作,很多以前认为无法离线进行的运维服务工作被迫在线上离线进行。似乎效果还不错,甚至有些领导发现工作效率和工作效果都比以前还好。我想基于智能化运维的离线服务也将会在2021年生根发芽,我们做好了这个准备了吗?不管如何,运维人员多学点理论知识总是没错的。
预览时标签不可点
关闭
更多
名称已清空
微信扫一扫赞赏作者
喜欢作者
其它金额
文章
暂无文章
喜欢作者
其它金额
¥
最低赞赏 ¥0
确定
返回
其它金额
更多
赞赏金额
¥
最低赞赏 ¥0
1
2
3
4
5
6
7
8
9
0
.
系统健康管理专辑
90
信创生态
346
系统健康管理专辑 · 目录
上一篇
专家知识在AIOPS中的作用
下一篇
评价CPU负载用average LOAD一定没问题吗??
关闭
更多
搜索「」网络结果
暂无留言
已无更多数据
发消息
写留言:
关闭
写留言
提交
更多
表情
微信扫一扫
关注该公众号
继续滑动看下一个
轻触阅读原文
白鳝的洞穴
向上滑动看下一个
当前内容可能存在未经审核的第三方商业营销信息,请确认是否继续访问。
继续访问
取消
微信公众平台广告规范指引
知道了
微信扫一扫
使用小程序
取消
允许
取消
允许
×
分析
:
,
,
,
,
,
,
,
,
,
,
,
,
。
视频
小程序
赞
,轻点两下取消赞
在看
,轻点两下取消在看
分享
留言
收藏
听过
白鳝的洞穴
运维人员应该多学习一些理论知识
,
,
关闭
选择留言身份
更多
关闭
更多
投诉已提交
请选择补充原因