VCG21d44c4283c_副本_副本

IT运维必知哪些原则?

发表时间:2021-03-12 浏览次数:540

  众所周知,技术故障是运维人员的痛!小编相信每个it运维人员都有一个KPI,即可用性。因为高可用性意味着没有失败。在当下这个社会,不同的公司评估可用性和故障的标准肯定也是不同的,所以避免故障的方法也不同。怎样才能避免出现故障?今天景路专业it公司,分享几个点给大家,希望对大家有所帮助。

  1.应该回滚更改,并在同一环境中进行测试

  所有更改都必须回滚,并在同一环境中进行测试。没做过的事,总会在意想不到的地方给你一顿揍。多年的运行维护经验告诉我们,所有没有做过的改动,出错的概率最大。所以我们需要给改变回滚的可能性,在每一步都可能出错的时候考虑回滚到原来的状态。优秀的运维人员对不考虑回滚的操作敬而远之。从某种意义上说,运维是一门经验学科,也是一门试错学科。

  2.小心破坏性操作

  破坏性操作有哪些栏目?有:DROPTable,Drop database,截断表,删除所有数据;这些操作完成后,几乎不可能考虑如何回滚所有数据。即使回滚,成本也很高。您执行这样的语句非常简单,但是回滚和恢复丢失的数据非常困难。这些操作要更加谨慎。

  3.设置命令提示符

  让您始终知道您正在操作哪个数据库以及您在哪个目录中。如果打开了多个标签页,如果每个标签页的标题上的内容都是一样的,我们在剪切的时候可能会在错误的标签页上操作。设置了这个之后,这个问题出现的概率会小很多。

  4.备又验证了备的有效性

  人总是会犯错,但机器可能会在那一天突然崩溃。我该怎么办?我们需要一个准备如果你有备,你能坐下来放松一下吗?还是不行。你需要验证备的有效性在备没有人能保证来自备的数据能100%还原成正确的数据。因此,备份额不仅是备份额,也是备份额。如果不能恢复正确的数据,那只是浪费空间。

  5.交接和休假最容易失败,所以做改动的时候请慎重。

  就是这种体验。当我们总结故障时,发现当公司的部门发生变化时,故障的频率会比正常情况下高50%以上。有人说这是因为机器或者应用是不愿意离开的情感操作者。

  先不说感受,简单理性分析一下。公司或部门难免会有一些调整,变化是世界上唯一不变的东西。运维人员是做事情的一线人员。部门的调整或者领导的变动,都可能导致工作侧重点的不同,做事的方式和评价的标准都发生了变化。适应的过程中难免会有一些欠考虑的地方,失败是有道理的。

  因此,运维部门和运维人员需要对变化尽量保持冷静;接管别人的工作,需要反复确认变更计划。问人不一定是无能的表现;度假前最好把各种事情都做好,最好给备一份文件,说明在什么情况下该做什么和联系谁。趁着别人放假接手工作,“能拖就拖”确实需要落实:一定要不厌其烦的跟原操作者确认每一个操作的细节。

  6.设置警报并及时获取错误信息

  构建性能监控,了解历史,了解趋势,预测未来。运维的最高境界不是故障来了,而是没有故障,让故障消灭在萌芽状态。他们赖以生存的工具是警报和监控。报警可以让你及时知道系统有什么异常。性能监控可以让您了解系统的历史性能信息。分析故障发生时的各种现象,确认故障的真实原因;了解变化趋势,找到故障征兆,尽快优化调整。报警和性能监控并不是完全独立的,很多性能监控项目也可以报警。

  以上就是小编分享的关于it运维须知的几点介绍,相关大家对运维知识已经有所了解了,这次就分享到这里了,下次再见,需要专业运维管理,可以咨询联系小编,期待与您合作。

  文章推荐:服务器idc机房是什么?