由萧何出名想到的,云时代IT运维体系或迎重大变

2020-03-17 作者:亚洲城动态   |   浏览(185)

“萧何是谁?”单纯的问我们一般老百姓,还真不知道。但是说到俗语“成也萧何,败也萧何。”“萧何月下追韩信”等等,似乎一下子清楚了:他呀,推荐给刘邦打败西楚霸王项羽的那个韩信的人啊。至于萧何其他事迹,则是知之甚少了。《史记·高祖本纪》中高祖曰:“……镇国家,抚百姓,给馈饷,不绝粮道,吾不如萧何……。连百万之军,战必胜,攻必取,吾不如韩信……”从高祖的结论来看,萧何本身的工作很大一部分就是刘邦的后勤部长。看历史得知萧何尤其是在楚汉战争期间,使刘邦在关中站稳脚跟,为刘邦屡败屡战,最后打败项羽提供了源源不断的物质和兵力支持。

图片 1

为IT系统设备提供稳定运行平台的数据中心,好比是为战场前线提供支持的大后方,相关的运维人员的工作和萧何的本职工作何其相似。古今中外,赫赫有名的将帅不可胜数,太多了。而在战争期间,对于负责“兵马未动,粮草先行”的后勤部队而言,他们的长官的名字在史书的记载中,可是凤毛麟角。而萧何作为大后勤部长,似乎也没有做出什么出名的成绩,假如他为了突出自己的成绩,这样写自己的总结:“······本年度为前线提供粮草X万石,提供兵源十万······”;前方将领看到后一定骂死他:“你的意思是我们损兵折将起码十万了?······”刘邦为了全局出发,也会斥责萧何的。在《三国演义》中出了一个有名的“后勤部长”—王垕:在曹操和袁绍的官渡之战中,曹操缺粮,为了稳定军心,争取时间的主动性,杀了运粮官王垕,使王垕成为替罪羊,为整个战争的胜利提供了一定的保障。在战争期间,一线最重要,所有的工作都是为战胜敌人服务的,以大局为重。我们一般认为萧何的出名很大程度沾了前线名将韩信的光,毕竟在以后的传承中似乎萧何没有韩信的名气大。虽然如此,西汉建立后,刘邦在分封大臣时,萧何位列众卿之首,被称为“开国第一侯”;“汉初三杰”之首。

云计算是一种新的计算方法和商业模式,通过虚拟化、分布式处理和宽带网络等技术,按照“即插即用”的方式,将计算、存储、网络等IT基础设施,以及其上的开发平台、软件等服务,抽象成高效、弹性、可运营、可管理的公共信息处理资源,通过公众通信网络,以按需分配的服务形式向用户提供动态可扩展信息处理能力和应用服务,用户按实际使用数量进行付费。

一般而言,每个人都想在自己的工作中做出成绩,受到表扬,扬名立万,但是由于每个人所从事的工作不同,有的工作正常来说是很难出名的,比如数据中心运维相关工作:数据中心基础设施的运维工作,从来没有走到前台,一般人们看不到他们的身影,甚至不知道他们的存在,相关的设施设备的巡检、检修、维护等都是在立足于影响最小的情况下完成。随时当前信息技术的发展,使得对整个系统运行安全、运行效率的要求也越来越高,这就对为信息系统平稳运行提供平台的数据中心机房等基础设备的稳定性、安全性、可靠性等提出了更高的要求。相应的其安全性等也越发的重要。所以一旦基础设施出了问题,大到甚至或者影响到了相关业务的正常,无论从经济效益,还是社会影响等各方面,负面影响都是巨大的。这样的出名后果是可想而知的。这其中最大的出名就是火灾。

以云计算服务为核心的数据中心运维管理,是一种新型的管理理念,数据中心运维管理是数据中心生命周期中最后一个也是历时最长的一个阶段,从前期应用架构设计、软硬件资源配置评估、应用服务性能瓶颈评估到安全防护和系统优化等工作,都需运维人员全程参与。

看到上面的图片,许多人都会嗤之以鼻:这不是PS的吗,这是假的等等类似的评论:确实,这图片不是真的。试想一下,真要是机房失火,相关人员不是忙着逃生,就是忙着灭火,谁还有工夫或者时间去找相机、调试焦距等认真的拍摄失火的现场呢?一般人总认为数据中心都配有完善的消防器材、设施,并备有温感、烟感等报警器。防火纯粹是小题大做。殊不知,一旦数据中心失火,到了灭火的程度,意味着事发地点的所有的设备都要受到牵连,后面的影响将是巨大的。下图为例

云计算服务的运维管理集中体现在对云计算服务生命周期的管理。服务的生命周期在IT服务的标准ITlLv3中有明确定义,其核心架构是基于服务的生命周期。服务的生命周期以服务战略为核心,以服务设计、服务转换和服务运营为实施阶段,以服务改进来提高和优化对服务的定位及相关的进程与项目。

这可是真实的火灾后的现场照片,触目惊心。

IT运维领域迫切需要对以云计算为核心的下一代数据中心提供更好的运维支撑解决方案,将各种先进的运维管理技术进行有效的整合,对新增虚拟网络、数据存储、虚拟机、宿主机、集群对象采用全新管理方式,从日常监控、周期巡检、服务受理、故障处理、平台维护、配置管理、安全管理等方面着手,利用自动化运维工具,实现对物理资源、虚拟资源统一管理,提供资源管理、统计、监控、调度、服务管控等端到端的综合管理能力,从而实现对云数据中心统一、便捷、高效、智能的一体化运维管理。

防火贯穿数据中心整个生命周期。为此对于数据中心的火灾一定要有“隐患险于明火,防范胜于救灾,责任重于泰山。”的思想意识,时刻牢记“安全第一”这根弦。在数据中心的生命周期中,测试验证是数据中心运维的起点,如果没有意识到测试验证的重要性,可能因为各种缘由把这个重要的步骤省略掉,这样疏漏很容易导致后期运维的重大隐患,魏徵在《谏太宗十思疏》中的首句“臣闻求木之长者,必固其根本”就是这个道理。数据中心主要服务的对象是IT系统。在其几十年的生命周期中,IT系统的变动却非常大。IT技术的变革同时也带动了关键基础设施技术的不断变化,所以还要关注一些关键基础设施的生命周期。这些关键基础设施的生命周期由多方面的因素所决定的。其中新技术的发展是数据中心关键基础设施更新换代、周期缩短的主要原因。这就要求运维人员也要紧跟时代潮流,不断了解、学习业界最新的动态、技术,与时俱进。在保证安全的前提下,采用新的技术来处理和解决问题,以减少处理的时间和风险。为相关设施的更新换代提供参考或者技术支持。安全性、可靠性是数据中心运维最基本的要求,因此日常的检查、维护、保养计划等一定做精做细做全,做到可预防性维护。同时根据各类设备的特点还要“具体问题具体分析”,如IT设备上架,要提前查看空开的容量等;夏季多关注空调的冷凝系统,防止高压报警等;冬季多关注空调加湿系统,防止加湿故障报警等。虽然各种新的绿色的或者先进的技术层出不穷,但是采用相关技术或者设备一定要采用成熟、稳定的—安全第一

业务导向放首位根据国家标准化管理委员会下发的文件,运行维护服务是供方依据需方提出的服务级别要求,采用相关的方法、手段、技术、制度、过程和文档等,针对运行维护服务对象提供的综合服务。为确保提供的运行维护服务符合与需方约定的质量要求,供方应具备实施运行维护服务的基本条件和能力。

总之,数据中心基础设施的运维是一项非常关键的、又是一项枯燥的、重复性很高的工作,其工作的特性就是运维正常是应当的、必须的,出现问题绝对是禁止的;数据中心基础设施推行的是风险管理和预防性维护策略,风险一定要及早控制或消除,因此必须做到:

云计算体系下的运维目标首先应该以业务为导向,如新业务的快速部署、系统容量的平滑扩容、随需而变的资源分配等,保证服务达到要求的等级标准,根据业务目标形成IT服务的管理目标。其次通过自动化的运维工具完成系统预备、配置管理以及监控报警等功能,降低故障发生率,提升故障发生后的响应处理效率,实现业务的快速恢复。最后通过改进运行维护服务能力管理过程中的不足,持续提升运行维护服务能力。

一、建立完善的巡查和维护、保养、应急处理等机制。

打造智能化运维管理模式数据中心需要建立集中高效、性能优质、快速响应的智能一体化运维生产管理模式,对数据中心的网络、系统、设备、设施,实行集中监控、集中IT平台支撑、垂直专业管理、统一运行调度。建立合理的运维服务管理制度,包括完善的管理组织结构、明确的岗位职责、人员素质能力要求、工作流程和管理制度。建设智能集中监控信息化平台,包含集中动环监控系统、集中网络监控系统、集中电子运维系统、集中IT运营支撑等系统,实现可用性、安全性和预警控制。建立降本增效、绿色节能的效益管理模式。

二、采用与时俱进的动环监控、报警系统。以减少误报、漏报的发生。

为保证故障响应、解决问题和交付结果可控,供方应在人员管理和岗位结构以及人员的知识、技能、经验、安全意识等方面满足所需水平,组建掌握网络、动力、安全、消防、IT软硬件等核心专业技术的运维支撑队伍。

三、相关人员的责任心、行动力至关重要。毕竟人才是最重要的因素:才是解决、处理问题的关键。扁鹊大哥擅长的是“事前控制”、“治未病”、防患于未然、无为而治才是解决问题的最好方式或者最高境界。借用一位老运维人士的话:宁可默默无闻,不当救灾英雄。

云计算将为运维体系带来新的理念,通过一体化、自动化、智能化的IT系统,将传统运维工作中的大量简单、重复性的手工工作通过软件实现,使运维人员有更多精力、条件,投入到整个服务生命周期当中。IT运维服务企业需要构建完善、成熟的IT运维服务体系,从制度、流程、人员、技术、资源等方面入手,不断提高IT运维质量,实现高效运维。

声明:本网站发布的内容以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-62778877-8306;邮箱:hyg@west.cn。本站原创内容未经允许不得转载,或转载时需注明出处::西部数码资讯门户 云时代IT运维体系或迎重大变革

本文由yzc216亚洲城发布于亚洲城动态,转载请注明出处:由萧何出名想到的,云时代IT运维体系或迎重大变

关键词: 亚洲城官网 yzc216亚洲城