IT运维变革引发的联动思考,云时代下数据中心管

日期:2019-09-14编辑作者:澳门金莎娱乐手机版

也许IT运维发展的成果显现没有企业信息化建设成果那样应时应景,但如果没有IT运维管理工作的持续性投入,企业的信息化建设绝对无从谈起。从早期简单的单机管理,到如今的企业云的管理和运维,在不经意间IT运维管理已经在发展中从一棵幼苗孕育成了一棵充满生机的苍松翠柏。

IT运维自动化是指将IT运维中日常的、大量的重复性工作自动化,把过去的手工执行转为自动化操作。自动化是IT运维工作的升华,IT运维自动化不单纯是一个维护过程,更是一个管理的提升过程,是IT运维的最高层次,也是未来的发展趋势。

数据中心的运维管理一直是企业IT管理人员关注的焦点,而数据中心的管理工作纷繁复杂,既有计算节点方面的系统维护,又有网络节点之间的网络管理,各种业务系统的维护也是IT管理者需要考虑的范畴。

“随着企业数据中心规模的加大,传统的IT运维系统将越来越难以适应云计算趋势下的管理需求。”H3C无线及软件产品部部长郑志松讲到。

纵观整个IT管理的发展历程,IT运维经历了一次又一次的变革,而这每一次变革,都为IT运维带来了不同层面和不同角度的思考方向。而当前随着企业数据中心集约化趋势的发展,IT运维迎来了新的变革,而这些变革使得企业信息化管理人员不得不进行更深层次的思考。

传统运维管理方式存在的问题

伴随“云计算”概念的提出以及推广,数据中心管理问题再一次被众多的媒体和厂商推到了风口浪尖,新时代下的数据中心管控又一次成为了人们密切关注的话题。数据中心管理对于企业IT管理者而言已经不是新鲜事物,这回又一次被人们所关注甚至热炒要归结于数据中心自身在急速演变和发展,随之而来的对数据中心的管控要求和难度也不断地增加。

澳门金莎娱乐手机版 1

IT运维的变革

目前许多企业的IT运维已经实现从人工运维到计算机管理,但延展咨询在同客户的交流中发现其中很多企业的IT运维管理还只是处在“半自动化”的运维状态。因为这种IT运维仍然是等到IT故障出现后再由运维人员采取相应的补救措施。这些传统式被动、孤立、半自动式的IT运维管理模式经常让IT部门疲惫不堪,主要表现在以下三个方面:

数据中心的发展

华三通信技术有限公司产品部总监 郑志松

在这场变革中,最容易令人发现的是基础平台的变化,而在基础平台的变化中,最核心的是虚拟机和虚拟网络的应用普及。

(1)运维人员被动、效率低

企业级用户的数据中心在向着什么方向发展?这个问题已经不难回答。随着用户对于信息化需求的不断加大,企业级用户的数据中心正在向着大融合、大集中的方向迈进。正是因为如此,虚拟化、刀片服务器等技术和产品不断地被用户所接受,而云计算概念的提出和发展,更是加速了这一趋势的演变。不少大型企业用户,已经在公司本部建立了高集约的大型数据中心,通过B/S的应用系统来整合各个分公司的数据中心,以此解决信息孤岛等方面的问题。在这样的背景下,数据中心的管理迎来了新的挑战。

很多企业,尤其是中小企业的IT管理人员对这个论调可能还存有疑问,因为他们每天工作所面向的对象还都是类似交换机、路由器、服务器等IT基础设施,但是对于大型企业的IT部门人员来说,这方面的体会他们可能早就已经感知到了。

虽然虚拟化技术为企业信息化建设带来了大量的成本节约和应用便利,但是对于IT运维管理而言,针对虚拟化技术的运维管理工作无疑意味着IT管理演变进程中的一次重大变革。虚拟化的实施,使得的原本想对固化的网络基础架构变得灵活多变,对于虚拟服务器、虚拟网络的运维管理使得传统的人工运维、传统的运维系统力不从心。

在IT运维过程中,只有当事件已经发生并已造成业务影响时才能发现和着手处理,这种被动“救火”不但使IT运维人员终日忙碌,也使IT运维本身质量很难提高,导致IT部门和业务部门对IT运维的服务满意度都不高。目前绝大多数的企业IT运维人员日常大部分时间和精力是处理一些简单重复的问题,而且由于故障预警机制不完善,往往是故障发生后或报警后才会进行处理,,使到IT运维人员的工作经常是处于被动“救火”的状态,不但事倍功半而且常常会出现恶性连锁反应。

数据中心管控的新挑战

云计算变革下的企业IT运维管理演进

同时,高度集约的数据中心虽然节约了企业分散在各地的计算成本,但是企业的核心数据中心却变得更加的复杂和庞大。无论是服务器等计算资源还是交换机等网络资源,它们的节点数量、相互之间的关联程度都变得更加的繁杂。这些资源对于IT运维人员来讲,是一些分散的资源,如果采用传统的方式进行运维管理,往往造成顾此失彼的现象。

(2)缺乏一套高效的IT运维机制

澳门金莎娱乐手机版 2

云计算的大势犹如奔腾咆哮的江水滚滚而来,势不可挡。当企业各个业务对于IT的需求日益强烈,数据中心不断地集约整合,云计算时代的数据中心,甚至企业私有云的雏形开始形成的时候,越来越多的IT管理者感受到了新型数据中心给他们带来的运维挑战。

此外,私有云的落地使得企业的信息化管理者需要将底层的IT基础平台与上层的应用系统进行联动管理,这样才能真正构建起信息化对于实际业务的支持模型,为将来的信息化升级工作做好基础。

目前许多企业在IT运维管理过程中缺少自动化的运维管理模式,也没有明确的角色定义和责任划分,使到问题出现后很难快速、准确地找到根本原因,无法及时地找到相应的人员进行修复和处理,或者是在问题找到后缺乏流程化的故障处理机制,而在处理问题时不但欠缺规范化的解决方案,也缺乏全面的跟踪记录。

早期IT管理人员对数据中心的管理强调两个方面,第一,对数据中心各个环节进行维护,确保数据中心的稳定性;第二,当数据中心内出现问题时,及时定位并且解决问题,缩短故障时间。对于很多中小企业来说,这样的运维工作已可以满足他们的日常需求。

郑志松提到:“今天的IT建设,云计算、虚拟化、资源池化,都是现在IT建设的新特点,用户的整个应用也发生了一些变化,……在当今整个“云”时代的环境下,所有的资源都‘池化’,这种情况之下,如果整个IT基础的三要素不能进行协同工作的话,是无法把整个后台的IT作为资源的。唯一可以解决的是,用户的计算资源迁移的时候能触动网络资源进行相应的更新、变化。”

变革带来的思考

(3)缺乏高效的IT运维技术工具

澳门金莎娱乐手机版 ,当数据中心发展到一定的规模,人们在以往数据中心管控要求的基础上,强调了流程化运维的模式,以便数据中心的运维工作能够更加快捷高效的运作起来,并且通过这样的流程化运维来提高用户的服务满意度。这对于很多大型企业来说,也是不错的运维模式。

虚拟化技术给企业带来了更便利的IT资源应用,同时也对IT管理人员的工作提出了更高的要求。这主要是因为以往的IT运维管理面向的是具体、单一的IT设备,但虚拟化技术应用后,IT管理人员所要管理的对象变得更抽象,当虚拟机发生了迁移,运维人员会发现自己所面对的网络从原本的静态结构转变成了时刻会发生变化的动态结构。在这样的变化下,从虚拟机到虚拟网络,这些新加入的元素成为了运维人员的一道难题,而这道难题却恰恰是传统的面向基础IT管理的运维系统难以解决的。

当变革产生的时候,如果不能主动应对变革,必然会产生失衡,失衡的后果就是信息化建设的坍塌。科技的发展带来了新的IT运维需求,相关服务提供商需要做的事情是找到应对需求变化的理论方法和技术手段。而用户的信息化管理者需要做的则是找到合理的解决方案并且快速的部署实施。

随着信息化建设的深入,企业IT系统日趋复杂,林林总总的网络设备、服务器、中间件、业务系统等让IT运维人员难以从容应对,即使加班加点地维护、部署、管理也经常会因设备出现故障而导致业务的中断,严重影响企业的正常运转。出现这些问题部分原因是企业缺乏事件监控和诊断工具等IT运维技术工具,因为在没有高效的技术工具的支持下故障事件很难得到主动、快速处理。

随着云计算时代的到来,数据中心的发展上升到全新的局面,因此运维工作的整体目标也发生了质的变化,这给IT管理融入了新的元素。

在郑志松看来,上面这些问题是IT建设及管理方式“进化”过程中,一个新阶段的表现。从下图中可以看出传统的IT管理模式和云时代下的IT管理模式的不同特点。

实际上,无论用户还是IT运维服务提供商,他们所探求的核心目的是一致的,那就是将分散的IT资源进行统一的融合管理。不同的是IT运维服务提供商是解决问题的技术提供者,用户是解决问题的方案使用者。

IT运维自动化迫在眉睫

以往的数据中心运维工作的核心是“解决当前问题”,就是如何使问题不出现,出现了问题如何及时定位排除,当问题出现的时候,应该走什么样的流程……

澳门金莎娱乐手机版 3

对于统一的融合管理,需要融合哪些方面?通过什么样的手段进行统一管理?对于这些问题,H3C的iMC2.0数据中心管理解决方案提出了很好的参考意见。

尽管IT运维管理的技术在不断进步,但实际上很多IT运维人员并没有真正解脱出来,原因在于目前的技术虽然能够获取IT设备、服务器、网络流量,甚至数据库的警告信息,但成千上万条警告信息堆积在一起更本没法判断问题的根源在哪里。另外,目前许多企业的更新管理绝大多数工作都是手工操作的。即使一个简单的系统变更或更新往往都需要运维人员逐一登录每台设备进行手工变更,当设备数量达至成百上千时,其工作量之大可想而知。而这样的变更和检查操作在IT运维中往往每天都在进行,占用了大量的运维资源。因此,实现运维管理工作的自动化对企业来说已迫在眉睫。

而当数据中心已经发展到了云计算规模的时候,运维工作的管理对象和工作重心发生了调整。大量的虚拟化设备出现,使得管理工作的工作量和复杂度都大幅提升,这也使得虚拟化和自动化成为数据中心管理员们关注的焦点。

IT建设及管理方式的变迁

想要做到统一融合管理,需要解决的问题可以分成四个方向:

现在随着IT运维管理工作的复杂度和难度的大大增加,仅靠过去几个“运维英雄”或“技术大拿”来包打天下已经行不通了,企业开始需要运用专业化、标准化和流程化的手段来实现运维工作的自动化管理。因为通过自动化监控系统能及时发现故障隐患,主动的告诉用户需要关注的资源,以达到防患于未然。例如,全天候自动检测与及时报警能实现IT运维的“全天候无人值守”,大大降低IT运维人员的工作负担。而且,通过自动化诊断能最大限度地减少维修时间,提高服务质量。因此, 对于越来越复杂的IT运维来说,将纯粹的人工操作变为一定程度的自动化管理是一个重要发展趋势。

面向对象调整:资源管控成为了运维的核心

可以看出,IT运维管理的进化是随着企业信息化发展的步伐而迈进的,这样的进化过程是整体信息化的发展所推动的必然结果。

一、融合的基础设施管理;

首先,IT运维流程自动化能够提高流程的可控性,可以基于业务需求来制定个性化的流程,使企业领导有机会看见他们的业务流程,对企业流程有一个深刻的分析和理解,进而改造和优化流程。

云时代数据中心最明显的特点就是虚拟化技术的大量应用,这使得运维管理的对象也在变化。以前的设备都是真实的,位置也是相对固定,管理起来相对直观。而虚拟化技术的结果是将这些资源都“池化”,使得一切管理对象变成虚拟的、可灵活迁移的逻辑存在。资源在数据中心中的物理位置的可视性变得困难。

IT运维管理变革中要解决的问题

二、智能的自动化管理;

其次,IT运维流程的自动化能提高透明度。因为随着业务需求的变化可能会有多个版本出现,手工流程的不透明将会给流程定制和优化带来相当大的困难,而自动化流程可以使用户能够一目了然的看到整个流程的各个节点运转情况,自动化工具潜移默化地提升业务保障能力。

另一方面,网络和服务器的边界也变得更加模糊,这带来了网络及计算资源的协同调度问题。在创建虚拟机或虚拟机迁移时,VM主机的正常运行,不仅取决于在服务器上的资源合理调度,同时也取决于网络连接的合理调度。打通网络、计算之间的隔阂,实现资源的融合管理和智能调度,将是实现数据中心基于业务调度,并最终实现自动化的关键。

H3C业务软件产品经理李林介绍到,云时代在IT管理方面的挑战是多样的,“首先是基础平台的改变,以前是各个部门去管理部门的事,在建设时也都是分开的。到了云计算时代就会出现融合的观念——所有的资源都通过底层融合或者是虚拟化的技术进行统一建设。这首先带来的就是虚拟化的问题。服务器虚拟之后会产生很多虚拟机,就会产生网络兼容的问题。传统的服务器资源和网络端口是一对一对应的,这样管理起来就非常的便捷,管理员可以很方便地看到服务器的性能和网络性能。那么在云时代,服务器与网络设备在虚拟化之后从原来的一对一变成一对多,而且虚拟机会经常的发生迁移,位置不固定,如何查找、定位虚拟机,就是管理上带来的问题。”

三、完善的安全管控策略;

再者,运维系统实行了自动化监控以后,通过工具自动监控对人的工作是一种减负,也是一种降低成本的表现。

同时,服务器虚拟化应用中,VM的迁移不可避免地造成了其接入位置的动态性。这就要求物理网络配置能提供随需而动的管理能力,从而才能保证VM对网络的连通性、安全性、可靠性需求。因此,要更好地管控资源,准确定位VM和物理交换机连接关系,解决资源迁移问题,是数据中心管理者同样必须解决的关键问题。

这只是IT运维管理进化过程中需要面对的挑战之一。对于IT运维人员来说,对于分散的资源进行统一的管理是基本要求。无论IT运维系统如何发展进化,这个基本要求都不会发生变化。在谈到这个问题的时候,李林表示:“要做到统一管理,除了传统的将网络、安全、应用系统、存储等设备和资源进行统一管理之外,在云计算时代还需要将虚拟化资源放在一起综合考虑。另外,在云计算时代,大家获取信息、数据、服务都变得非常方便,对IT管理系统也有一定的要求,比如怎样在信息更加通畅的前提下考虑系统的安全性等等……,”对此,李林总结了云时代IT运维管理系统的四个要素:“一、需要融合云计算各个基础资源的管理。二、要有自动化方案的保障。三、在传统的安全领域,在运营的角度认证方面要有加强。四、需要有更开放的体系和架构。”

四、开放的IT管理架构。

IT运维自动化管理的具体内容

总结起来说,在云时代的数据中心里,IT管理者必须能够时刻了解自身的IT资源情况,随时能够了解虚拟机和物理服务器之间的对应关系,同时清楚地建立起物理服务器、虚拟机、物理网络、虚拟网络之间的关系,并且把这些元素同企业的应用系统之间的关系建立起来。

为此,H3C在新推出的iMC数据中心管理2.0解决方案中进行了大量的工作,包括与一些虚拟化服务厂商进行配合等等。其实很多虚拟化服务厂商都有自己的管理端,为什么H3C还要做这样的事呢?H3C的解释是:在这些基础的管理之上,iMC数据中心管理2.0还完成了许多创造性的工作。

融合的基础设施管理包括:

IT运维已经在风风雨雨中走过了十几个春秋,如今它正以一种全新的姿态摆在我们面前--自动化,这是IT技术发展的必然结果。现在IT系统的复杂性已经客观上要求IT运维必须能够实现数字化、自动化维护。所谓IT运维管理的自动化是指通过将日常IT运维中大量的重复性工作小到简单的日常检查、配置变更和软件安装,大到整个变更流程的组织调度)由过去的手工执行转为自动化操作,从而减少乃至消除运维中的延迟,实现“零延时”的IT运维。

以业务为核心的管理理念:自动化及端到端业务交付

例如当用户的虚拟服务器搬迁之后,iMC DCM2.0能够通过一些拓扑计算方法计算出来这些服务器之前在哪里,迁到哪里去,之前采取什么策略,之后怎样进行策略跟随。同时,iMC DCM2.0可以针对原本抽象的虚拟机、虚拟网络,生成一个实时的、可变化的现实物理拓扑图,更重要的是,运维人员在开通虚拟机或者关闭虚拟机,调整相关的虚拟网络的时候,可以很方便的在同一界面内联动进行,大大减少了运维过程中的失误概率,同时提升了运维效率。

1、 统一网络管理平台。通过统一的网络管理平台将海量的网络和服务器节点进行实时的监控,通过有效的阀值设定,实现准确的故障以及与故障报警以及准确定位。

简单的说,IT运维自动化是指基于流程化的框架,将事件与IT流程相关联,一旦被监控系统发生性能超标或宕机,会触发相关事件以及事先定义好的流程,可自动启动故障响应和恢复机制。自动化工作平台还可帮助IT运维人员完成日常的重复性工作(如备份、杀毒等),提高IT运维效率。同时,IT运维的自动化还要求能够预测故障、在故障发生前能够报警,让IT运维人员把故障消除在发生前,将所产生损失减到最低。

随着需要管理的元素的增多,云计算数据中心运维需要顾及的方向越来越多元化。运维人员在管理日常的网络、物理服务器等设备外,对于虚拟机、虚拟网络、各个业务应用流程等方面成为了他们新的工作重点。在这样的情况下,如何打通网络、计算之间的隔阂,实现资源的融合管理和智能调度,将是实现数据中心基于业务调度,并最终实现自动化的关键。

此外,在虚拟机发生迁移时的网络策略跟随方面,传统意义上没有很好的解决方法,因为在虚拟化工作中,服务器一定是先于网络进行了虚拟化,当虚拟机产生了以后,虚拟网络才会随之产生。这时候一个物理的交换端口可能产生多对的端口信息,正是因为这个问题,它在迁移的时候会发生故障或者是准确性和时时性欠缺。而iMC DCM2.0可以实现在虚拟机里把网络打上一定的标签,从而进行逻辑的划分,这样就重新实现服务器端口与交换端口一对一的关系,虚拟机迁移时的策略跟随就变得非常的方便。

2、 虚拟网络管理。将虚拟网络与物理拓扑图进行结合,动态显示虚拟网络、虚拟机的变化迁移,将原本比较抽象的虚拟机和虚拟网络进行实体化管理,帮助用户解决虚拟化的管理瓶颈。

IT运维自动化的工具

2012年2月24日,H3C以“融智开放 因云而变”为主题,发布了iMC数据中心管理2.0解决方案简称iMC DCM2.0),其中重点强调的功能就是对于整体IT资源的融合掌握和智能控制。

变革不等于替代

3、 服务器应用管理。针对计算核心的实施监控,针对服务器本身硬件配置以及相关操作系统、虚拟化系统进行监控管理,确保业务计算核心稳定运行。

对于企业来说,要特别关注两类自动化工具:一是IT运维监控和诊断优化工具;二是运维流程自动化工具。这两类工具主要应用于:

通过新发布的iMC DCM2.0解决方案,运维人员可以在同一界面中不仅可以实现传统的IT运维系统中对于数据中心物理层面的全管全控,同时还可以实现虚拟机、虚拟网络的开通和运维。此外,iMC DCM2.0解决方案也提供了非常便利的虚拟机与物理机之间的呼应关系,即便虚拟机发生了迁移,运维人员也可以非常方便的了解到相关的虚拟机迁移到了什么地方,不同的物理服务器上究竟在运行着哪些虚拟机,各个虚拟机分别占用了多少网络资源等等,通过与不同虚拟化产品的API接口相结合,iMC DCM2.0解决方案可以实时生成虚拟机的物理拓扑,将传统的物理拓扑和虚拟机有机的连为一体。通过这样的手段,即便是面对云计算数据中心,运维人员也可以非常清楚地了解到整体数据中心的运行状况,解决了对于云计算数据中心的运维瓶颈。

可能很多人会产生一个疑问,既然运维系统发生了进化,那么我们经常提到的ITSM、BSM这些概念是不是就自然被替代了呢?并不是这样的。从本质上说,IT运维系统面向云计算的计划并没有脱离ITSM等理念,仔细分析,我们会发现,针对虚拟化技术的功能演变,实际上只是ITSM系统中对于配置管理、变更管理等流程下的功能增强,因为ITSM本身不是一个运维系统,它只是一套科学的方法论,所以在这样的方法论之下,产生了新形势下的功能演变。实际上,综观信息化发展的这些年,这样的演变对于我们这些企业级IT人员来讲,已经不是什么新鲜的话题。物竞天择,适者生存,究竟这样的进化还会有什么样的发展,我们只要去关注并且尝试就可以了。  

4、 业务流量分析。针对网络流量以及相关数据包进行分析,一方面保证相关业务的带宽稳定,同时衡量出不同业务对于信息化资源的需求,另一方面,对网络流量的分析也可以杜绝安全隐患。

监控自动化,是指对重要的IT设备实施主动式监控,如路由器、交换机、防火墙等;

通过融合、智能的管理,iMC DCM2.0解决方案能解决数据中心管理者们最为关注的IT资源掌控的问题。同时,它还具备很好的安全性与开放性,不仅拥有完善的安全管控措施,支持配置合规检查、设备操作审计等安全管控策略,让用户的系统更安全;同时还通过开放架构的SOA平台,可轻松实现和第三方系统对接。这些,都让iMC DCM2.0帮助用户更好地实现各种业务的交付。

华三...

智能的自动化管理应该具有的特性包括:

配置变更检测自动化,是指IT设备配置参数一旦发生变化,将触发变更流程转给相关技术人员进行确认,通过自动检测协助IT运维人员发现和维护配置;

总结:

1、虚拟资源自动迁移。服务器虚拟化为保障VM系统的可靠性、灵活性,提供了VM迁移、以及高可用性HA)、热备容错FT)、动态资源池调度DRS)等特性,这些特性都会影响VM的物理部署位置,而VM接入物理网络设备是需要一定的网络资源配置的,其接入位置的动态性就要求物理网络配置能提供随需而动的管理能力,否则VM对网络的连通性、安全性、可靠性需求就无法得到保障。为了实现网络配置的动态迁移、随需而动,准确定位VM和物理交换机的连接关系是关键能力。正在形成标准的802.1Qbg协议不仅保证了所有网络流量都必须在物理交换机上处理,而且通过EDCP/CDCP/VDP等协议解决了VM和交换机连接关系的定位需求。另一方面物理交换机端口和VM的1:N连接关系,使针对每个VM的网络配置实现精细化控制是非常复杂的,H3C实现的802.1Qbg方案通过在物理交换机上支持vPort概念,为解决该问题提供了更好的支持。iMC基于802.1Qbg实现了虚拟化环境中网络配置的自动迁移能力。同时基于iMC对于网络和服务器、VM的融合拓扑分析能力,支持vSwitch环境下的网络配置自动迁移能力。首先根据用户应用对网络资源的需求,定义网络资源类型。然后将此网络资源类型分配给不同的VM,则VM在迁移或启动时,就会在网络设备中自动分配相应的网络资源。

维护事件提醒自动化,是指通过对IT设备和应用活动的时时监控,当发生异常事件时系统自动启动报警和响应机制,第一事件通知相关责任人;

随着IT技术的发展迈进,数据中心的管理已经进入了一个新时代。统一管理IT资源,实现业务端到端交付的运维管理已经成为了云计算IT管控的核心。在这样的背景下,无论是相关的运维解决方案服务提供商还是最终的企业信息化管理者,都必须及时认清IT资源对于运维的重要性。分散资源,集中管理,这依然是IT运维的核心理念,但是在这个理念中,如何保证业务的端到端交付,已经成为了重中之重。

2、数据中心设备“零配置”。这里所说的“零配置”是相关设备与IT运维系统之间的配置关系。对于企业用户而言,内部的信息化设备的品牌繁多,相关设备的更新换代也比较频繁。如果运维系统需要针对每一台设备进行配置备案的话,工作量浩大而繁琐。而iMC的“零配置”指的是IT运维系统对于相关设备的自动识别,相关监控数据的自动采集和抓取,这样既节约了运维系统的上线时间,又降低了管理者的工作成本。
 
3、网络服务自动编排。在云时代的数据中心环境中,我们所面临的不再是一成不变的设备环境,基础设施可能随着业务需求的变换而不断增长、调整。为了屏蔽不同厂商、不同型号设备的差异,使IT管理员聚焦在服务本身,必须要作到对资源及业务的快速开通,实现高度智能的自动化管理。iMC借助融合的资源管理能力,将各种资源提供的能力抽象出来,建立统一的机制,实现基于业务的编排能力。
 
4、IT服务水平自动度量。根据ITIL信息技术基础架构库)规范要求,数据中心IT服务部门通过服务水平管理SLA)来保证其服务有效,建立服务健康水平监督体系,来保证服务达到规定的健康水平等级,即使服务失败,也可以正确分析原因,帮助IT服务部门做出正确的应对决策。

系统健康检测自动化,是指定期自动地对IT设备硬件和应用系统进行健康巡检,配合IT运维团队实施对系统的健康检查和监控;

...

完善的安全管控策略所需要的要素包括:

维护报告生成自动化,是指定期自动的对系统做日志的收集分析,记录系统运行状况,并通过阶段性的监控、分析和总结,定时提供IT运维的可用性、性能、系统资源利用状况分析报告。
编辑本段建立高效IT运维自动化管理的步骤

1、配置合规检查

(1)建立自动化运维管理平台

数据中心规模庞大,设备及系统众多,管理人员经常面临的问题就是大量重复设备配置的规范性、安全性问题。伴随着各种审计体系在级别和频度上的不断增加,传统的通过人工方式检查设备规范性的审计方法,不仅效率低下,还会存在遗漏,已经无法适应云时代数据中心的安全管控需求。都说安全问题“三分技术,七分管理”,但是想要把那“七分管理”iMC配置合规检查内置常用的策略,如NSA路由安全建议、PCI、Syslog功能、设备安全高级建议等,以满足用户的日常检查管理。用户可以自定义合规策略,对网络设备进行配置检查。合规策略包括一个或多个检查规则,一个检查规则分为配置文件、接口、链路、聚合链路、配置片段、脚本等不同类型,包含支持的厂商、设备系列、检查内容来源、规则内容等信息。用户可通过创建检查任务来检查设备是否符合合规策略,检查任务包含待检查的合规策略、设备的信息等。检查任务执行完毕后,可以通过报表查看设备违背合规的信息。对于违背合规的设备,用户可以创建违规修复任务进行修复,及时解决在数据中心环境中出现的配置问题,提高安全等级及各种法案法规的遵从度。

IT运维自动化管理建设的第一步是要先建立IT运维的自动化监控和管理平台。通过监控工具实现对用户操作规范的约束和对IT资源进行实时监控,包括服务器、数据库、中间件、存储备份、网络、安全、机房、业务应用和客户端等内容,通过自动监控管理平台实现故障或问题综合处理和集中管理。例如,在自定义周期内进行自动触发完成对IT运维的例行巡检,形成检查报告。包括自动运行维护,以完成对系统补丁的同步分发与升级、数据备份、病毒查杀等工作。

2、设备操作审计

(2)建立故障事件自动触发流程,提高故障处理效率

设备资源是数据中心的基础资源,对于设备管理的安全性也是信息安全的重要组成部分。与配置合规检查不同的是,iMC设备操作审计从验证管理员登陆设备的身份、权限出发,根据企业设定的规则,合理分配访问设备的权限,即明确管理用户可访问的设备,可执行的命令,可完成的操作并记录设备管理员详细的操作行为信息,以利于以后历史回溯和故障的判断和分析。iMC设备操作审计通过TACACS+协议实现,提供基于接入情境的控制策略,统一的监控设备管理员的登录和执行命令行操作,支持主流厂商的设备,简化操作员为设备管理员细化权限的过程,为管理带来了便捷。

所有IT设备在遇到问题时要会自动报警,无论是系统自动报警还是使用人员报的故障,应以红色标识显示在运维屏幕上。然后IT运维人员只需要按照相关知识库的数据,一步一步操作就可以。因此,企业需要事先建立自动工单式流程管理,当设备或软件发生异常或超出预警指标时会触发相关的事件,同时触发相关工单处理流程给相关IT运维人员。IT运维人员必须在指定时间内完成流程所规定的环节与工作,以提高IT运维响应问题的效率。

开放的IT管理架构的特点:

(3)建立规范的事件跟踪流程,强化运维执行力度

云计算最终的目标是达到系统的按需运营,运营系统能够根据用户请求执行服务的开通。任何一套管理系统,都不可能满足所有用户的需求,在云时代尤其如此,这就要求用户在建设数据中心时具备开放的管理战略,IT管理系统具备开放的能力。iMC是一个开放架构的SOA平台,所有iMC相关产品都是在此统一平台上开发的,并在此平台上封装网络服务并开放服务接口,第三方产品可以使用基于iMC 平台和开放的API接口实现对网络资源的调度。

IT运维自动化管理建设时,首先需要建立故障和事件处理跟踪流程,利用表格工具等记录故障及其处理情况,以建立运维日志,并定期回顾从中辨识和发现问题的线索和根源。事实上许多实践也证明,建立每种事件的规范化处理和跟踪指南,可以减少IT运维操作的随意性和强化运维的执行力度,在很大程度上可降低故障发生的概率。同时,用户还应可以通过自助服务台、电话服务台等随时追踪该故障请求的处理状态。

总结:

(4)设立IT运维关键流程,引入优先处理原则

随着IT运维需求的改变,用户需要及时调整和升级IT运维管理的方式,同时找到适合自身的解决方案。面对这样的变革,H3C iMC2.0提供了一个很好的思考借鉴,感兴趣的用户不妨参考一下。

设立IT运维关键流程,引入优先处理原则是指要求CIO定义出IT运维的每个关键流程,不仅仅是定义流程是什么,还包括要指出每个关键流程对企业有什么影响和意义。同时,在设置自动化流程时还需要引入优先处理原则,例行的事按常规处理,特别事件要按优先级次序处理,也就是把事件细分为例行事件和例外关键事件。

...

变革带来的思考

当变革产生的时候,如果不能主动应对变革,必然会产生失衡,失衡的后果就是信息化建设的坍塌。科技的发展带来了新的IT运维需求,相关服务提供商需 要做的事情是找到应对需求变化的理论方法和技术手段。而用户的信息化管理者需要做的则是找到合理的解决方案并且快速的部署实施。

实际上,无论用户还是IT运维服务提供商,他们所探求的核心目的是一致的,那就是将分散的IT资源进行统一的融合管理。不同的是IT运维服务提供商是解决问题的技术提供者,用户是解决问题的方案使用者。

对于统一的融合管理,需要融合哪些方面?通过什么样的手段进行统一管理?对于这些问题,H3C的iMC2.0数据中心管理解决方案提出了很好的参考意见。

想要做到统一融合管理,需要解决的问题可以分成四个方向:

一、融合的基础设施管理;

二、智能的自动化管理;

三、完善的安全管控策略;

四、开放的IT管理架构。

融合的基础设施管理包括:

1、 统一网络管理平台。通过统一的网络管理平台将海量的网络和服务器节点进行实时的监控,通过有效的阀值设定,实现准确的故障以及与故障报警以及准确定位。

2、 虚拟网络管理。将虚拟网络与物理拓扑图进行结合,动态显示虚拟网络、虚拟机的变化迁移,将原本比较抽象的虚拟机和虚拟网络进行实体化管理,帮助用户解决虚拟化的管理瓶颈。

3、 服务器应用管理。针对计算核心的实施监控,针对服务器本身硬件配置以及相关操作系统、虚拟化系统进行监控管理,确保业务计算核心稳定运行。

4、 业务流量分析。针对网络流量以及相关数据包进行分析,一方面保证相关业务的带宽稳定,同时衡量出不同业务对于信息化资源的需求,另一方面,对网络流量的分析也可以杜绝安全隐患。

智能的自动化管理应该具有的特性包括:

1、虚拟资源自动迁移。服务器虚拟化为保障VM系统的可靠性、灵活性,提供了VM迁移、以及高可用性HA)、热备容错FT)、动态资源池调度 DRS)等特性,这些特性都会影响VM的物理部署位置,而VM接入物理网络设备是需要一定的网络资源配置的,其接入位置的动态性就要求物理网络配置能提 供随需而动的管理能力,否则VM对网络的连通性、安全性、可靠性需求就无法得到保障。为了实现网络配置的动态迁移、随需而动,准确定位VM和物理交换机的 连接关系是关键能力。正在形成标准的802.1Qbg协议不仅保证了所有网络流量都必须在物理交换机上处理,而且通过EDCP/CDCP/VDP等协议解 决了VM和交换机连接关系的定位需求。另一方面物理交换机端口和VM的1:N连接关系,使针对每个VM的网络配置实现精细化控制是非常复杂的,H3C实现 的802.1Qbg方案通过在物理交换机上支持vPort概念,为解决该问题提供了更好的支持。iMC基于802.1Qbg实现了虚拟化环境中网络配置的 自动迁移能力。同时基于iMC对于网络和服务器、VM的融合拓扑分析能力,支持vSwitch环境下的网络配置自动迁移能力。首先根据用户应用对网络资源 的需求,定义网络资源类型。然后将此网络资源类型分配给不同的VM,则VM在迁移或启动时,就会在网络设备中自动分配相应的网络资源。

2、数据中心设备“零配置”。这里所说的“零配置”是相关设备与IT运维系统之间的配置关系。对于企业用户而言,内部的信息化设备的品牌繁多,相关 设备的更新换代也比较频繁。如果运维系统需要针对每一台设备进行配置备案的话,工作量浩大而繁琐。而iMC的“零配置”指的是IT运维系统对于相关设备的 自动识别,相关监控数据的自动采集和抓取,这样既节约了运维系统的上线时间,又降低了管理者的工作成本。
 
3、网络服务自动编排。在云时代的数据中心环境中,我们所面临的不再是一成不变的设备环境,基础设施可能随着业务需求的变换而不断增长、调整。为了屏蔽不 同厂商、不同型号设备的差异,使IT管理员聚焦在服务本身,必须要作到对资源及业务的快速开通,实现高度智能的自动化管理。iMC借助融合的资源管理能 力,将各种资源提供的能力抽象出来,建立统一的机制,实现基于业务的编排能力。
 
4、IT服务水平自动度量。根据ITIL信息技术基础架构库)规范要求,数据中心IT服务部门通过服务水平管理SLA)来保证其服务有效,建立服务健 康水平监督体系,来保证服务达到规定的健康水平等级,即使服务失败,也可以正确分析原因,帮助IT服务部门做出正确的应对决策。

完善的安全管控策略所需要的要素包括:

1、配置合规检查

数据中心规模庞大,设备及系统众多,管理人员经常面临的问题就是大量重复设备配置的规范性、安全性问题。伴随着各种审计体系在级别和频度上的不断增 加,传统的通过人工方式检查设备规范性的审计方法,不仅效率低下,还会存在遗漏,已经无法适应云时代数据中心的安全管控需求。都说安全问题“三分技术,七 分管理”,但是想要把那“七分管理”iMC配置合规检查内置常用的策略,如NSA路由安全建议、PCI、Syslog功能、设备安全高级建议等,以满足用 户的日常检查管理。用户可以自定义合规策略,对网络设备进行配置检查。合规策略包括一个或多个检查规则,一个检查规则分为配置文件、接口、链路、聚合链 路、配置片段、脚本等不同类型,包含支持的厂商、设备系列、检查内容来源、规则内容等信息。用户可通过创建检查任务来检查设备是否符合合规策略,检查任务 包含待检查的合规策略、设备的信息等。检查任务执行完毕后,可以通过报表查看设备违背合规的信息。对于违背合规的设备,用户可以创建违规修复任务进行修 复,及时解决在数据中心环境中出现的配置问题,提高安全等级及各种法案法规的遵从度。

2、设备操作审计

设备资源是数据中心的基础资源,对于设备管理的安全性也是信息安全的重要组成部分。与配置合规检查不同的是,iMC设备操作审计从验证管理员登陆设 备的身份、权限出发,根据企业设定的规则,合理分配访问设备的权限,即明确管理用户可访问的设备,可执行的命令,可完成的操作并记录设备管理员详细的操作 行为信息,以利于以后历史回溯和故障的判断和分析。iMC设备操作审计通过TACACS+协议实现,提供基于接入情境的控制策略,统一的监控设备管理员的 登录和执行命令行操作,支持主流厂商的设备,简化操作员为设备管理员细化权限的过程,为管理带来了便捷。

开放的IT管理架构的特点:

云计算最终的目标是达到系统的按需运营,运营系统能够根据用户请求执行服务的开通。任何一套管理系统,都不可能满足所有用户的需求,在云时代尤其如 此,这就要求用户在建设数据中心时具备开放的管理战略,IT管理系统具备开放的能力。iMC是一个开放架构的SOA平台,所有iMC相关产品都是在此统一 平台上开发的,并在此平台上封装网络服务并开放服务接口,第三方产品可以使用基于iMC 平台和开放的API接口实现对网络资源的调度。

总之,实现IT运维的自动化管理是指通过将IT运维中日常的、大量的重复性工作自动化,把过去的手工执行转为自动化操作。自动化是IT运维工作的升华,IT运维自动化不单纯是一个维护过程,更是一个管理的提升过程,是IT运维的最高层次,也是未来的发展趋势。

看了这么多内容,相信大家对于IT运维自动化以及iMC已经有一些相关的了解了,感谢大家参与我们的活动,赶快回到论坛领取精美礼品吧,也许幸运大抽奖就会降临到您的头上哦。

论坛活动地址:

...

本文由澳门金莎娱乐网站发布于澳门金莎娱乐手机版,转载请注明出处:IT运维变革引发的联动思考,云时代下数据中心管

关键词:

开放九大能力等你来战,IT运维管理的市场展望

在后天的生意社会中,随着消息手艺的不断浓厚,公司和单位的IT系统日渐复杂,一方面,IT系统的运转、维护和治本...

详细>>

移动设备管理仅是个开始,BYOD和ITIL是否水火不容

由于移动设备作为微型计算机而广泛使用的趋势,企业员工和IT团队的工作方式都正在发生着改变。随着越来越多的员...

详细>>

基于ITIL的IT运维管理系统概述,基于ITIL的IT运

由于是大型的知名物流企业,李总对于整体ITIL运维方案的实施有着完善的思考,唯有先推广思路,选择合适的实施方...

详细>>

不再是空中楼阁,ITIL和IT运维管理的

BKJIA.com 综合报道】 面临信息化发展成熟但是IT运维管理低效的现状 IT运维管理在中国已经有着多年的发展历史,从最...

详细>>