ITSM/ITIL问题管理与做好应用运维的关系
ITSM/ITIL有一个非常重要而且和日常运维关系非常非常密切,但是在我们实践中往往用不好就是问题管理。从我这么多年的实践中确实是这样,发现用的好的,往往是和应用运维和开发关系结合的非常密切。在桌面服务、应用运维、基础架构和基础设施运维几块运维工作来看,应用运维在用好问题管理,是有很多工作可以做的,也是最容易发挥价值的一块,也是实施ITSM的难点之一,做好了应用运维的问题管理也就做好了问题管理,会是项目的亮点之一,因为它有四个非常重要的价值。
问题管理流程是确定某一事件或具有相同症状的一组事件的根本原因,制定和实施解决方案,从而防止事件再次发生的管理流程。其目的是找出事件根本原因,尽可能的给出解决方案或者临时应对措施。目标是降低生产环境中事件发生的数量和严重程度,从而为企业建立一个稳定的 IT 环境,提高 IT 服务的可用性。这里涉及到二个核心的概念:问题和已知错误。
问题(Problem):多个有相同现象的事件或一个重大的事件,并且存在某个未知原因的错误的情况。
已知错误(Known Error):已经成功诊断问题的根源,找到解决方案的情况。
一个问题有几个触发条件,或者说有哪几个应用场景呢?有以下几个:
(1)同一个事件反复发生。这就意味着之前的事件的解决可能只是临时解决,没有找到根本原因、解决方案。
(2)同一个现象多次发生。这类就是可能是同一个系统、同一类设备,其现象相同或者相似。
(3)重大事件发生。这类往往对业务产生了重大影响,这类事件可能在事件中已经临时、应急处理了,需要通过问题管理追查发生的根本原因和解决方案。也有可能从根本上从技术层面根本上解决了,但是要从流程、制度、管理上去找原因,为什么不可以避免。
(4)一切由临时解决方案解决的事件。比如说“万能的重启”解决的事件、直接修改异常数据解决的事件等等。
(5)因为巡检等发现的未知根本原因的潜在问题和重大风险。这类可以直接触发问题去解决,已经发生的故障的,应该通过事件首先处理。
运维服务的工作,大致上可以分为桌面服务、应用运维、基础架构运维和基础设施运维等。这几块容易把问题用好的是桌面服务和应用运维。对于基础架构和基础设施,我的建议是一个重大事件、一个是巡检做好,作为问题的两个输入即可,这个其实比较好落地,但是在问题管理中应用不是主流。如果是就太麻烦了,比如数据中心基础设施和IT基础设施总是出问题不可想象,一般不太会。
本文摘要节选自来源于
https://t.cn/A6aagUhg
ITSM/ITIL有一个非常重要而且和日常运维关系非常非常密切,但是在我们实践中往往用不好就是问题管理。从我这么多年的实践中确实是这样,发现用的好的,往往是和应用运维和开发关系结合的非常密切。在桌面服务、应用运维、基础架构和基础设施运维几块运维工作来看,应用运维在用好问题管理,是有很多工作可以做的,也是最容易发挥价值的一块,也是实施ITSM的难点之一,做好了应用运维的问题管理也就做好了问题管理,会是项目的亮点之一,因为它有四个非常重要的价值。
问题管理流程是确定某一事件或具有相同症状的一组事件的根本原因,制定和实施解决方案,从而防止事件再次发生的管理流程。其目的是找出事件根本原因,尽可能的给出解决方案或者临时应对措施。目标是降低生产环境中事件发生的数量和严重程度,从而为企业建立一个稳定的 IT 环境,提高 IT 服务的可用性。这里涉及到二个核心的概念:问题和已知错误。
问题(Problem):多个有相同现象的事件或一个重大的事件,并且存在某个未知原因的错误的情况。
已知错误(Known Error):已经成功诊断问题的根源,找到解决方案的情况。
一个问题有几个触发条件,或者说有哪几个应用场景呢?有以下几个:
(1)同一个事件反复发生。这就意味着之前的事件的解决可能只是临时解决,没有找到根本原因、解决方案。
(2)同一个现象多次发生。这类就是可能是同一个系统、同一类设备,其现象相同或者相似。
(3)重大事件发生。这类往往对业务产生了重大影响,这类事件可能在事件中已经临时、应急处理了,需要通过问题管理追查发生的根本原因和解决方案。也有可能从根本上从技术层面根本上解决了,但是要从流程、制度、管理上去找原因,为什么不可以避免。
(4)一切由临时解决方案解决的事件。比如说“万能的重启”解决的事件、直接修改异常数据解决的事件等等。
(5)因为巡检等发现的未知根本原因的潜在问题和重大风险。这类可以直接触发问题去解决,已经发生的故障的,应该通过事件首先处理。
运维服务的工作,大致上可以分为桌面服务、应用运维、基础架构运维和基础设施运维等。这几块容易把问题用好的是桌面服务和应用运维。对于基础架构和基础设施,我的建议是一个重大事件、一个是巡检做好,作为问题的两个输入即可,这个其实比较好落地,但是在问题管理中应用不是主流。如果是就太麻烦了,比如数据中心基础设施和IT基础设施总是出问题不可想象,一般不太会。
本文摘要节选自来源于
https://t.cn/A6aagUhg
通用类SaaS的发展可谓灿若星河。按市值,Adobe是最大厂商,高达2000亿美元,略高于全球第二大软件厂商甲骨文。作为后起之秀,Salesforce的市值远超传统软件巨头SAP和IBM,并一度超过甲骨文。另有Intuit和ServiceNow两家企业的市值超过(或比较接近)1000亿美元,它们分别以财会和ITSM见长。当下市值超过100亿美元的通用类厂商有30家左右,它们多创立于本世纪第一个十年。如下表所示。
IT服务管理(ITSM)实施过程4
No.4 采取分步且有序的推进步骤
ITIL流程设计完成后,便开始进入实施阶段。ITIL实施成功与否,除了受流程设计的科学合理性影响外,很大程度上取决于实施过程中的方法和推进策略。在实施ITIL时,需要采取有效的实施步骤,分步实施。
首先,实施前,需要加强宣传和推广,让利益相关者理解更成熟的IT管理对业务的价值和计划某些变革和措施的必要性。
其次,实施时,需要获得领导的支持。由于实施ITIL需要企业的职能架构从面向部门转为面向流程,一场组织结构的阵痛不可避免,这势必会在短期内造成企业运营效率的下降,甚至触及到某些权力斗争的敏感地带,因此如果没有最高层自上而下的推动是肯定不会成功的。
最后,实施过程中,应对遇到的阻力有所准备。ITIL对企业来说是锦上添花而非雪中送炭,其实施效果需要长时间才能显现出来。
为了避免出现不利情况,组织必须采取措施激励有关人员接受变革。这可以从三个方面着手:固化、强化和提醒。首先是考虑到IT系统缺少控制不是因为规 程不到位,而是因为没有执行好这些规程。因此只要有可能,组织应尽量使这些规程变成日常工作的一部分,通过潜移默化来使利益相关者认可ITIL所带来的价 值,这是“固化”的方式。其次,可以开展一些针对性的活动,比如进行全面的项目评审活动、在公开刊物上发表有关文章和回答各种问题。这种方式称之为“强 化”。此外,组织还可以采用“提醒”的方式,比如定期发送信件和邮件,不定期印发传单,以及员工登录系统时显示提示信息等。
本文摘要节选自来源于
https://t.cn/A6a5DRN8
No.4 采取分步且有序的推进步骤
ITIL流程设计完成后,便开始进入实施阶段。ITIL实施成功与否,除了受流程设计的科学合理性影响外,很大程度上取决于实施过程中的方法和推进策略。在实施ITIL时,需要采取有效的实施步骤,分步实施。
首先,实施前,需要加强宣传和推广,让利益相关者理解更成熟的IT管理对业务的价值和计划某些变革和措施的必要性。
其次,实施时,需要获得领导的支持。由于实施ITIL需要企业的职能架构从面向部门转为面向流程,一场组织结构的阵痛不可避免,这势必会在短期内造成企业运营效率的下降,甚至触及到某些权力斗争的敏感地带,因此如果没有最高层自上而下的推动是肯定不会成功的。
最后,实施过程中,应对遇到的阻力有所准备。ITIL对企业来说是锦上添花而非雪中送炭,其实施效果需要长时间才能显现出来。
为了避免出现不利情况,组织必须采取措施激励有关人员接受变革。这可以从三个方面着手:固化、强化和提醒。首先是考虑到IT系统缺少控制不是因为规 程不到位,而是因为没有执行好这些规程。因此只要有可能,组织应尽量使这些规程变成日常工作的一部分,通过潜移默化来使利益相关者认可ITIL所带来的价 值,这是“固化”的方式。其次,可以开展一些针对性的活动,比如进行全面的项目评审活动、在公开刊物上发表有关文章和回答各种问题。这种方式称之为“强 化”。此外,组织还可以采用“提醒”的方式,比如定期发送信件和邮件,不定期印发传单,以及员工登录系统时显示提示信息等。
本文摘要节选自来源于
https://t.cn/A6a5DRN8
✋热门推荐