|
 |
 |
北京弱电项目的运行维护体系建设解决方案-凯源恒瑞北京监控安装工程公司 |
|
|
北京弱电项目的运行维护体系建设解决方案-凯源恒瑞北京监控安装工程公司
运行维护体系建设方案 1建设内容 在现有基础设施资源实施统一运维管理的基础上,针对本项目,设立运维组织及人员,制定运维管理流程及制度。组建一支由业务管理和信息技术骨干组成的专家队伍,为项目建设、管理与运行提供有力的技术支撑。制度和流程是本项目运维管理推进实施的保障,是运维管理软件业务流程及规则固化的依据。根据实际需求,制定并完善事件管理、问题管理、部署与发布管理、日常运维管理等流程和管理制度,进一步规范项目运维管理工作,提高流程化协同能力及执行效率,提高运维工作质量。项目运维管理主要为应用系统运维管理。实现对应用层的基础信息、连接测试、基本负载等重要信息的监测。能够有效实时地分析HTTP/HTTPS、DNS、FTP、DHCP、LDAP等常见通用服务的运行状态和参数,深入分析服务响应速度变化的技术原因和规律,从根本上解决服务响应性能的问题,并应能主动检查某业务相关环节的健康性,并生成相关业务视图,以便于监控。2运维服务流程 有专人7*24小时接听的移动电话热线,用于解决内部的技术问题以及接听7*24小时机房监控人员的机房突发情况汇报。服务响应时间表如下图所示: | | | I级:属于紧急问题;其具体现象为:系统崩溃导致业务停止、数据丢失。 | | | II级:属于严重问题;其具体现象为:出现部分部件失效、系统性能下降但能正常运行,不影响正常业务运作。 | | | III级:属于较严重问题;其具体现象为:出现系统报错或警告,但业务系统能继续运行且性能不受影响。 | | | IV级:属于普通问题;其具体现象为:系统技术功能、安装或配置咨询,或其他显然不影响业务的预约服务。 | | | 技术支持人员在解决故障时,会最大限度保护好数据,做好故障恢复的文档,力争恢复到故障点前的业务状态。对于“系统瘫痪,业务系统不能运转”的故障级别,如果不能于12小时内解决故障,将在16小时内提出应急方案,确保业务系统的运行。故障解决后24小时内,提交故障处理报告。说明故障种类、故障原因、故障解决中使用的方法及故障损失等情况。 3运维服务等级 4运维机制保障 设备管理机制 设备操作管理制度包括:各种设备应由专业人员操作、使用;设备管理既要实行专人负责制,还要实行台账制,做到有账可查;建立设备变更跟踪制并按不同功能分别建立管理制度。维护维修制度:维护与维修的周期要固定化、手段要规范化、方式要多样化,并坚持“有选择性、 有保障性”的原则, 采用故障维修单管理和故障统计主要软硬件选型原则和详细软硬件配置清单,报表制度;关键设备维修要制定检修计划和各检修项目的检修周期、具体检修时间以及实施细则;检修人员须持有相应的技能证书方能上岗操作:检修工具及更换设备须选用经鉴定合格、性能符合要求的产品。 协调管理制度 调研、设计工作、项目实施工作的进度计划、组织协调和方案评审由承建单位提出,与建设单位协商讨论后确定。调研、设计过程、项目实施过程中,技术开发部负责建设单位各有关部门和人员的协调、配合。监理方负责协调本项目内部各方的关系。调研、设计过程、项目实施过程中,出现问题时各方需及时通告相关方,以便及时统一协调解决。周汇报制度 项目承建单位须按照预先确定的要求于每周五下班前向业主方提交本周周报,总结本周工作,申报存在的问题和需协调解决的事项,做出下一阶段的工作计划。例会制度 项目定期召开例会,各方沟通、协调解决项目过程中遇到的问题。临时召开的项目协调会,由发起方对会议的议题、范围、参会人员及日期等内容进行确定。所有会议必须指派专人记录,会后与会各方对《会议纪要》进行确认后各方签字。建设方对《会议纪要》进行归档。工程变更制度 由于某种原因,项目发生变更,应首先由变更发起方提出工程变更申请,经项目各方会勘同意,进行变更审查和确认后,各方共同签署《工程变更单》,方可实施变更。 应急管理制度 为了应对项目中重要系统突发故障,必须建立一套应急管理机制。应急管理制度中应包括:制定应急计划、进行应急训练。制定应急计划:针对项目中某个重大系统可能发生的事故和故障,建设管理单位应当预先制定系统应急计划,包括:局部事故应急计划、大范围事故应急计划和系统整体应急计划。应急计划应相互衔接、协调一致。进行应急训练:应组织应急演练和培训,做好精神、物质、技术等方面的准备,同时提高用户的防范意识和自助能力。岗位责任制度 建立健全技术岗位责任制,明确各个岗位的职责,并建立相应的考核制度,对实现科学监督、建立正常的监督秩序、提高监督效率、更好地为系统服务有着重要作用。行为规范 遵守用户的各项规章制度,严格按照用户相应的规章制度办事。与用户运行维护体系其他部门和环节协同工作,密切配合,共同开展技术支持工作。出现疑难技术、业务问题和重大紧急情况时,及时向负责人报告。现场技术支持时要精神饱满,穿着得体,谈吐文明,举止庄重。接听电话时要文明礼貌,语言清晰明了,语气和善。 遵守保密原则。对被支持单位的网络、主机、系统软件、应用软件等的密码、核心参数、业务数据等负有保密责任,不得随意复制和传播。5 运维保障 人员保障 信息技术运维服务人员指从事维护工作以及维服务管理工作的专业人员。人员要素目标有两个:(1)确保提供运行维护服务的相关人员具备应有的运行维护服务能力。(2)为保证故障响应、解决问题和交付结果可控,运维服务组织在人员管理、岗位结构和人员的知识、技能、经验、安全意识等方面应达到应有的水平。 资源保障 “资源”作为提供运行维护服务的核心能力要素之一,是指在运行过程中,为了保证运行维护服务的正常交付所依存和产生的有形及无形资产,主要包括运行维护工具、服务台知识库和备件等。
过程保障 负责协商并记录所提供的服务、相应的服务级别目标以及工作量特性,协商并记录服务级别协议、支撑服务约定、供方合同以及相应的程序。服务级别管理还监视并报告服务级别,支持查看和定期的评审,以确保服务级别协议的更新和持续有效。 主要针对性能状况、信息安全状况、容量状况和业务连续性状况这4个方面进行分析,服务报告通常分为常规报告、事件报告和专题报告三类。事件管理流程的主要目标是尽快恢复服务并减少其对业务的不利影响,尽可能保证最好的服务质量和可用性。事件管理流程通常涉及事件的侦测和记录、事件的分类和支持、事件的调查和诊断、事件的解决和恢复以及事件的关闭。问题管理流程的主要目标是预防问题和事故的再次发生,并将未能解决的事件的影响降低到最小。问题管理还将维护有关问题、应急方案和解决方案的信息。配置管理流程负责核实基础设施和应用系统中实施的变更以及配置项之间的关系是否已经被正确记录下来;确保配置管理数据库能够准确地反映现存配置项的实际版本状态。变更管理实现所有应用系统的变更,变更管理应记录并对所有要求的变更进行分类,应评估变更请求的风险、影响和业务收益。其主要目标是以对服务最小的干扰实现有益的变更。 发布管理负责对硬件、软件、文档、流程等进行规划、设计、构建、配置和测试,以便为实际运行环境提供一系列的发布组件,并负责将新的或变更的组件迁移到运行环境中。其主要目标是保证运行环境的完整性被保护以及正确的组件被发布。安全管理应包括但不限于通信及操作、访问控制、信息安全事件管理以及风险评估和等级保护。在具体实施中应依据信息安全管理系统安全等级保护的相关国家标准。
|
|
发布人:凯源恒瑞北京安装监控工程公司
发布时间:2025年5月6日
此新闻已被浏览 92 次 |
|
|
|