云计算事件响应策略的5个步骤
充分的信息和支持,以便在事件发生时进行处理。 云原生组织必须确保其员工了解如何选择其提供商的界面,以收集信息并对发现的内容做出反应。这也意味着员工应该了解企业的事件管理计划以及对他们的期望。 (2) 编制文档 企业都应该有可靠的文档来有效运作。为了支持可能会进行事故响应的员工,这意味着需要创建和维护准确的操作手册。Runbook是企业员工在生产环境中对可预测事件做出反应时可以执行的一系列常规操作和过程。 Runbook不仅限于安全事件,因为它们还可以引导员工完成诸如如何扩展数据库或重新启动卡住的进程等任务。在事件管理方面,对于不熟悉企业架构的员工来说,Runbook是第一道防线。 (3) 聚合 当涉及到事件响应团队识别发生了什么、如何发生以及为什么发生的能力时,数据是关键。尽管日志聚合和分析可能非常昂贵,但这些信息是在以后步骤中进行的任何识别、分类和修复工作的基础。 步骤2:确定 在团队对事件做出响应之前,他们需要确定事件发生的时间。这可以通过多种方式实现,但是通常需要识别异常行为。这是一个人工处理的过程,通过梳理用户报告或查看日志和分析数据进行处理,但是自动化工具的实施是识别大型云计算环境中异常行为的唯一可扩展方式。 通过人工处理或自动过程识别事件之后,许多组织可能选择通知其云计算提供商并对其进行交叉验证。这个步骤可以确保企业对实际事件做出反应,而在时间紧迫的情况下,云计算提供商的支持可以帮助快速结束循环。 步骤3:协调 一旦确定了事件,下一步就是进行组织。在实际解决所有问题之前,需要了解问题的性质和严重性,并定义和与响应团队合作。在这一步骤中,值班人员或企业员工将负责确定报告的性质,并对严重性进行初步评估,然后再将其传递给其团队成员。
建立响应团队: (编辑:淮南站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |