您当前的位置:首页 > 电脑百科 > 程序开发 > 框架

Netflix 开源危机管理工具 Dispatch,真香

时间:2020-09-27 10:50:00  来源:  作者:

本文最初发布于 Netflix 技术博客,经授权由 InfoQ 中文站翻译并分享。

什么是 Dispatch?简单说,它是一个管理事件元数据和资源的危机管理编排框架。通过与组织中使用工具(像 Slack、GSuite 等)的深度集成,Dispatch 可以帮助我们有效地管理安全事件。它利用组织熟悉的工具来提供编排功能,而非引入另一种工具。

这意味着你能让 Dispatch 专注于创建资源、安排参与者、发送通知和跟踪任务以及协助事后回顾——让你真正专注于解决问题!

危机管理的挑战

管理事件是一项压力很大的工作。因为,你同时要处理许多问题:范围是什么?谁能提供帮助?我还需要谁参与进来?我应该如何处理这一切?

一般来说,每一个事件都是独一无二的,如果同样的事件一而再再而三地发生,你就成消防员了。

危机管理主要包含四个组件:

  1. 资源管理——不仅要管理收集到的与事件相关的数据,还有所有和事件响应相关的元数据。
  2. 个人参与——理解让个人和团队参与的最佳方式,并根据事件上下文来进行。
  3. 生命周期管理——提供事件指挥官(IC)工具,轻松管理事件的生命周期。
  4. 事件学习——基于以前的事件加快对未来事件的分析。

在本文接下来的讨论中,我们会用到以下术语:

  • 事件指挥官:负责推动事件解决的人。
  • 事件参与者:帮助解决事件的主题专家(SMEs)。
  • 资源:在事件中使用的文档、屏幕截图、日志或任何其他数字化信息。

事件处理步骤

普通事件的处理有很多步骤,其中很多通常都是由人即时处理的。让我们列举下:

  • 声明一个事件——事件有许多不同的入口:自动报警、内部通知或外部通知。
  • 确定事件指挥官——根据事件来源、类型和优先级,确定负责推动特定事件的唯一负责人。
  • 创建沟通通道——事件处理期间的沟通很关键。创建标准化的专用沟通通道可以防止通信筒仓的出现。
  • 创建事件文档——包含最新事件信息的重要文件,其中包括事件描述、资源链接、面对面会议的纪要、打开的问题、行动项和时间表信息。
  • 确定个体资源——事件指挥官不会自己解决事件,他们必须在组织内找出其他的资源,让他们参与进来帮助自己。
  • 引导个体资源——光让其他资源参与进来还不够,事件指挥官还需要让这些资源了解当前的情况。
  • 通知关键干系人——对于任何给定的事件,如果关键干系人没有参与事件解决,则需要通知他们。
  • 推动事件解决——事件的实际解决,创建任务,提出问题,并跟踪答案。解决问题后记录解决问题的要点。
  • 执行事件后回顾(PIR)——回顾事件处理执行过程,跟踪事件发生后要采取的行动,并通过构建非正式知识来推动学习。

每个步骤都需要事件指挥官和事件参与者跨越不同的系统和接口。每次上下文切换都会增加响应者的认知负荷,分散他们解决事件本身的注意力。

更好的危机管理

危机管理不是一项新挑战,像 Jira、PagerDuty、VictorOps 这样的工具都在帮助组织管理和响应事件。当开始自动化事件管理过程时,我们主要有两个目标:

  1. 使用已有的、用户熟悉的工具;降低事件处理所需的学习曲线。
  2. 编目、存储并分析我们的事件数据,加速事件解决。

Dispatch

Dispatch 是一个管理事件元数据和资源的危机管理编排框架。它使用组织中已经在使用的工具,为事件参与者提供一个全面的危机管理工具集,让他们能够专注于解决事件。

与我们的许多工具不同,Dispatch 没有紧密绑定到 AWS,Dispatch 根本不使用任何 AWS API。虽然 Dispatch 不使用 AWS API,但它利用已经在组织中广泛应用的多个 API(例如 Slack、GSuite、PagerDuty 等)。除了所有内置的集成外,Dispatch 还提供了多个集成点,让其能适应几乎任何现有的环境。

尽管是作为帮助 Netflix 管理安全事件的工具而开发的,但 Dispatch 并不局限于安全用例。它的核心目标是管理事件的整个生命周期,专注于让个体参与进来,并为他们提供推动事件解决所需的上下文。

工作流

让我们看一下,使用 Dispatch 时,事件指挥官的新工作流:

Netflix 开源危机管理工具 Dispatch,真香

 

以下是新工作流的部分优点:

  • 事件指挥官不再需要处理资源或多数据流访问。
  • 跨事件的交流是标准化的。
  • 事件参与者会根据事件类型、优先级和描述自动参与进来。
  • 事件可以跟踪,如果事件未能按时处理完成,会提醒所有者。
  • 所有事件数据都可以集中跟踪。
  • 为内部用户和工具提供了共用的 API。

我们想让事件报告尽可能地顺畅,让用户可以在危机发生时直接获取所需的资源。

Netflix 开源危机管理工具 Dispatch,真香

 

对事件指挥官来说,在不同的工具间切换时,保证数据的正确性和同步是一项低价值的活动。相反,我们集中使用两种通用工具来管理整个生命周期。Slack 用于管理事件元数据(例如,状态、标题、描述、优先级等),而 googleDoc 和 Google Drive 用于管理数据本身。

Netflix 开源危机管理工具 Dispatch,真香

 

当团队需要查看许多事件时,Dispatch 提供一个管理 UI。这个界面也是管理事件知识的地方,包括常见术语及其定义、个人、团队和服务。我们用管理 UI 管理事件知识,以便在未来的事件中使用。

Netflix 开源危机管理工具 Dispatch,真香

 

架构

Dispatch 使用了以下组件:

  • Python 3.8 with FastAPI(包括辅助程序包)
  • VueJS UI
  • Postgres

Dispatch 带有内置插件,允许你通过 GSuite(Docs、Drive、Sheets、Calendar、Groups)、Jira、PagerDuty 和 Slack 创建和管理资源。而且,插件架构使得 Dispatch 可以与组织当前使用的任何工具进行集成。

Dispatch 开源项目下载地址:

https://github.com/Netflix/dispatch

说明:

目前,Dispatch 已经在 Netflix 开源网站上提供。你可以借助 Docker 试用。关于详细的安装步骤和配置方法,请查阅文档。如果您有任何建议,请随时联系或提交pull 请求。希望能看到您为了使用Dispatch 而新建的插件!希望您发现Dispatch 非常有用!

原文链接:

https://netflixtechblog.com/introducing-dispatch-da4b8a2a8072

延伸阅读:

Netflix的支付生态系统迁移到AWS的实践-InfoQ

Netflix 的数据基础设施如何兼顾效率和成本?-InfoQ



Tags:Dispatch   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
本文最初发布于 Netflix 技术博客,经授权由 InfoQ 中文站翻译并分享。什么是 Dispatch?简单说,它是一个管理事件元数据和资源的危机管理编排框架。通过与组织中使用工具(像 Slac...【详细内容】
2020-09-27  Tags: Dispatch  点击:(150)  评论:(0)  加入收藏
▌简易百科推荐
近日只是为了想尽办法为 Flask 实现 Swagger UI 文档功能,基本上要让 Flask 配合 Flasgger, 所以写了篇 Flask 应用集成 Swagger UI 。然而不断的 Google 过程中偶然间发现了...【详细内容】
2021-12-23  Python阿杰    Tags:FastAPI   点击:(6)  评论:(0)  加入收藏
文章目录1、Quartz1.1 引入依赖<dependency> <groupId>org.quartz-scheduler</groupId> <artifactId>quartz</artifactId> <version>2.3.2</version></dependency>...【详细内容】
2021-12-22  java老人头    Tags:框架   点击:(11)  评论:(0)  加入收藏
今天来梳理下 Spring 的整体脉络啦,为后面的文章做个铺垫~后面几篇文章应该会讲讲这些内容啦 Spring AOP 插件 (了好久都忘了 ) 分享下 4ye 在项目中利用 AOP + MybatisPlus 对...【详细内容】
2021-12-07  Java4ye    Tags:Spring   点击:(14)  评论:(0)  加入收藏
&emsp;前面通过入门案例介绍,我们发现在SpringSecurity中如果我们没有使用自定义的登录界面,那么SpringSecurity会给我们提供一个系统登录界面。但真实项目中我们一般都会使用...【详细内容】
2021-12-06  波哥带你学Java    Tags:SpringSecurity   点击:(18)  评论:(0)  加入收藏
React 简介 React 基本使用<div id="test"></div><script type="text/javascript" src="../js/react.development.js"></script><script type="text/javascript" src="../js...【详细内容】
2021-11-30  清闲的帆船先生    Tags:框架   点击:(19)  评论:(0)  加入收藏
流水线(Pipeline)是把一个重复的过程分解为若干个子过程,使每个子过程与其他子过程并行进行的技术。本文主要介绍了诞生于云原生时代的流水线框架 Argo。 什么是流水线?在计算机...【详细内容】
2021-11-30  叼着猫的鱼    Tags:框架   点击:(21)  评论:(0)  加入收藏
TKinterThinter 是标准的python包,你可以在linx,macos,windows上使用它,你不需要安装它,因为它是python自带的扩展包。 它采用TCL的控制接口,你可以非常方便地写出图形界面,如...【详细内容】
2021-11-30    梦回故里归来  Tags:框架   点击:(26)  评论:(0)  加入收藏
前言项目中的配置文件会有密码的存在,例如数据库的密码、邮箱的密码、FTP的密码等。配置的密码以明文的方式暴露,并不是一种安全的方式,特别是大型项目的生产环境中,因为配置文...【详细内容】
2021-11-17  充满元气的java爱好者  博客园  Tags:SpringBoot   点击:(25)  评论:(0)  加入收藏
一、搭建环境1、创建数据库表和表结构create table account(id INT identity(1,1) primary key,name varchar(20),[money] DECIMAL2、创建maven的工程SSM,在pom.xml文件引入...【详细内容】
2021-11-11  AT小白在线中  搜狐号  Tags:开发框架   点击:(29)  评论:(0)  加入收藏
SpringBoot开发的物联网通信平台系统项目功能模块 功能 说明 MQTT 1.SSL支持 2.集群化部署时暂不支持retain&will类型消 UDP ...【详细内容】
2021-11-05  小程序建站    Tags:SpringBoot   点击:(55)  评论:(0)  加入收藏
相关文章
    无相关信息
最新更新
栏目热门
栏目头条