咱们在往常工作中经常会听到有人说体系性危险,但体系性危险到底是个啥?

1 体系性危险是什么

1.1 界说

「体系性危险」是一个经济术语,首要指的是一种或许导致整个金融体系或商场瘫痪的危险或概率。它是从体系性危险的整体性动身,而不是单一机构或许单一职业的危机。这一般是由于金融体系中一个重要组成部分的失败,例如一个大银行或一系列银行的破产,这或许引发一种连锁反应,影响整单个系。

当突发性工作导致金融机构或商场失灵时,资金无法在商场中有用输送和装备,然后引起整个商场的溃散。体系性危险不仅仅是经济价值丢掉,还会对实体经济构成严重影响,并导致大部分金融体系的信心损失。

如 2008 年的全球金融危机。在这个危机中,许多大型金融机构由于负债过重和资产质量下降而陷入困境,这引发了对全球金融体系安稳性的广泛忧虑。

体系性危险是监管机构、方针制定者和经济学家重视的首要问题,由于假如这种危险实现,或许会导致严重的经济丢掉和社会动荡。因而,他们会测验制定和执行各种方针和法规,以削减体系性危险的或许性。

1.2 体系性危险和非体系性危险的差别

体系性危险作为一种具有更大影响面的危险,和非体系性危险有以下几个方面的差异:

1. 影响规划:体系性危险具有广泛的影响规划,不仅仅限制于特定单个或组织,而是或许触及整单个系、商场或职业。非体系性危险则相对较部分化,一般只对特定单个、组织或项目发生影响。

2. 彼此相关性:体系性危险与体系中各个组成部分彼此相关,其间一个部分的危险或许会传达、扩展或影响其他部分。非体系性危险一般是单个要素或工作的成果,并不触及体系的彼此依靠联系。

3. 杂乱性和不确定性:体系性危险往往愈加杂乱和不确定,由于它们触及到多个变量、要素和彼此效果。非体系性危险或许愈加可控和可猜测,由于它们一般触及特定工作或条件。

4. 长时刻影响:体系性危险或许具有长时刻影响,并或许导致继续的连锁反应和不良后果。非体系性危险一般具有较短期的影响,并且其影响一般更简略限定和操控。

5. 处理办法:由于体系性危险的杂乱性和广泛影响,处理它们一般需求跨部分、跨组织或跨职业的协作和综合性办法。非体系性危险一般能够经过特定单个或组织的举动来处理。

体系性危险与非体系性危险在影响规划、彼此相关性、杂乱性和不确定性、长时刻影响以及处理办法等方面存在显着的差异。

2 技能上的体系性危险

类比经济上的体系性危险,关于一家企业的技能负责人来说,技能上的体系性危险也是一个需求重点重视的点。

2.1 界说

在技能上,体系性危险指的是一个技能体系或许一个技能生态体系中,某个要害组件或许某些要害组件呈现毛病、缝隙、安全问题等,导致整单个系或许生态体系无法正常运转,进而引发连锁反应和影响。

例如,在云计算生态体系中,某个云服务供给商的毛病或许会影响到众多企业和用户的事务运营;在物联网范畴,某个智能设备的缝隙或许会导致整个物联网网络遭受进犯和瘫痪。因而,在技能范畴中,辨认和防范体系性危险也是非常重要的。

2.2 体系性危险和非体系性危险的不同

和经济上的体系性危险一样,技能上的体系性危险和非体系性危险也有 5 个不同点:

1. 影响规划和规划:体系性危险一般具有广泛的影响规划和规划,触及整个技能体系或架构。它或许触及多个组件、子体系或要害基础设施,乃至或许跨过多个应用程序或服务。非体系性危险更倾向于部分规划,一般仅影响特定的组件、功用或子体系。

2. 彼此相关和依靠:体系性危险触及到技能体系中各个组件和环节之间的彼此相关和依靠联系。它们或许由于一个组件或环节的毛病或问题而影响其他组件或环节的正常运转。非体系性危险更倾向于独立存在,其影响相对较为限制,不会对其他组件或环节构成触及效应。

3. 杂乱性和不确定性:体系性危险一般愈加杂乱和不确定,由于它们触及到多个技能组件、体系交互、数据流和相关的外部要素。这使得体系性危险的评价、猜测和处理变得愈加困难。非体系性危险一般更简略辨识、评价和操控,由于其规划和影响相对较小。

4. 长时刻影响和连锁反应:体系性危险或许导致长时刻的影响和连锁反应,其间一个问题或许触发多个级联毛病或影响多个要害事务流程。非体系性危险的影响一般更为短期和限制,不会引起大规划的体系级问题。

5. 处理办法和杂乱度:由于体系性危险的杂乱性和广泛影响,处理它们一般需求跨部分、跨团队的协作,触及多个技能专长和范畴的常识。这或许需求综合性的技能改进、架构调整或体系重构。非体系性危险一般能够经过单个组件或功用的修正或改进来处理,其处理相对较为简略和部分化。

3 体系性危险的传达

在技能体系中,体系性危险经过多种办法传达,包括以下几种:

  • 级联传达:级联传达是指一个组件的毛病导致其他相关组件的毛病,然后在整单个系中构成一种连锁反应。这种传达办法或许导致整单个系的瘫痪,影响事务的正常运转。例如,在一个分布式计算环境中,假如某个要害任务执行节点发生毛病,或许导致其他依靠于该节点的任务无法正常执行,然后引发其他节点的过载或毛病。这种危险传达会在整个分布式体系内构成级联效应,或许导致整单个系瘫痪。

  • 感染传达:感染传达是指一单个系的危险经过某种途径传达给其他体系,然后导致多单个系遭到相同类型危险的影响。例如,WannaCry 勒索病毒,它经过网络传达,使用 Windows 体系的一个缝隙进行进犯。当某单个系被感染后,病毒会自动查找其他具有相同缝隙的体系,并测验感染它们。这种危险传达办法导致了全球规划内很多体系遭到勒索病毒的影响。

  • 一起露出:一起露出是指多单个系由于共享相同的危险要素,而同时遭到该危险要素的影响。例如,多个在线服务都依靠于一个第三方身份验证服务。假如这个第三方身份验证服务呈现毛病或许安全缝隙,那么一切依靠它的在线服务都将面对安全危险或许无法正常运转,由于它们一起露出在同一个危险要素下。

  • 扩大效应:扩大效应是指一个较小的初始危险经过屡次传达和叠加,终究导致整单个系面对较大的危险。例如,在社交网络中,一个虚假信息或许经过屡次转发和传达,构成恶性舆论,对整个社会发生较大的负面影响。

在技能体系中,了解这些传达办法和机制关于有用办理技能危险至关重要。

4 体系性危险的来历

体系性危险的由来能够追溯到技能体系的杂乱性和彼此依靠性。当一个技能体系由多个组件、流程和环节组成时,它们之间存在着彼此依靠和彼此效果。这种彼此依靠性使得一个组件或环节的毛病或问题或许会影响整单个系的运转和安稳性。

以下是一些常见的体系性危险的来历:

  • 杂乱性和交互效果:技能体系的杂乱性和各组件之间的交互效果或许导致体系性危险的呈现。当体系变得越来越杂乱,组件之间的彼此依靠性添加,或许呈现不行预见的问题和毛病。例如,一个庞大的分布式体系或许由多个模块和子体系组成,彼此之间的彼此效果或许导致体系规划的毛病,如功能下降或数据不共同。

  • 外部环境要素:外部环境要素也是技能体系性危险的重要来历。例如,技能体系或许遭到恶劣气候、自然灾害(如山洪地震等导致光纤断了)、供应链中止或歹意进犯等外部要素的影响。这些要素或许导致体系中止、数据丢掉、安全缝隙露出等问题。例如,一家电子商务渠道或许遭到网络进犯,导致用户信息走漏或交易中止。

  • 人为过错和忽略:技能体系性危险也或许源自人为过错和忽略。人员的操作失误、编码过错、装备过错或安全意识单薄等问题都或许导致体系毛病或数据走漏。例如,一个开发人员或许在代码中引进缝隙,导致体系简略遭到进犯。

  • 技能演进和更新:技能的演进和体系的更新也或许引进体系性危险。当引进新的技能、结构或库时,或许存在兼容性问题或不知道的缺陷。例如,将体系从一个版别升级到另一个版别时,或许呈现功用不兼容、新增的安全缝隙或数据不共同的问题等。

  • 依靠供货商和第三方:技能体系一般会依靠外部供货商或第三方服务。这种依靠性或许带来危险。例如,假如一个要害供货商无法按时供给所需的硬件设备,或许导致项目延期或无法正常运作。别的,假如一个 CDN 第三方服务供给商的服务呈现毛病,或许会影响到技能体系的正常运转。

以上是一些常见的技能体系性危险的来历示例。在技能办理中,了解和辨认这些来历是非常重要的,以便采纳相应的办法来减轻和办理体系性危险的影响。

5 办理好体系性危险的含义

聊了这么多术语类的东西,看一下关于一个技能办理者来说,办理好体系性危险到底有什么用,有什么收益。这儿咱们从技能办理和技能团队,以及事务的视点来看。

5.1 技能办理上的含义

从技能办理和技能团队的视点来看,办理好技能上的体系性危险具有以下含义:

1. 保障体系的安稳性和牢靠性:体系性危险办理能够帮助保证技能体系的安稳性和牢靠性,削减体系毛病和服务中止的或许性。这有助于下降事务中止的危险,进步技能体系的可用性和继续性,保障事务的正常运转。

2. 进步技能出资的报答率:有用办理体系性危险能够下降技能出资的危险并进步报答率。经过躲避潜在的体系性危险,能够削减因体系毛病或不安稳性而构成的额外成本和资源糟蹋,进步技能出资的效益和出资报答。

3. 增强技能办理者决议方案能力:体系性危险办理使技能办理者能够更全面地了解和评价技能体系的危险情况。这有助于他们做出明智的决议方案,挑选合适的办法来下降危险,并确定优先级,以使资源和精力能够最大程度地应对最重要的危险。

4. 进步团队功率:经过办理体系性危险,技能办理者能够削减体系毛病和问题的发生,然后削减紧急修正和事后处理的工作量。这使团队能够愈加专心于战略性的工作,进步工作功率和生产力。

5. 添加事务可信度:有用办理体系性危险能够进步技能体系的牢靠性和安稳性,添加事务的可信度。这有助于进步内部和外部利益相关者对技能部分的信赖,加强与其他部分的协作和协调,为企业的可继续开展和生长奠定基础。

6. 促进技能创新和开展:办理好体系性危险有助于为技能办理者供给安稳的技能基础,支撑技能创新和开展。他们能够更好地专心于推进新技能的应用、优化现有技能架构和流程,为事务添加供给技能支撑和竞赛优势。

5.2 事务价值上的含义

从事务价值的视点来看,办理好技能上的体系性危险具有以下含义:

1. 进步功率和生产力:经过办理体系性危险,技能体系能够愈加安稳和牢靠地运转,削减体系毛病和问题的发生,然后削减由于体系问题导致的客诉、修正、交流等成本。这有助于进步事务的功率和生产力,节省时刻和资源,并下降运营成本。

2. 支撑事务添加和扩展:有用的体系性危险办理能够为事务供给牢靠的技能基础,支撑事务的添加和扩展。经过下降体系毛病和数据走漏的危险,技能办理者能够为事务供给安稳的渠道,支撑事务的创新、商场拓展和新产品的推出。

3. 支撑事务创新和竞赛优势:体系性危险办理为技能团队供给安稳的技能基础,支撑事务的创新和开展。经过下降体系性危险,技能团队能够更好地专心于事务创新、新产品开发和商场敏捷性,然后取得竞赛优势。

4. 提高用户体会和满意度:体系性危险办理有助于供给安稳、安全和高功能的技能体系,提高用户体会和满意度。用户倾向于挑选那些能够供给安稳服务、快速呼应和数据安全的产品或服务,有用的体系性危险办理能够增强用户对技能产品或服务的信赖和满意度。

5. 下降丢掉和危险:有用的体系性危险办理有助于下降事务面对的潜在丢掉和危险。经过辨认和办理体系中的危险,能够削减数据走漏、安全缝隙和技能毛病所带来的丢掉,并下降法令诉讼和名誉危害的危险。

6. 提高客户信赖和忠诚度:经过办理体系性危险,技能办理者能够树立客户信赖和忠诚度。安稳、安全和牢靠的技能体系能够增强客户对企业的信心,进步客户满意度和保持客户的长时刻协作联系。

能够看到假如能办理好体系性的危险,关于技能组织,关于技能办理者,关于事务和事务价值来说,都是一件非常好的工作。从生产功率的提高,到事务安稳性,到对成本的削减以及客户成功都是极好的。

那么怎么办理体系性危险呢?

6 怎么办理体系性危险

6.1 危险模型

危险模型是危险办理的第一步:了解体系中已有的危险,辨认、标记并对已知的危险排列优先级,终究构成一张包含了体系一切已知危险的当时状况的表格。这便是咱们所说的危险模型。

树立危险模型的进程是辨认危险的进程,在这个进程中咱们需求辨认出体系中已有的危险,并对其进行剖析,标记出优先级、梳理当时状况和历史情况。

危险模型构建进程中需求考虑模型的效果规划,是公司级的,团队级的,项目组的,仍是服务级的。

关于一个小公司,能够是公司级的,关于大型一些的公司,能够考虑团队或项目级的。

危险模型至少包括以下一些方面:

  • 严重性/或许性:高中低,先评价严重性,再评价或许性
  • 危险平缓方案:能够使用的或许正在使用的用来下降该危险严重性或许或许性的危险平缓办法。
  • 监控:对该危险的发生是否进行了监控,假如监控了阐明监控的指标,假如没有监控,阐明原因,以及到达监控目标的原因,终究一切的危险应该是要监控起来的。
  • 状况:活跃 / 已平缓 / 正在修正 / 已处理
  • 历史危险情况:该危险在历史上有没有发生过,什么时分,发生频率等
  • 危险平缓方案:当咱们制定危险平缓方案的时分,需求从严重性最高的项开端,平缓危险不是为了消除,而是为了下降危险的严重性和或许性。并不是每一个危险都要制订危险平缓方案。
  • 危险预案:当危险发生的时分,咱们能够采纳的办法

除此之外,还包括一些常规的添加时刻,ID,负责人之类的

6.2 辨认和评价体系性危险

辨认体系性危险是一个要害的进程,它需求深入剖析和了解组织或项目所面对的技能环境和相关要素。以下是一些常见的技能上的体系性危险示例:

  • 依靠单点毛病:体系中存在要害组件、设备或服务的单点毛病,一旦呈现毛病,将导致整单个系或事务的中止。例如,网络设备的毛病、云服务供给商的服务中止等。

  • 服务间的强弱依靠:假如体系中的服务之间存在强依靠联系,一旦其间一个服务发生毛病或不行用,或许会导致整单个系的毛病或功能下降。

  • 内部和外部/离线和在线事务的彼此影响:体系中的离线和在线事务之间存在彼此依靠联系,假如其间一个事务呈现问题,或许会影响其他事务的正常运转。

  • 安全缝隙和数据走漏:体系存在安全缝隙或不妥的安全办法,或许导致黑客进犯、数据走漏或信息安全问题。这或许对组织的名誉、客户信赖和合规性发生严重影响。

  • 技能过期和不行保护:体系选用的技能或架构已过期,不再受支撑或难以保护。这或许导致体系难以升级、演进和修正缝隙,添加体系毛病和危险的概率。

  • 第三方供货商问题:体系依靠于第三方供货商供给的技能、服务或组件,但供货商呈现问题,无法供给所需的支撑、保护或升级。这或许导致体系中止、服务质量下降或事务受阻。

  • 文档或流程的问题,如没有文档,没有沉积,只在某些人的脑袋里面:假如体系或流程存在缺少文档、常识沉积或依靠于单个人员的情况,或许会构成常识孤立和团队协作的问题,影响体系的可保护性和可扩展性。

  • 数据完好性和共同性问题:数据在体系内部或与其他体系之间的传输和处理进程中,或许遭受损坏、丢掉或篡改,导致数据完好性和共同性问题。这或许对决议方案和事务流程发生负面影响。

  • 大规划体系毛病:体系由多个组件、服务或子体系组成,假如其间一个组件呈现毛病,或许导致整单个系的大规划毛病。例如,云服务供给商的毛病、硬件毛病等。

  • 法规和合规危险:体系必须契合特定的法规要求和合规规范,假如体系无法满意这些要求,将面对法令危险、罚款或事务停摆的危险。

  • 服务容量的不足:体系中的某些服务容量或许不足以应对高负载或峰值流量,这或许导致功能下降、呼应时刻延迟或体系溃散。

  • 基建发布或扩容等发布操作会影响事务的情况:体系基础设施的发布操作,如服务器扩容、网络装备改变等,或许会对事务发生影响,例如服务中止或功能下降。

  • 线上装备/环境/网络等的改变:对线上体系的装备、环境或网络进行改变时,或许会引进危险,如装备过错、网络中止等,导致体系毛病或不安稳。

  • 安全问题:体系面对的安全缝隙、进犯危险或数据走漏等问题或许对事务运转和用户数据安全发生严重影响。

要辨认体系性危险,能够采纳以下办法:

  • 检查历史数据和经验教训,了解以前的体系毛病和问题。
  • 进行危险评价和危险工作坊,与团队一起辨认潜在的体系性危险。
  • 与各个部分和团队协作,收集反馈和洞察,了解体系的弱点和要害危险点。
  • 借鉴职业规范和最佳实践,了解常见的体系性危险和应对办法。
  • 定时进行体系评价和安全检查,以发现潜在的体系性危险。
  • 经过辨认体系性危险,组织能够有针对性地采纳办法来下降危险,并保证体系的安稳性、安全性和牢靠性。

6.3 危险办理

危险办理不是一个一蹴而就的工作,需求继续的来做,需求从组织,流程机制,体系东西和文化层面进行办理。

  • 组织层面:一个工作或方案想要比较好的落地,一定是有一个完好的组织来承接,至少需求有 PACE 的逻辑来支撑,清晰分工。
  • 流程层面:流程层面至少要树立清晰的交流机制,如周报、例会等,同时还需求建议危险操控流程,清晰制定危险辨认、评价、操控和监测的规范流程,保证危险办理工作的有序进行。
  • 体系东西:抱负中是希望有树立统一的危险办理信息体系,用于收集、整理和剖析危险相关信息。乃至能够使用数据剖析和人工智能,对潜在危险进行猜测和预警,进步危险应对的时效性。简化版能够经过群、Jira 体系等项目办理东西来到达前期的体系东西落地的程度。
  • 文化层面:经过宣导、洞察、重视、固化、奖励等办法引导咱们关于危险的重视,将危险意识融入日常工作中,进步咱们对危险的认知,强化危险意识。

以上的组织、流程、体系东西和文化层面的办理都是为了更好的办理危险而存在。在这个进程中,危险模型是抓手,经过不断的辨认危险,消除危险,平缓危险,不断进步体系变好的或许,以终究到达办理体系性危险的目标。

危险评价和应对规划是一个重复重复的进程,不断的迭代危险模型,辨认出新的危险。

当危险模型构建完成后,咱们需求定时逐个危险拉出来 review 一次,咱们能够问咱们自己如下的一些问题:

  • 与前次回忆比较,危险有更严重吗?或许性有更高吗?
  • 接下来会排专人来处理某些危险吗?是否应该组织?
  • 前次回忆组织的事项执行了,对应的危险情况怎么,是否有更新到危险模型中?

问完问题,咱们或许需求有一些实际的举动:

  • 评价是否有新的危险;
  • 删去旧的危险:假如危险已经处理了,能够归档;
  • 评价原有危险模型中的每一项危险,评价其严重性和或许性,假如有变动,对其进行更新;
  • 关于不同的优先级的危险差异对待。

以上的回忆操作咱们在上面建设的某个办理体系来承载,并且这个办理体系是带有告诉等功用,以更好的将危险相关的信息周知出去,如 Jira 体系。

7 小结

体系性危险是一个动态的概念,继续重复的监测和评价至关重要。定时检查体系的运转情况、缝隙和潜在危险,保证及时发现和处理问题,以削减体系性危险。