大数据安全治理的难点

您需要了解哪些资产需要被保护、资产存在的风险、企业/组织是否合规、如何处理内放攻防、如何落地安全运营等关键问题,才能有效落地数据安全治理。同时,大数据系统基于“存储、用户、入口、流转、交付”等多方面的特点,存在诸多安全治理难点。

数据安全治理的关键问题

数据安全治理能否清楚、准确地回答如下问题,将从侧面反映安全治理项目是否能有效地落地。image.png

哪些资产需要被保护?

您有哪些资产?这些资产分布在哪里、承载着什么样的业务?资产内有哪些数据?数据业务属性及重要程度如何?是否做了相应的分级分类?

说明

此处的资产不单单局限于结构化、非结构化数据资产,还包括硬件资产、IAAS/PAAS/SAAS、甚至人员资产,因为任意一个资产被攻破,都会导致企业关键信息被侵害。

这些资产存在哪些风险?

在真实的业务场景下,企业数据资产不可避免地会经历采集、传输、存储、处理、使用、交互、销毁阶段,在这些阶段中分别存在哪些风险?每个阶段的风险如何通过定性、定量(年化损失期望ALE/年化防护成本ACS)方法来评估?企业可通过什么手段来识别、预判风险的存在?

风险评估的意义在于让组织的各业务方明确手头资产的风险所在,有利于高层以此推动落地安全项目。通过风险评估后,组织还可以根据评估结果对不同风险采取差异化的应对策略:

  • 风险缓解(Risk Mitigation):部署安全防护,降低数据安全事件发生的概率。

  • 风险转移(Risk Assignment):考虑到防护成本过高,选择购买商业保险规避损失。

  • 风险接受(Risk Acceptance):数据价值低,防护投入大,不采取防护措施。

  • 风险拒绝(Risk Rejection):评估认为被攻击概率极低,不采取任何防护措施。

  • 风险威慑(Risk Deterrence):通过对攻击者传递威慑信息以驱赶攻击者。

  • 风险规避((Risk Avoidance):直接下线某个系统,避免被攻击。

组织是否合规?

组织/企业每年将会面对哪些监管机构进行审查?应遵循哪些法律法规或强制性标准?面对监管机构,企业应审查哪些内容以确保合规性?

内外攻防怎么做?

基于对资产分布/资产重要性、资产风险及应对策略的认知,企业应保护哪些资产?不同资产使用什么样的方式、工具、手段来进行保护?如何避免或快速发现内部人员的滥用行为?如何防范外部的各类攻击?

安全运营应如何落地?

企业应该如何建立可持续、平台化、体系化、可视化的全运营体系?应配置什么样的基线、安全策略、风险规则、响应手段,以便从全局视角把控企业整体安全状况?安全团队应如何向上级说明价值、申请资源?

说明

数据安全的持续运营至关重要,大多数企业通常会采用多次立项的方式进行问题治理,这种项目制的治理方式费时费力、推动困难,原因就是将数据安全治理当作一次性项目,结束后未沉淀可运转的规章制度、安全基线或风险规则,导致权限冗余、数据滥用等问题再次出现而未被制止。

大数据体系的特点与安全治理难点

由于大数据系统在“存储、用户、入口、流转、交付”等多方面的特点,想要回答好上述问题,存在诸多难点。image.png

存储

众所周知,大数据系统以数据类型多(结构化、非结构化、半结构化)、数据量大(动辄PB级别)著称,某些巨头组织一天就能新增数十万甚至数百万张表,如此体量给数据分级分类带来了极大挑战,通过人工进行数据分级分类显然是不现实的,难免会出现遗漏的情况。

用户

大数据系统的用户基数大,覆盖所有与数据相关的角色。使用大数据系统的常见人员包括开发、运营、分析师,甚至销售及HR都会来查询自己所需的数据。如此多类型的用户,授权、管理难度加大,什么样的人员需要授予什么样的权限?如果他们离职、换部门了怎么办?这其中很有可能出现权限蠕变、过度授权、离职撤权不彻底的情况,这些都为数据安全事件埋下了隐患。

入口

由于大数据系统要服务不同的角色,每种角色技术水平不同,因此需提供不同的入口给各类人员使用。例如,技术人员可以使用命令行,但数据分析师或运营就需要使用可视化界面或BI工具。

不同的入口其登录认证、鉴权逻辑、审计能力可能存在差异。最常见的莫过于多个用户使用同一个身份从某个入口访问/操作数据的场景,此类场景就是典型的传递信任风险。此外,由于各上层系统审计能力参差不齐,也可能出现审计事件缺失、审计报文缺失、无法审计到人的违规问题。

流转

大数据系统通常是端到端的一整套数据开发和治理服务,不仅要采集数据、加工数据,更要将数据提供给业务方使用。因此,其存在错综复杂的数据流转链路,包括但不限于即席查询链路、离线传输链路、实时传输链路、数据服务API链路、其他底层API/SDK流出通道。

这些链路都是数据机密性受损的直接渠道,数据流转安全策略定义不清楚或未定义、底层链路未禁用、API安全防护缺失、人员行为未做风控都会导致数据安全事件发生。例如,非法出境(出域)、脱库、泄露等。

交付

大数据系统负责每日产出用于业务决策的数据,产出数据是否准时、准确,可能直接影响高层的决策。若无法准时、准确地产出数据,则相当于损害了信息的完整性(Integrity)、可用性(Availability)

通常,大数据系统中的工作流涉及多部门、多责任人且跨系统的数据,如何才能协调好这些业务系统准时、保质保量地产出数据,避免出现因业务系统宕机/脏数据导致数据延时产出、产出脏数据,关乎到企业数据业务的连续性问题甚至高层的信任问题。image.png