数据脱敏平台-大数据时代的隐私保护利器

简介: 什么是数据脱敏 又称数据漂白、数据去隐私化或数据变形。是对核心业务数据中敏感的信息,进行变形、转换、混淆,使得对业务数据中的身份、组织等隐私敏感信息进行去除或掩盖,以保护数据能被合理、安全地利用。
什么是数据脱敏

又称数据漂白、数据去隐私化或数据变形。是对核心业务数据中敏感的信息,进行变形、转换、混淆,使得对业务数据中的身份、组织等隐私敏感信息进行去除或掩盖,以保护数据能被合理、安全地利用。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=


  


数据脱敏的重要性

1)敏感数据泄露风险与日俱增

敏感数据泄露是全球最普遍存在的安全事件,核心业务系统的数据投放到开发、测试、培训及共享等二级数据应用环境,大数据应用开发环境存在许多数据资源,软件开发与运维厂商众多,数据安全管理意识淡薄,在数据趋利的时代,极易引发敏感数据从非生产环境泄露的风险,带来不可估量损失。


2)遵从安全合规性要求需要

国家总局总行级别机构出台各类监管条例,对数据安全合规性提出要求。如《信息安全等级保护管理办法》、《网络安全法》、《公共及商用服务信息系统个人信息保护指南》、金融业《商业银行信息科技风险管理指引》等对数据安全提出明确规范。《信息安全等保三级标准》指出“应用系统必须提供敏感标记设置功能”、“依据安全策略严格控制用户对有敏感标记重要信息资源的操作”。刑法对数据安全防护缺失的处罚指出“不采取安全技术措施导致严重数据安全事件,处1-3年有期徒刑,特别严重的判处3-7年有期徒刑”


3)数据泄露影响大

政务信息安全关系国家安全和机密、社会稳定。各领域数据资源具有资源多、广、全、散,涉密高,一旦泄露则侵犯隐私、社会影响大、公信力及声誉受损。


  


大数据时代的脱敏要求

随着大数据时代的来临,大数据、云计算、人工智能等新技术应用的不断深化,为数据的深度挖掘、分析提供强有力的支撑,大数据中蕴含的巨大价值被逐步挖掘出来。但是同时也带来隐私、敏感信息保护方面的棘手难题。如何在实现数据高效共享、分析挖掘的同时,保护敏感及隐私信息不被泄露对脱敏作业提出了更高的要求。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

1. 大数据处理能力

大数据的核心特性便是数据体量巨大,数据量从TB级别跃升到PB级别。传统脱敏工具无法完成如此海量数据的抽取、脱敏、投递作业。


2. 兼容大数据存储

传统脱敏工具多用于关系型数据库结构化数据的脱敏作业,对大数据平台(如阿里云MaxCompute、星环TDH等)不兼容,缺乏对大数据平台的数据脱敏能力。


3. 广泛的分发模式

数据的交换和共享越来越频繁,库到库的脱敏数据投递模式已不足以支撑日益多元化的数据分发场景,必须进一步扩展支撑库、文件、大数据平台三者间的任意分发模式。


4. 作业规范与监控

数据越集中,数据的安全管控就越重要,对数据的操作就越需慎重。数据分析利用日趋频繁,作业过程缺乏统一规范和监控易引发数据泄露和数据丢失等安全事故,必须采用必要的手段实现数据脱敏作业统一规范、过程可控。


  


华云慧通数据脱敏平台

针对业务系统和大数据平台,对其数据资源中的敏感信息进行脱敏保护,高效投递到开发、测试、培训、共享等二级数据服务环境,满足用户方IT建设的数据多样化需要,达到数据安全管控的要求。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=


平台核心技术特性

1)识别、脱敏、数据投递一体化

自动化识别敏感数据范围,提高脱敏目标精准性,广泛的兼容不同数据库类型,一对多的脱敏拓扑结构,自动化高效的实施脱敏,提高运维能力。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

 

2)敏感数据发现

结合关键字、语义特征,自动化地敏感数据发现,从而降低数据风险,提高安全效率。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=


3)支持大数据、关系库、文件源

广泛的兼容性,支持Oracle、Mysql等关系型数据库脱敏,也支持大数据平台例如阿里云ODPS库、星环TDH库的数据脱敏,支持文件源的数据脱敏,从而满足客户不同数据环境下的脱敏投递需求.


4)保持业务关联

在数据脱敏的同时,保持数据隐含业务规则的有效性,不破坏数据的业务规则。同时保持数据之间的一致性关联逻辑,确保脱敏后数据的可用性。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=


5)配置灵活资源沉淀

摒弃脚本配置的传统模式,实现脱敏作业图形配置、敏感识别策略可维护可扩展,脱敏算法可维护可扩展可在线测试,提高平台兼容性和扩展性。将任务配置信息、敏感识别策略、脱敏算法等元数据沉淀,支撑不同环境的脱敏配置,最大化复用。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=  

6)内置税务领域常见脱敏规则

可高效地完成不同省份税务领域数据脱敏的实施工作。


核心功能介绍

1)任务配置

支持图形化配置及轻量级脚本两种模式。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=


2)敏感数据发现

多种敏感识别策略实现敏感数据的主动扫描,支持自定义扫描任务、扫描任务管控及扫描结果人工核准等功能。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=


3)运维管理

可视化运维界面,支持运行状态查看、作业启停等状态控制、日志跟踪查看、调度管理等功能。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=


4)敏感识别策略管理

提供给脱敏作业人员进行敏感词维护、敏感识别策略维护及启停控制等功能,实现识别策略的可扩展。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=


5)脱敏算法管理

支持脱敏算法的启停控制、新增维护、在线测试功能及脱敏模板维护功能。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=


6)监控&分析

提供图表结合的监控仪表盘,对全局脱敏作业任务进行实时监控,不同维度监控运行状态。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=





文章转自:华云慧通


更多交流咨询欢迎加入“MaxCompute开发者社区”钉钉群,群号: 11782920,或扫描二维码入群。

https://www.aliyun.com/product/odps
image

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
29天前
|
存储 大数据 API
大数据隐私保护策略:加密、脱敏与访问控制实践
【4月更文挑战第9天】本文探讨了大数据隐私保护的三大策略:数据加密、数据脱敏和访问控制。数据加密通过加密技术保护静态和传输中的数据,密钥管理确保密钥安全;数据脱敏通过替换、遮蔽和泛化方法降低敏感信息的敏感度;访问控制则通过用户身份验证和权限设置限制数据访问。示例代码展示了数据库、文件系统和API访问控制的实施方式,强调了在实际应用中需结合业务场景和平台特性定制部署。
51 0
|
算法 大数据 数据挖掘
大数据隐私保护(四)|学习笔记
快速学习大数据隐私保护(四)
185 0
大数据隐私保护(四)|学习笔记
|
算法 大数据 数据挖掘
大数据隐私保护(三)|学习笔记
快速学习大数据隐私保护(三)
91 0
大数据隐私保护(三)|学习笔记
|
大数据 数据安全/隐私保护 开发者
大数据隐私保护(二)|学习笔记
快速学习大数据隐私保护(二)
111 0
大数据隐私保护(二)|学习笔记
|
大数据 数据库
《位置大数据隐私管理》—— 第2章 典型攻击模型和隐私保护模型 2.1 位置连接攻击
本章将对典型攻击模型和相应的隐私保护模型进行说明。攻击模型包括位置连接攻击、位置同质性攻击、查询同质性攻击、位置依赖攻击和连续查询攻击模型。隐私保护模型包括位置k-匿名模型、位置l-差异性模型、查询p-敏感模型和m-不变性模型。
1839 0
|
大数据 定位技术 数据库
《位置大数据隐私管理》—— 1.5 典型的位置隐私保护技术
传统的LBS隐私保护技术可以归纳为3类:基于数据失真的位置隐私保护方法、基于抑制发布的位置隐私保护方法以及基于数据加密的位置隐私保护方法。不同的位置隐私保护技术基于不同的隐私保护需求以及实现原理,在实际应用中各有优缺点。
4148 0
|
大数据 定位技术
《位置大数据隐私管理》—— 第1章 位置信息与隐私保护 1.1 位置大数据
移动通信和传感设备等位置感知技术的发展将人和事物的地理位置数据化。移动对象的传感芯片以直接或间接的方式收集移动对象的位置数据,其自动采集位置信息的速度和规模远远超过现有系统的处理能力。据统计,每个移动对象平均15 s提交一次当前位置,这样算来,全球上亿手机、车载导航设备等移动对象每秒提交的位置信息将超过一亿条[3]。
2294 0

热门文章

最新文章