数据要素市场的基石——隐私计算技术

发布时间:2021-02-03 11:05:29 | 来源:中国网 | 作者:李朋林 | 责任编辑:李媛

在数字化转型时代,数据已经变成了重要的增长点,获得维度更广、质量更优、层次更深的数据对于任何一个市场主体来说都变得十分重要。党的十九届四中全会首次将”数据”列为生产要素,五中全会审议通过的十四五规划和2035年远景目标的建议提出要推动数据资源的开发利用,加强个人信息保护。

而之前的2020年3月,中共中央、国务院发布《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》,首次提出将数据作为与土地、能源一样的生产要素进行有效应用。2020年底,国家发改委联合中央网信办、工信部、国家能源局发布《关于加快构建全国一体化大数据中心协同创新体系的指导意见》,特别强调加速数据流通与汇聚融合,将全国的各地大数据中心充分应用起来,数据流通共享、协同创新。数据要素市场已经成为了蕴含巨大宝藏的“新大陆”,等待着拥有合法合规技术与业务创新模式的“哥伦布”们来探索挖掘。

传统的信息化基础设施与手段大部分是聚焦于信息化方式方法,如数据库、操作系统、网络通信、云计算、大数据等等,都是为了更好的保障系统畅通运行与业务的稳定开展,数据只是原始素材或者附加产物。而当数据极大的提升了其重要地位之后,所预期的发展阶段目标里,对于数据使用遇到的诸多问题,如数据的要素化应用过程中如何确定数据归属权、如何保障数据隐私安全、如何确定数据使用权责、如何防止数据价值稀释等问题,传统的技术与手段对这些问题并没有很好的解决方法,因此要充分保障数据的安全应用、隐私保护,防止数据价值稀释,应用隐私计算的“可用不可见”特性就天然适配,实现数据要素的合理开发利用。

目前国内外的数据应用需求和生态,催生出了隐私计算的诸多创新技术应用,如多方安全计算、联邦学习、同态加密、差分隐私、TEE等隐私计算技术,并纷纷找到了应用场景将数据隐私计算“可用不可见”的理念大范围普及推广。

多方安全计算应对无可信任的参与方时优势明显,如拍卖、联合运算等场景;TEE技术已经应用多年,有较多的成功落地案例。但是再回到数据要素市场化的通用需求里时,发现以上这些技术在应用层面都有较好的实现,但是在纯数据底层时,针对数据本身的确权、使用权责、隐私保护、价值防稀释等问题时,都是在应用层面上解决问题,也就是在现阶段要根据客户业务的需求进行定制化操作,甚至无法解决数据使用的细粒度授权和使用权责问题,这对于建立通用化的数据要素市场化不是特别有利,因此需要更新的技术来解决以上问题。

同态加密素有隐私计算皇冠上的明珠之称,因为同态加密过后的数据支持与原有运算逻辑一样的数学运算过程,也可以理解为同态加密支持加密后密文的一系列数学运算。打个通俗的比喻,如果将数据比作黄金,同态加密就相当于带有橡胶手套的透明玻璃箱。我们可以将手伸进手套内来将黄金加工成任何形状(实现数据操作),但是不能拿走黄金。使用程度与现在的运算过程近乎于完全接近,因此天然适配于原有的数据业务之上。

传统的数据业务开展过程中,是极易发生“数据污染”的,即数据应用的所有参与方都会接触到原始数据,整个数据供应链中都存在数据泄露的风险,隐私安全和数据价值的保护变得十分困难。尽管在现行的技术体系中,应用了数据脱敏和区块链等技术进行数据保护,但是对于数据使用的环节却仍旧难以实现保护,特别是在数据运算、调度查询、机器学习、数据汇聚融合、数据多方协同应用时,依旧存在难点。此外,在数据使用的授权过程中,也存在着诸多难点,比如传统的数据协议模式下,无法保障给出的数据只会按照约定的方式和方法进行数据使用,存在约束难、监管难、审计难的问题。

同态加密计算作为隐私计算皇冠上明珠,也是隐私计算领域最强有力的工具,可以在最少的限制下实现数据的“可用不可见”。从数据共享流通与融合应用的角度上来讲,至少满足以下几点:1.降低隐私计算保护的实施成本,所应用的技术模式应该最小化的改变原有的业务流程和信息化基础设施;2.降低用户的认知门槛,数据的使用方式方法应尽量和原有运算使用方法保持一致;3.减少数据的暴露风险,保证最小化的数据留存或者完全的不留存,数据的全生命周期都是在密文状态下进行存储、流转、运算,参与方仅能拿到数据应用的结果,而无法拿到原始数据和中间数据;4.将数据使用的权责明确,有清晰的数据保护模式和追溯方法,在数据共享中实现数据即数据、平台即平台、服务即服务,在加密数据的使用操作上各司其职,职责明确;5.保障数据所有方主权利益,通过加密技术使得数据所有方可以控制数据的操作者、时间、次数、方式方法等一系列操作,并通过一次性密钥进行数据的使用(具体方式方法)授权;6.隐私计算技术安全有保障,坚持我国自主研发、自主可控,防止在关键领域的关键数据遭到破坏与泄露,实现充分的数据安全和隐私安全,对于国家、社会、公民绝对负责。

而基于同态加密隐私计算的技术也已经在多个领域进行了有效的应用尝试,在国内教育领域的人脸识别隐私保护中,应用同态加密技术对人脸的生物特征进行加密,后续的采集识别均是在加密数据上完成人脸的分析识别运算操作,杜绝了人脸数据泄露的风险,充分保障了公民生物特征的隐私安全;在金融领域,中国人民银行的金融创新监管试点中应用了同态加密技术来试点验证数据的流通融合,在全面保障数据合规与隐私安全的前提下,合理开放数据,加速数据的流通与融合,为金融机构的普惠金融提供有力数据支撑。此外在国内的多个关键领域也已经进行了同态加密计算的积极尝试并获得积极反响。

数据要素市场存在着巨大的市场空间,但也需要更加可靠、完善的技术对数据共享流通应用实施全面的保障,数据作为国家发展的重要基石,未来可能形成同态加密作为数据要素市场化的底层设施,解决数据在现有模式下的交换共享,并将通用化的隐私保护、数据细粒度授权、数据使用权责的保护解决方案以加密的形式在数据交换分发阶段提前置入到数据中,以多方安全计算、联邦学习、TEE等技术在此基础之上,针对各行业领域的不同应用需求进行层次更深、更复杂的业务操作。隐私计算技术未来也可能成为重要的数据基础设施,助力数据共享融合,为数据要素市场化配置保驾护航。(文|李朋林 上海同态信息科技有限责任公司CEO)