首页 > 安全 > 正文
分享到:

「揽睿星舟」在数据安全下释放AI潜力 实现与数据源方的安全交互

时间:2022-10-19 11:03:51 来源:36氪 评论:0 点击:0
  我们一直在和AI进行“灰色”交易。

  在餐厅扫码点菜要先输入手机号,开通免密支付要进行人脸验证,骑共享单车要开启定位功能。我们的喜好、日常的行动轨迹,也都被AI“记录在案”。隐私数据泄露问题随之出现:大数据杀熟,购物软件阴阳价格,大规模个人信息泄露事件也时有发生。

  互联网隐私法专家余盛峰曾评论道:“利用去匿名化的技术,大数据可以把看似没有直接关系的信息定位到个人。你透露的微不足道的日常生活,将以你想象不到的方式被互联网利用。”

  2021年,《数据安全法》《个人信息保护法》先后实施,对数据安全和个人信息保护提出了前所未有的严格要求,如何在保护数据安全的同时,又充分发挥数据资产价值,将成为互联网企业和被AI赋能的传统企业需要优先考虑的问题。

  另一方面,根据今年1月6日国务院办公厅印发的《要素市场化配置综合改革试点总体方案》,未来我国将“建立健全数据流通交易规则”,同时探索“原始数据不出域、数据可用不可见”的交易范式,以确保数据安全为前提,“分级分类、分步有序推动部分领域数据流通应用”。

  数据安全,被认为是数据释放潜力的最后一道坎,也将成为未来AI发展的关键所在。而人类的商业发展史,也可以说是一部确权史,从私有制初期依赖的契约精神、再到今天的数据上链,如今,隐私安全计算技术正在将人工智能在各行各业的信任协作推向下一个高度。根据Gartner预测,到2025年,将有60%的大型组织会在分析、商业智能或云计算中使用一种或多种隐私增强的计算技术。

  10月10日,国内隐私计算四小龙之一的「翼方健数」举办了新产品发布会,正式发布基于隐私计算技术实现的AI服务平台「揽睿星舟」,并将其作为「翼方健数」数据与计算互联网(IoDC)战略中的重要一步,汇聚行业及公共数据集,集约算力部署,致力于解决AI供需市场中的安全信任问题,促进数据协作。

  中国信通院整理的《隐私计算发展综述》对隐私计算进行了解释:以多方安全计算(Secure Multi-Party Computation,MPC)、可信执行环境(Trusted Execution Environment,TEE)、联邦学习(Federated Learning,FL)等为代表的隐私计算技术为流通过程中数据的“可用不可见”提供了解决方案,有助于破解数据保护与利用之间的矛盾,已在金融、医疗、政务等领域开始推广应用。

  以医药行业为例,AI已经开始加速原本缓慢的药物研发进程。阿斯利康的小分子药物的新药研发中一半都与AI有关,核酸药物的发现过程也大量运用了AI技术。在AI辅助药物研发的过程中,数据就是药物发现的基石。基于机器学习算法的AI模型需要持续地通过迭代数据来优化模型表现,以提升计算速度和预测结果的精度。但另一方面,这些数据资源又极度敏感、代价高昂,往往分布在不同的制药公司、生物技术公司、科研院校和医疗机构之中,如何打通机构之间的数据壁垒,在保证数据安全的前提下训练模型,成为了制药公司的难题。

  新的产业机会下,服务商也随之崛起。如AI驱动下的药物发现和开发公司Deargen,是一家位于韩国的基因组数据分析服务商。作为模型提供方,Deargen需要与数据源方进行数据协作:数据源的诉求是原始数据对Deargen、AI服务平台均不可见,并要求最终的输出不能泄漏原始数据。而Deargen的诉求则是源代码不能泄漏给数据源方和平台,可以下载最终的输出,并且在本次数据协作完成后销毁数据。目前,Deargen正在与「揽睿星舟」合作,实现与数据源方的安全交互。

  “通过场景授权模式进行数据协作,我们无法获得或者看到数据源的明文数据,相应的,数据源方也看不到我们AI模型的代码,双方的资产都获得了很好的保护。”

  Deargen的业务发展负责人Andrew Ha先生表示,「揽睿星舟」帮助Deargen在控制自己数据的前提下,更好地满足了本土的合规需求。

  此外,作为AI服务平台,「揽睿星舟」的广场功能也在为不同类型的AI需求方和供应商实现招标对接、人才招聘等需求。「翼方健数」首席科学家张霖涛表示,目前平台上已经有多家传统企业匹配到了合适的AI供应商。

  据艾瑞咨询发布的《2022年中国隐私计算行业研究报告》,2021年中国隐私计算市场规模为4.9亿元,预计至2025年将达到145.1亿元。据前瞻经济学人统计,2020年我国隐私安全计算行业新成立企业数量为71家,同比增长33.96%。36氪曾报道,「翼方健数」在今年7月开源了其自研的「翼数联邦学习」及「翼数安全计算」,让开发者实现轻量级二次开发,帮助用户在不同应用场景实现数据使用的自由。而技术开源、上线AI服务平台,则都是为了能够将隐私计算从理论阶段逐步应用于各行各业的AI场景。

  对于数据需求方来讲,各数据源会管理各自的原始数据,建立一张分布式的数据网络。数据需求方基于这个数据源互联网,在原始数据不离开数据源掌控的前提下,在数据源授权下通过隐私计算结合应用计算的方法,实现更高效的数据价值挖掘。

  「翼方健数」CEO罗震博士介绍道,「揽睿星舟」在IoDC战略中承担了数据原生时代IT基础设施的可信AI计算节点的角色,同时也是一个专门为AI提供硬件、软件和生态服务的节点。

  “未来,所有的计算都将是隐私安全的计算。”

  我们即将迎来一个“原始数据不出域,数据可用不可见”的数据时代,这也同时意味着,在模型训练过程中通过简单汇集来处理数据的时代已经一去不复返,目前仍处于发展早期的隐私计算技术,有望成为未来的主流计算选择。