首页 > 数读 > 正文

专访芳禾数据CTO李明:安全合规之于数据要素市场,就像行车时的安全带

2023-04-12 20:40:07 21世纪经济报道 21财经APP 尤为

21世纪经济报道记者尤为广州报道

数据已成为一种全新的生产要素,于国家和企业而言都将是新的经济增长点。而目前,数据要素市场还处于初期发展阶段,企业如何抓住机遇在未来市场中占有一席之地、激发数据要素市场面临哪些困境……围绕这些问题,广州芳禾数据有限公司CTO、信息安全博士李明接受了21世纪经济报道记者的专访。

“合规之于数据要素市场,就像行车时的安全带。”李明在专访中多次谈到“安全”与“合规”。他认为这是当下数据要素市场最受关注的两个问题,也是数据产品在数据交易所上架时的重要步骤。

他还表示,数据能否被安全合规利用是数据要素市场快速发展的关键。为此,芳禾数据在国家杰出青年科学基金获得者、国务院学位委员会网络空间安全学科评议组成员、暨南大学副校长翁健教授团队的指导下,联合研发了数据安全与隐私计算平台,目前已通过中国信通院、中国金融认证中心CFCA等第三方权威测评,助力政府、企业等客户解决数据流通过程中的安全和隐私保护问题,释放数据要素价值,产生了良好的经济和社会效益。芳禾数据通过精进对数据应用场景的理解,以“技术+应用”双轮驱动,一定能走得更长远!

广州芳禾数据有限公司CTO、信息安全博士李明受访者供图

成立国家数据局,数据要素的管理链路、发展链路将更加清晰

《21世纪》:最近中央刚刚宣布成立了专门负责数据要素市场相关工作的数据局,请谈谈成立国家数据局对数据要素市场的影响?

李明:国家数据局对整个数据要素市场的发展意义深远。

国家在将数据定位为一种关键生产要素后,制定了许多顶层政策,包括“数据二十条”等,明确提出要加快推进数据要素行业、促进数据要素市场化配置,但这更多是指导性的思想,更多可实施性流程还没完全明确。此前没有全面统筹数据要素这样的一个国家级部门,每个省都有自己的数据管理局,比如广东省政务数据服务管理局、海南省大数据管理局等,这些部门往上汇报的对象包括发改委、网信办等等。现在有了国家数据局,大家都能够清晰地知道哪个部门进行统筹,哪些单位负责实施,地方的数据要素部门也有了最重要的对接对象。这也意味着,数据要素的管理链路和发展链路将越来越清晰。这个意义是非常深远的。

《21世纪》:你觉得数据要素市场的前景如何? 

李明:非常好。最近很火的ChatGPT,就是一个数据要素原料支撑起来的大语言模型。未来会有更多类似在不同领域的大模型,都需要更多、更好的数据,而数据要素市场则是专门提供数据原料的场所,所以数据要素市场的想象空间足够大,这也是芳禾数据不断在数据要素行业增加核心研发投入的原因。

我们可以想象,随着未来对数据的依赖程度越来越高,数据会成为每个人身上非常重要的资源。就像我们满足了衣食住行物资需求后,会开始有更高层次的精神需求。对数据的需求是一样的道理,但数据要素本身又不一样。比如和土地要素相比,土地不能搬走,土地上建楼后也难以重复再建,使得土地要素的管理机制是清晰的,管理成本也没那么高。而数据要素就不一样了,它可以被无限复制、传播和扩展。这就导致数据要素面临更大的挑战,也意味着需要投入更多的人力、更多的资源,才能发展好数据要素市场。

《21世纪》:如何激发数据要素市场的活力?

李明:按照国家的政策,鼓励场内外相结合的数据交易,培育壮大场内交易,而目前只有很少部分交易是在数据交易所完成的,有大量的数据交易还处在灰色地带。激发数据要素市场的活力,就需要将“灰色地带”的数据交易逐步引导到“场内外合规地带”,数据商参与的积极性也会越来越高。数据要素市场的盘活需要我们多方都处于一种良性循环,而非一厢情愿。

《21世纪》:现在在数据交易所上架数据产品,最重要的步骤是什么? 

李明:目前,交易所上架数据产品,每个省都有各自的一套流程。以广东省为例,数据产品入场交易前需要经过最重要的一个步骤,就是合规审核。广东率先成立了全国首个数据合规委员会,负责数据产品的合规会审。委员会的委员包括来自法律、技术、财务等不同领域的专家。审查项包括登记主体是否涉及违法违规、企业背景、数据授权链路是否清晰、数据使用范围是否明确等等。只有经过合规委员会的评审之后,数据产品才能上架广州数据交易所。为了确保数据资产登记的合规性,登记主体要做好数据产品的内部安全机制建设、服务流通建设以及管理制度建设,这也在促进企业在规范其数据产品运营方面更加合理有效。

现在数据要素行业最需要关注的是合规

《21世纪》:你认为目前在数据要素市场发展的过程中哪些问题是需要重点关注?

李明:现在数据要素行业最需要关注的是安全合规。安全合规对于数据要素市场的重要性,就像行车时的安全带。我们都知道安全带是每位车主的生命带,安全合规对于数据要素行业也是同样的道理。我们都很希望数据要素能够作为国家的重要支柱型产业,推动国家数字经济的高质量发展,像踩油门一样直往前冲,但显然不能没有安全合规作为数据要素行业的“安全带”。

《21世纪》:能否谈一谈对数据合规的理解?

李明:“数据二十条”提出“三权分置”的数据产权制度框架,分为持有权、加工使用权和产品运营权。数据合规也是围绕这三个方面来实施,包括采集持有要合规、存储过程要合规、加工使用要合规、产品运营要合规、安全保障体系要规范,这些都是数据产品运营的基本要求。

举例来讲,有些用户的个人数据被应用服务提供商进行商业化使用,但用户个人是没有得到收益的,这是因为整个确权和加工使用的权益政策还有待完善。未来可能的模式是,我们大量的个人数据,都可以有偿地提供出去,但在主体使用这些数据的时候,会有健全的技术和政策机制来确保服务提供商在使用我们个人数据的时候,明确场景、明确权益分配、明确边界范围等等,做到一事一授权或者是前置预授权。

《21世纪》:芳禾数据在数据要素市场中的角色定位是什么?

李明:按照国家在“数据二十条”中关于数据要素行业的定义,芳禾数据属于数据商的身份。数据商也分方向领域,有专门提供数据,就像数据矿主一样;有专门提供数据技术服务,具有专业的数据加工处理能力,比如利用隐私计算技术对数据进行加工处理,芳禾就属于这类型的数据商。

实际上,公司的重要使命是帮助客户搭建安全合规的多源数据服务通道,完成数据治理、数据标准、数据质量校验等步骤,把高价值的数据产品呈现给客户,解决供应端和需求端之间的衔接问题,满足客户提质增效的目的。

《21世纪》:芳禾数据未来的长期发展方向和目标是什么?

李明:芳禾数据的定位是基于隐私计算的数据融合应用服务商。早在2014年,芳禾数据就为政府、行业提供了许多数据服务报告和系统平台,通过汇聚多源数据来提供数据分析决策服务,过程中我们积累了大量的数据服务经验。

当前,数据要素行业还处在初期阶段,基础机制还处于探索建设中。芳禾数据全力参与其中,就是想要成为数据要素行业的先行者。为此,我们会不断地深化技术服务能力,紧密贴近客户对数据应用的需求,通过提供底层基础技术和上层服务应用来为客户解决实际问题。

希望借着国家关于数据要素基础制度建设这股春风,能把公司持续积累的数据服务能力充分发挥出来,在未来数据要素市场占有一席之地。

数据不能被安全利用制约数据要素市场的发展

《21世纪》:制约数据要素市场发展的因素有哪些?

李明:第一个制约因素是企业将数据进行安全利用的能力程度。现阶段强调的安全不同于以往的网络安全。以前强调更多的是指防火墙、链路安全、加密存储等流通存储安全,现在更加强调数据融合利用中的安全,即大家常说的“原始数据不出域、数据可用不可见、可控可计量”。

工信部等十六部门在《关于促进数据安全产业发展的指导意见》中明确提出要加强基于隐私计算技术的数据流通应用。目前来看,隐私计算技术的应用程度是影响数据要素市场发展的关键。一是大部分的企业还没有投入足够的成本来支持隐私计算技术的应用,也就无法发挥其自身的数据要素价值。二是隐私计算技术本身也存在需要突破和解决的问题,目前需要根据业务和场景解决某些环节的数据利用问题来适配相应的解决方案。为此,芳禾数据先后承担了国家重点研发计划项目、国家自然科学基金重点项目等专门针对数据安全与隐私计算的重大国家级省部级项目,不断攻关和优化隐私计算底层技术,促进数据要素的共享共用。上个月,芳禾数据有幸获评了由OpenMPC和猎云网联合发布的“2022年度隐私计算最具潜力企业TOP10”,是广州本土唯一的一家上榜企业。我们相信公司在基于隐私计算技术这条道路上会越扎越深、越走越宽,支撑中国海量数据要素宝藏的价值释放。

第二个制约因素没有足够多的数据源,导致数据产品很少。其实每个企业都有大量的数据,但企业还缺少安全可对外提供数据产品的能力,同时市场上也缺少对数据进行加工处理的服务提供商。为了解决这个问题,芳禾数据提供多源数据接入、数据治理、数据融合建模、数据产品合规、数据资产化等数据能力,帮助更多的企业把数据加工成数据产品,让更多的数据在数据要素市场上流通。 

《21世纪》:如何把关和提高数据产品的质量?

李明:作为一家数据服务公司来说,芳禾数据是将数据质量定义为公司的生命线。因此在数据质量方面,我们有一套基于自研平台搭建的数据质量管理流程。

首先,是前期对接数据源进行有效的筛选,建立分类评级制度。芳禾数据会校验每家数据源的数据质量。一般情况下,由于数据源不愿意配合校验数据。因为校验数据需要把数据提供出来,如果对方不采购数据了,不仅白白增加工作量,还面临数据泄露的风险。为此,芳禾数据还自主设计了一套数据源质量安全校验的流程和方法,并将这套流程申请了专利。

其次,考虑到一家数据源很难支撑一个指标的全局覆盖,芳禾数据不会出于成本考虑只使用一家数据源,而是考虑多源数据融合来提供服务。通过拉通多方数据源为客户的一个指标服务,让客户对数据的结果更信任。

最后,我们建立了数据标准化以及输出校验机制,会对提供出去的数据结果进行统一再处理。