同顿李晓林:为了解决时代的困境 知识将成为AI3.0的“第

虽然李晓林已经离开了领奖台,但他仍然在象牙塔中留下了一些痕迹。

此前是学术精英,佛罗里达大学终身教授;现在,他是同敦人工智能研究所的院长。平时和人说话,语言温和,但涉及到专业问题,马上进入学术氛围。

这种变化在谈论知识联盟的相关话题时尤为明显。

这是他的研究伙伴提出的理论体系,希望通过更安全的方式,利用好现有的数据,构建一个开放的智能大脑,最终推动人工智能3.0时代的到来。

打破数据孤岛

20世纪80年代,中国人工智能专家姚期智提出了“百万富翁”假说:两个百万富翁在街上相遇,他们想知道谁更富有,但出于隐私,他们不想让对方知道他们有多少财富。

姚期智提出“多方安全计算”来解决这个问题。如今,人工智能领域也面临着类似的困境。人工智能的发展进步离不开大数据。但是,人们更关注数据边界,不愿意离开本地数据。

在李晓林教授看来,这是一个在人工智能2.0时代必须解决的困境。他认为,我们现在正在经历的始于21世纪第二个十年初期的人工智能热潮,属于AI 2.0时代,依靠的是深度学习理论。

AI 2.0的快速发展主要取决于三个因素:算法、计算能力和大数据。深度学习提供算法,CPU和GPU提供计算能力,信息社会存储并提供足够的数据。

以李晓林为例,谷歌的AlphaGo之所以能实现快速进化,是因为它已经学习了现有的3000万种象棋游戏,并且自己又玩了3000万种游戏。

这种依赖海量数据训练的人工智能模型,在最初的野蛮开发后,面临着没有数据可用的困境。

本来主要来自两个方面。第一,数据不足。只有少数行业有海量数据,大多数领域往往数据有限或数据质量差。其次,“数据孤岛”和数据安全使得数据共享越来越困难。很难实现不同公司之间甚至同一公司内部的数据无障碍流动。

然而,数据导致的隐私暴露或数据泄露,使得加强数据安全和隐私保护成为各国政府的共同选择。

2018年5月25日,欧盟《通用数据保护条例》 (GDPR)生效,堪称世界上最严格的用户数据保护条款,允许用户对自己的数据拥有完全独立的权利。美国和中国正在制定类似的隐私和安全法。

这些现象都预示着AI 2.0时代似乎即将因为数据隔离和数据安全而陷入双重困境。这个问题在通盾科技所在的金融技术领域尤为重要。银行和其他金融机构渴望提高风险控制水平,但他们非常重视数据安全,甚至将其作为基础。

2019年春,李晓林在加入同盾科技后,成为人工智能研究所的合伙人和院长,试图通过“知识联盟”的技术解决这个问题。

在那年冬天的网易未来大会上,童盾首次提出了知识联盟的概念。它不是单一的技术方法,而是一套层次化的技术框架体系:将分散在不同机构或个人的数据进行统一,转化为有价值的知识,并在联合过程中采用安全协议保护数据隐私。

这一理论自提出以来发展迅速,已成长为中国五大联邦学术代表流派之一。

构建数字技术生态系统

2017年,为了保证数据交换过程中的信息安全和保护个人隐私,谷歌公司的科学家在一篇文章中首次提出了联邦学习的概念。理论提出后不久,国内互联网公司成立团队,投入相关研究。

李晓林说,硅谷的竞争速度更像一个古老的战场:如果你带着剑来,我就刺你,大家慢慢打。在中国,“这是基本的

据国内媒体统计,目前,联邦学习在国内已经形成了“五大流派”,即卫中银行主导的联邦学习、蚂蚁金服主导的共享智能、平安科技的联邦智能、京东科技开展的异步联邦学习研究、同盾科技推出的知识联邦理论体系。

要在多党竞争中占据一席之地,无疑需要有独特的优势。李晓林指出,知识联盟的范围比联邦学习的范围更大、更系统、更有层次。"联邦学习是知识联盟的一个子集."

知识联盟作为一套技术框架体系,与其他技术领域如联合学习、区块链、隐私计算、安全多方计算等密切相关。这些单一技术在不同层次的知识联盟中发挥各自的作用,共同服务于“数据可用性和不可见性”的大目标。

通盾发布的知识联盟白皮书表明,知识联盟有三大优势:第一,样本获取充分。联盟之后的机构间数据,虽然由自己的所有者控制,但可以达到更多的数据,其性能甚至超过了有限维度的数据集中聚合。

第二是数据不动。联邦后,原始数据保存在本地,计算和学习也在本地进行。中心节点只安全地收集参与者的模型知识。弱集权模式实现了效率与安全的平衡,特别适合监管力度强的行业应用。对于银行等金融机构来说,知识联盟的应用前景尤为广阔。

第三,知识可以安全共享和融合。例如,参与者通过NLP构建本地知识地图和各网络节点之间的关系,然后通过知识联盟构建更完整的虚拟地图,不仅可以帮助识别欺诈团伙,还可以改进企业征信的风险控制模型。人工知识也可以整合(人在回路中),自适应构建和整合多源知识,提取最有效的见解进行智能分析和决策。

李晓林说:“在知识联盟的模式下,每个银行和金融机构都不需要输出自己的数据,甚至模型的参数也不需要给对方,只需要对模型梯度的变化进行加密,然后在密文空间中安全聚合即可。这样,攻击者就无法反转源数据。”

基于知识联盟的理论体系,同盾科技推出了工业应用产品iBond平台(iBond),通过建立相应的任务联盟,可以满足不同应用场景的需求。

在2020年10月举行的全球人工智能大会智能金融峰会论坛上,同盾联合浙江大学、复旦大学、百度大数据实验室、360集团、平安科技等众多顶级机构,成立“知识联盟产学研联盟”,旨在数据安全的前提下,共同打造高品质的数字技术生态。

李晓林认为,根据目前人工智能的发展趋势,人工智能将在2040年左右进入3.0时代,除了数据、计算能力和算法三大要素外,知识要素将成为第四要素。

开放式智能大脑浮出水面

2020年11月,通盾人工智能研究所发布了知识联盟技术体系下的数据安全交换(FLEX)协议,并于12月开放。该协议包含一系列协议,只要遵守这些协议,参与者就可以安全加入联盟,无需担心数据隐私泄露的风险,充分实现数据的可用性和不可见性。

协议的背后是李晓林和铜盾对未来的雄心。在李晓林看来,未来肯定不会只有一个知识联盟的联盟平台。

行业需要一套完整的联邦数据安全交换标准,让每个参与者在选择使用联邦平台时都有可遵循的规则。只要遵循相应的标准,不同的系统也可以实现数据交换和知识交换。

一旦有足够多的参与机构(数据提供者)和足够大的联盟,数据多样性将

届时,知识联盟可以充分发挥平台作用,对参与机构提供的数据和科技机构提供的模型和应用进行评估,最大限度地发挥数据作为生产资料的价值。

李晓林称之为电子商务平台,在这个平台上,参与者可以在数据不可见的安全环境中交换数据和模型应用,甚至可以在区块链和其他技术的保证下自由交易。作为一个平台,知识联盟可以对参与者贡献的数据和模型进行评分。

建立良性循环。李晓林表示,知识联盟的应用范围将不再局限于某个行业,而是可能成为一个贯穿各行各业的开放式智能大脑。

20世纪90年代,当李晓林在浙江大学学习时,人工智能仍然是一个不受欢迎的专业。机器学习班只有五六个学生,图书馆里的资料大部分都是过时的油印本。现在的机器学习教室,500人的教室经常爆满,上课提出理论,下课可以马上做样本。自动驾驶的样机,一个学期的作业就可以做出来,行业应用也在不断创新。

这一切都让李晓林觉得,下一个人工智能时代可能会加速,在这个时代将不可避免地出现一个知识联盟。

免责声明:凡本站注明 “来源:XXX(非中国商业新闻网)”的新闻稿件和图片作品,系本站转载自其它媒体,转载目的在于信息传递,并不代表本站赞同其观点和对其真实性负责 。