为什么说全同态加密(FHE)是人工智能的下一个圣杯?
原文作者:Advait(Leo)Jayant
编译:LlamaC
“推荐寄语:全同态加密(FHE)常被誉为密码学的圣杯,本文探讨了FHE在人工智能领域的应用前景,指出了当前面临的局限性。并list了一些致力于在加密领域利用全同态加密(FHE)进行AI应用的项目,对于加密货币爱好者来说,可通过本文对全同态加密进行一次深入了解,enjoy!”
正文?
A希望在Netflix和Amazon上获得高度个性化的推荐。B不希望Netflix或Amazon了解他们的偏好。
在当今的数字时代,我们享受着亚马逊和Netflix等服务带来的个性化推荐便利,这些推荐精准地迎合了我们的趣味。然而,这些平台深入我们私人生活的行为正引发越来越多的不安。我们渴望在不牺牲隐私的前提下享受定制化服务。过去,这似乎是一个悖论:如何在不对基于云的人工智能系统分享大量个人数据的情况下实现个性化。全同态加密(FHE)提供了一个解决方案,使得我们能够兼得鱼与熊掌。
人工智能即服务(AIaaS)人工智能(AI)如今在应对包括计算机视觉、自然语言处理(NLP)和推荐系统在内的多个领域的复杂挑战中扮演着关键角色。然而,这些AI模型的发展给普通用户带来了重大挑战:
1.数据量:构建精确模型往往需要庞大的数据集,有时甚至会达到千万亿字节的规模。
2.计算能力:像转换器这样的复杂模型需要数十个GPU的强大算力,通常连续运行数周。
3.领域专长:这些模型的微调需要深厚的专业知识。
这些障碍使得大多数用户难以独立开发强大的机器学习模型。
实际应用中的AI即服务流水线进入AI即服务(AIaaS)时代,这一模式通过提供由科技巨头(包括FAANG成员)管理的云服务,让用户得以接触到最先进的神经网络模型,从而克服了上述障碍。用户只需将原始数据上传至这些平台,数据便会在平台上被处理,进而生成富有洞察力的推断结果。AIaaS有效地普及了高质量机器学习模型的使用权,将先进的AI工具开放给更广泛的群体。然而,遗憾的是,当今的AIaaS在带来这些便利的同时,却牺牲了我们的隐私。
人工智能即服务中的数据隐私目前,数据仅在从客户端传输到服务器的过程中进行加密。服务器能够访问输入数据以及基于这些数据所做的预测。在AI即服务过程中,服务器能够访问输入和输出数据。这种情况使得普通用户共享敏感信息(如医疗和财务数据)变得复杂。诸如GDPR和CCPA之类的法规加剧了这些担忧,因为它们要求用户在数据被共享之前明确同意,并保证用户有权了解其数据如何被使用。GDPR还进一步规定了传输过程中数据的加密和保护。这些法规设定了严格的标准,以确保用户的隐私和权利,倡导对个人信息有明确的透明度和控制。鉴于这些要求,我们必须在AI即服务(AIaaS)流程中开发强大的隐私机制,以维护信任和合规性。
FHE解决问题通过对a和b进行加密,我们可以确保输入数据保持私密性。全同态加密(FHE)为云计算中关联的数据隐私问题提供了解决方案。FHE方案支持密文加法和乘法等操作。其概念简单明了:两个加密值之和等于这两个值之和的加密结果,乘法亦然。
实际操作中,其工作原理如下:用户在本地对明文值?和?执行加法运算。随后,用户加密?和?,并将密文发送至云服务器。服务器能够在加密值上(同态地)执行加法运算并返回结果。从服务器解密得到的结果将与?和?的本地明文加法结果一致。这一过程既保障了数据隐私,又允许在云端进行计算。
基于全同态加密的深度神经网络(DNN)除了基本的加法和乘法运算外,在AI即服务流程中,利用全同态加密(FHE)进行神经网络处理的技术已取得显著进展。在此背景下,用户可以将原始输入数据加密成密文,并仅将这些加密数据传输至云服务器。服务器随后对这些密文进行同态计算,生成加密输出,并将其返回给用户。关键在于,只有用户持有私钥,使其能够解密并访问结果。这构建了一个端到端的FHE加密数据流,确保用户数据在整个过程中的隐私安全。
基于全同态加密的神经网络在AI即服务中为用户提供了显著的灵活性。一旦密文被发送到服务器,用户便可离线,因为客户端与服务器之间无需频繁通信。这一特性对物联网设备尤为有利,它们通常在限制条件下运行,频繁通信往往不切实际。
然而,值得注意的是全同态加密(FHE)的局限性。其计算开销巨大;FHE方案本质上耗时、复杂且资源密集。此外,FHE目前难以有效支持非线性操作,这对神经网络的实现构成了挑战。这一限制可能会影响基于FHE构建的神经网络的准确性,因为非线性操作对这类模型的性能至关重要。
K.-Y.Lam,X.Lu,L.Zhang,X.Wang,H.Wang,和S.Q.Goh所著的"基于高效全同态加密的隐私增强神经网络在AI即服务中的应用",在南洋理工大学(新加坡)和中国科学院(中国)发表。(Lam等人,2024年)描述了一种用于AI即服务的隐私增强神经网络协议。该协议首先通过使用误差学习(LWE)来定义输入层的参数。LWE是一种加密原语,用于通过加密来保护数据,使得无需先解密即可对加密数据进行计算。对于隐藏输出层,参数则通过环LWE(RLWE)和环GSW(RGSW)来定义,这两种高级加密技术扩展了LWE,以实现更高效的加密操作。
公共参数包括分解基?及???给定一个输入向量?长度为?,一组?LWE密文(??,??)为每个元素?[?]生成了使用LWE私钥?,关于?的评估密钥为索引生成?[?]>0及?[?]