防止云端数据与查询行为泄露—可搜索加密

一、背景
在数据爆炸的当今社会,数据本地化已经不能满足用户业务需求,越来越多的数据需要被共享,因此越来越多的用户选择数据上云服务器。
然而,这会引入两个问题:一是云服务器大多都是第三方人员管理或者运维人员管理,二是大多数用户存储的数据总是以明文的方式出现。那么关于这部分未被加密的数据,云端的管理人员能够随意检查,更改,间接从服务器平台删除。一旦管理人员进行了这些恶意的操作,将导致一系列严重后果;如随意窥探用户的隐私信息,甚至恶意修改用户数据等,给用户带来了信息泄露和丢失的困扰。这意味着用户在云上上传的数据和信息越来越多,所带来的信息安全隐患就越来越大;如前段时间网络曝光的某公有云平台,私自窃取了用户的数据为己所用,投诉和协商无果后,已被告,一时也引起了不少的争议。另一方面,云平台可能会恶意的收集用户的行为习惯从中获取有用的分析数据,如分析某些平台的搜索数据,可以分析出一些商业价值的信息,这导致用户搜索的敏感信息泄露。
二、可搜索加密概述

为了解决上述提到的问题,用户所有的数据都可以密文的方式上传,这种存储方式降低了隐私泄露。但同时它也引入新的问题:比如,当云服务器有若干的密文数据时,他们怎么能找回本人的数据,而无需向终端输入任何有关该数据的明文内容。

可搜索加密技术就可以很好的应对这个问题。通过该技术,用户可先分别加密数据和数据标签,然后将加密后的数据与标签一同存储在云服务器上。当用户搜索包含字“KW”的文件时,他能够发送关于关键字的标签(也称为陷门的文件)到云服务器。云服务器将接纳到的关键词陷门与每一个加密文件的标签进行匹配。假如匹配成功,则该文件中包含的关键字。此时,服务器再将匹配的文件发送给用户,然后用户在本地进行解密即可。从安全性上说,云服务器除了有可能猜到任何两个搜索文件是否包含相同关键字的外,对其他信息不清楚。

总的来说,可搜索加密具有以下的安全性优势:

  • 可证明安全:即不可信服务器仅仅通过密文不能获得有关明文的任何信息;

  • 控制搜索:即不可信服务器不能在没有合法用户的认证下进行搜索;

  • 隐藏查询:即用户向服务器发起有关一个关键字的询问然而却不必向服务器表明关键字是什么;

  • 查询独立:即不可信服务器除了查询结果之外不能获得有关明文的任何信息。

三、一种可搜索加密算法的原理及实践

3.1算法核心部分描述

文献[1]提出的可搜索加密方案的关键算法称为PAEKS,其伪代码实现如下:

PAEKS算法是基于决定性双线性 (Decisional BilinearDiffie-Hellman, DBDH)假设和修正线性决策(modified Decision Linear,mDLIN)假设,同时使用了双线性对运算增强了其安全性。

现假设用户A有一个开源的公共资源数据,A把存放于云服务器中,但A为了防止云服务器擅自恶意的盗取数据,或者收集其他用户的查询数据来分析用户的行为习惯,因此A需要对数据进行加密处理。

现假设用户B(可以是一个用户,也可以是一个群组)需要从A的公共数据库中查询数据,为了防止第三方盗取任何有用的数据信息,所以他们之间可以使用可搜索加密技术。

首先密码系统给A、B颁发公私钥,私钥为A、B随机选择安全的大数,然后使用密码系统计算公钥,把公钥存放到公钥列表中,设A的公私钥对为(PKs,SKs),B的公私钥对为(PKr,SKr)。现A存放一个关键字为W的数据到云服务的,需要对关键字做如下计算:

然后存储C=(C1,C2)到关键列表,同时把数据加密存储。

当B想去A的数据库中查询时,为了防止被收集行为数据,所以B计算一个陷门

然后传输此陷门给云服务器。

云服务器拿到后,去依次验证云服务器存放的关键字密文,返回验证结果给B,验证流程如下:

等式满足时,则验证通过,证明此关键字密文就是B要查询的关键字。

3.2代码实现及演示

本案例模拟了2个用户,一个用户产生关键字信息,另一个用户使用关键字去匹配查询。匹配成功后,返回其明文信息。具体包括以下主要流程:

1.密钥系统初始化

2.两个用户分别产生公私钥对。公钥后续加入公钥列表,私钥由用户自行秘密的保存

3.用户1选择信息nsfocus进行关键字的封装同时加密原信息,产生过程中使用了数据发布者的私钥、数据查询用户的公钥、关键信息数据进行计算。(此过程在本地客户端发生,生成后的签名、密文数据通过网络发生到云端)

4.用户2使用关键字nsfocus进行查询信息时,首先使用数据发布者的公钥与自己的私钥生成陷门。(此过程在本地客服端发生,将生成的陷门发生给云端服务器去作数据匹配验证)

5.云平台使用密码文匹配检索,验证成功后返回密文数据给数据查询者,此过程中不知用户的任何信息,不知道用户查询的具体信息。

6.效果如下

3.3总结

可搜索加密技术的优势在前文已经提到过,它保障了用户的数据安全,而且在查询过程中是处于全密文状态,所以云服务器不知道用户的任何搜索行为,这抵抗了云服务器的监听用户隐私;同时,用户在发布数据时,生成的关键字信息时,是联合了数据接收者与数据本身产生的,所以有签名的功能在里面,这样也实现访问的权限控制,即数据不是任何人都可以查询的,抵抗了穷举攻击,即遍历数据集比对分析数据集的内容;此外,也防止了攻击者的恶意篡改数据,给用户返回诱导数据,如果被篡改后签名验证通不过,也不会被查询出。
但上述方案的不足也很明显,可以看到,每个文件提供给每个查询者时都需要单独生成一个关键字信息,这样就导致如果同一个文件要共享给一个群组时,就要生成若干关键字文件,这样不仅到处存储加大、难易管控,同时也大大的降低了验证的效率。那怎么解决这个问题呢?请听下回分解……

参考文献

[1] Huang Q,Li H.Anefficient public-key searchable encryption scheme secure against inside keywordguessing attacks[J]. Information Sciences, 2017, s 403–404:1-14.

内容编辑:1.牟黎明. 身份与数据安全部.
责任编辑:高深
(0)

相关推荐

  • SQL Server官方版

    SQL Server官方版是微软发布的新一代数据平台产品.SQL Server官方版不仅具有现有数据平台的强大能力,全面支持云技术与平台,还能够快速构建相应的解决方案实现私有云与公有云之间数据的扩展与 ...

  • 哪个网盘比较好? | 好用的网盘坚果云

    网盘就是一个位于云端的文件存储管理器,使用网盘的便利好处就不多提了,一个账号轻松搞定文件存储问题,而且不用担心云端数据安全性,基本上云端数据,不管公有云还是私有云,防攻击的保护措施都是很不错的,不过有 ...

  • 实时云渲染技术在数据加密领域的应用

    知识产权保护是一个很大的概念,包括各种数据.音视频.图片.模型等等.随着计算机和网络技术的发展, 未来社会各种数据资料将是企事业和国家重要的资产.如果不能很好地做到保护自己的数字资产,将是很大的隐患. ...

  • 为什么你的微信越来越大?

    使用微信的同学都知道,微信如果不清理的话,所占据的空间从1GB 逐步变成10GB .50GB甚至更大,如下图所示: 有同学就有疑问了,微信不是会定期清理图片.视频和文件吗? 超过一定的时间的图片.视频 ...

  • 多表数据汇总查询之4、同一查询条件多值处理

    [前期相关文章] 1.查询条件动态化入门 2.多查询条件动态化 3.与Excel数据有效性合体 本次实现效果: 小勤:对于按条件查询的问题,能不能再改善一下呢?比如现在的货品,有时候想一次查多个的,怎 ...

  • 多表数据汇总查询之6、字段间比较的查询条件

    『实现效果』 『实现方法』 小勤:怎么实现两个字段之间的比较的查询?比如销售量大于销售目标.或小于.或小于等于--最好是能选了哪种查哪种的,你看我先用数据有效性做了查询条件: 但是,接下来怎么在PQ里 ...

  • 大数据量查询容易OOM?试试MySQL流式查询

    一.前言 程序访问 MySQL 数据库时,当查询出来的数据量特别大时,数据库驱动把加载到的数据全部加载到内存里,就有可能会导致内存溢出(OOM). 其实在 MySQL 数据库中提供了流式查询,允许把符 ...

  • 结构相同的多列数据逆向查询

    数据源如下图左表所示,现在的要求是根据F2的身份证号查询对应的姓名.提问者说只有一列数据的话,ta会用index+match来做.可是现在有两列数据就不会做了,问该怎么做? -01- 简单粗暴法 首先 ...

  • excel跨表数据对比视频:应用powerquery将来自表格数据合并查询

    excel跨表数据对比视频|powerquery应用视频|excel数据来自表格视频|表格数据合并查询视频 本视频教程由部落窝教育分享.

  • 美国税局:纳税人数据未被黑客泄露

    E安全12月31日讯    据报道,美国国税局(IRS)的内部监督机构近日在致立法者的一封信中表示,"没有证据"表明,由于黑客入侵国税局的网络,纳税人的信息遭到泄露. ‍美国财政部 ...

  • 独家 | 使用机器学习对非结构化数据加速查询-第2部分(具有统计保证的近似选择查询)

    作者:Daniel Kang, Edward Gan, Peter Bailis, Tatsunori Hashimoto, and Matei Zaharia 翻译:殷之涵 校对:方星轩 本文约28 ...

  • 从百度数据看云南考生都在搜索什么大学,什...

    从百度数据看云南考生都在搜索什么大学,什么专业,大家可以适当减少撞车哦! 云南人始终都是家乡宝,嘿嘿,搜索的大学前几名都是我们云南的大学,管理类,设计类也是喜提云南家长的热搜,一起来看看吧

  • 惊! BC内部文件泄露 大温各市真实感染数据瘆人 变种超恐怖! 遮羞布被揭开了!

    阴阳文件打脸"抗疫大省" 疫情以来,加拿大民众曾多次质疑政府隐瞒疫情信息,认为实际感染率远比官方宣布的要高.但没有证据,这些终归是质疑. 然而,就在昨天,BC省疾控中心CDC一份内 ...