【笔记】分布式多方安全可信数据库技术与实现
山东大学崔立真
研究背景
数字经济时代,数据安全是事关国家安全和经济社会发展的重大议题。 提供高可用性、高可靠性、安全与防篡改、水平扩展能力是大势所趋。 目前的数据库市场占比:云原生(基于Shared Nothing架构,实现水平分片,水平扩展) + 分布式时代(基于Shared Everything + Shared Storage架构,实现资源池化高效管理)
新的需求与挑战
数据存储、传输、计算、使用等环节面临数据泄露、篡改、破坏等风险 数据存储与管理的“物理分散”,数据处理与分析的“逻辑集中” 更加复杂的多中心数据库环境,更加广泛的数据开放需求
科学问题
原生架构:如何在架构层面完成数据库与安全技术的原生适配,使数据库原生支持区块链、密态管理技术和多方安全计算,实现防篡改、防泄漏、防破坏 库链协同:如何实现链上链下的高性能协同机制和可伸缩的并发机制,确保支持多数据中心场景下关键数据和过程上链的高并发需求及按需安全存储需求 隐私安全:如何设计面向数据的存储、访问、检索等各环节的数据安全、人工智能协同计算、密文分析的解决方案,提升安全算法和安全协议的运算性能,降低秘密参数规模
研究任务
分布式多方安全可信数据库架构设计
原生区块链安全可信数据库架构 可伸缩的异构算理自适应策略与安全威胁分析
数据库与区块链的性能适配技术研究
安全弹性共识 链上链下协同存储
分布式数据库密态数据管理技术研究
密态数据管理设计 安全动态密文检索
数据库的隐私保护技术研究
实用化通用安全多方计算协议及基础工具 基于实用化通用安全多方计算协议的联邦学习
研究内容一:形成分布式多方安全可信数据库架构
难点:传统安全数据库与新技术融合时碎片化严重,性能不匹配,难以扩展
1.1 原生区块链安全可信数据库架构
数据基本操作映射 为区块链交易:基本操作作为交易上链,操作过程、结果可验证,完全透明可控
链下协同任务 托管至数据库:链上数据对应的源数据最终回到数据库进行协同计算
隐私安全层 对数据进行隐私处理
智能合约 对事务过程统一管理:支持事务过程抗篡改、全程可追溯可验证,执行结果强制交付
状态对象映射 源数据与版本回溯:数据使用、依赖数据读写等操作完全可验证、完整性有保障、状态记录可回溯、可监管
库链双端协同计算
库端链端计算分离 两端业务互不干扰 隐私安全的数据协作
数据库隐私保护确保跨链、库链数据协作安全 密态数据管理确保映射数据完整、可靠 库链双端协同存储
库端链端存储解耦 原生映射数据与数据库表数据分离 库端原生操作不受影响 原生库链内容映射
数据库事务、数据、操作可验证上链 依托区块链特性实现可追溯、可监管的账本存储 面向数据库特征的区块链性能优化
1.2 可伸缩的异构算力自适应策略与安全威胁分析
可伸缩的异构算力自适应策略
与不同终端算力匹配的自适应策略 支持可伸缩账本、共识与计算 安全威胁分析
数据中心独立验证 多中心全局验证 账本可追溯、可监管 算力自适应
依据库端部署算力自适应 高算力库端协同低算力库端计算 安全环境自适应
根据库链双端环境自适应部署安全环境 轻量终端托管安全计算任务至大型终端 普通终端可完成基本安全计算任务 存储自适应
依据库端存储、链端算力自适应 轻量库端向高容量库端请求数据同步 轻量链端向高容量链端请求账本同步 安全威胁分析
账本防篡改,轻量终端也可独立可靠分析 原生映射,库端威胁,链上可追 库链协同,链端威胁,库端可追
研究内容二:数据库与区块链的性能适配技术研究
难点:库链融合过程中区块链数据处理效率低、存储写放大等问题
2.1 支持库链融合的区块链安全弹性共识机制
数据可信上链机制
建立多中心预言机,保证多方数据可信一致性 安全弹性的数据拜占庭容错共识协议
弹性变更参与共识的数据库节点数量,提高链库融合过程中数据处理效率 弹性变更链上共识的数据包大小,提高总体系统吞吐量 存算分离的数据可信处理技术
采用存算分离的框架,实现关键交易数据的快速确认 多中心预言机 保证数据 可信上链
安全弹性共识协议 实现交易安全快速处理,提升交易执行性能和硬件资源利用率
流水线异步工作流 弹性变更共识节点数目 弹性变更区块打包大小 存算解耦的执行框架 提升资源利用率
支持数据的快速校验 保证复杂逻辑高效执行
2.2 库链融合的数据链上链下协同存储机制
数据链上验证机制 确保存储数据可信性 数据库区块链双向锚定协同处理技术 保证数据的链上链下一致性 弹性的数据库最小副本冗余存储机制 弹性的数据副本冗余放置策略 大容量数据链上链下锚定分级存储
设计 高弹性、 可验证 的库链性能适配技术,支撑数据库海量数据的安全高效处理
研究内容三:分布式数据库的密态数据管理技术研究
难点:密态数据管理中如何保障密态计算机制的安全性
3.1 分布式数据库的密态数据管理设计
3.2 安全动态密文检索
密文检索协议的安全性模型:需要根据具体环境抽象出不同的安全模型,适应不同需求,解决因用户权限增大导致方案达不到安全性要求的问题 多种功能密文检索协议的构造:建立丰富的检索机制和组织结构,设计功能多样的可搜索加密协议,支撑复杂检索,扩展协议支持的功能 密文检索协议效率提升:目前,针对简单功能的可搜索加密协议,其构造主要基于对称密码算法,通信和I/O成为影响方案效率的最关键因素
研究内容四:基于安全多方计算的数据库隐私保护技术研究
难点:数据来源、运行环境多样;安全要求高,数据不动、模型动
4.1 实用化通用安全多方计算协议及基础工具
基础的安全技术实现 基础算子的封装 基于基础安全技术,进行基础算子封装。同一算子可由多种实现方案,以适应不同的场景需求,同时保持接口一直 安全机器学习算法开发 根据基础算子,尽可能复用已有算法和已有框架进行算法开发
4.2 基于实用化通用安全多方计算协议的联邦学习
本地局部模型训练 无需共享原始数据 增强用户数据隐私保护 节省网络资源,例如带宽 基于区块链的全局模型构建 消除联邦学习训练中对中央服务器要求 降低通信成本 激励更多移动用户参与基于其分散网络拓扑的数据训练 提高移动边缘网络的可扩展性
文章转载自SeanC的田园,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。