于2021-11-01 加入墨天轮


时空实验室
关注TA
写留言
230
文章
7
粉丝
48K+
浏览量
个人成就
发布230次内容
获得0次点赞
内容获得1次评论
获得2次收藏
回答了0次问答
文章分类
数据库
(75)
大数据
(36)
空间数据
(20)
时间序列
(17)
时间计算
(16)
预测模型
(16)
聚类
(14)
索引
(13)
算法
(11)
数据挖掘技术
(9)
数据挖掘算法
(9)
机器学习
(8)
展开
文章档案
2025年03月
(2)
2025年02月
(6)
2025年01月
(6)
2024年12月
(8)
2024年11月
(9)
2024年10月
(7)
2024年09月
(4)
2024年08月
(4)
展开
动态
文章 ·230
数说 ·0
问答 ·0
文档 ·0
关注
留言板·1
DSE精选文章 | FL-GUARD: 负联邦学习动态检测与修复总体框架
联邦学习旨在不暴露数据隐私的情况下,从分散在大量客户端的本地私有数据中训练全局模型。本文介绍了一种适用于任意联邦学习系统的总体框架FL-GUARD,以一种在算法运行时动态解决的新范式,处理负联邦学习问...
发布文章于
2025-03-10
SC 2024 | CUSZP2: 一种具有极高吞吐量和优化压缩率的GPU有损压缩器
本文提出了CUSZP2,一种基于GPU的高吞吐量、有损压缩器,旨在解决高性能计算(HPC)和机器学习中海量数据压缩的瓶颈问题。
发布文章于
2025-03-10
VLDB 2024 | Sparcle:通过空间感知提高数据清理系统的准确性
本文介绍了新颖的空间数据清理系统Sparcle,该系统的两个主要概念将空间意识注入基于规则的数据清洗系统核心引擎。
发布文章于
2025-03-10
DSE精选文章 | 云环境中面向安全动态Skyline查询处理的高效框架
Skyline查询可以从多维数据集中提取感兴趣的对象,在多标准决策的应用中被广泛使用。本文提出了一种名为安全动态Skyline查询(SCALE)的框架,通过数据加密及简化查询操作,可以实现密文上的高效...
发布文章于
2025-03-10
ICDE 2024 | 面向时空流数据预测的统一重放式持续学习框架
论文提出了一个统一的重放式持续学习框架URCL,旨在解决流数据场景下时空预测的挑战。通过引入回放缓冲区、时空混合机制、自监督学习模块,以及时空编码器与解码器的模块化架构,URCL有效缓解了灾难性遗忘问题,同时捕获复杂的时空依赖关系。
发布文章于
2025-03-10
TVCG 2024 | 大语言模型在检测误导性可视化方面有多好?
本文研究了LLMs在自动检测误导性可视化中的应用。三轮实验从最初的5种问题类型逐步扩展到21种问题,用以识别有效的提示策略。
发布文章于
2025-03-10
DSE精选文章 | 海量数据上显著Skyline计算
在许多实际应用中,skyline查询是一个重要操作,用于返回帕累托最优的元组,来提供最优解的候选集。在海量数据上,skyline查询常常返回过多结果。给定近似因子,P-skyline通过p-支配的定义...
发布文章于
2025-03-10
PVLDB 2024 | Chameleon:一种用于检索增强型语言模型的异构解耦加速器系统
论文介绍了一种为 RALM 推理设计的高效异构解耦加速器系统——Chameleon,通过整合FPGA和GPU资源,加速向量搜索和LLM推理过程。
发布文章于
2025-03-10
TVCG 2023 | 利用GeoChron可视化大尺度空间时间序列
本文介绍了GeoChron,一种有效的大规模ST序列可视化方法。文章将大规模ST序列的可视化问题表述为演化模式可视化问题,而Storyline技术可以很好地解决这一问题。
发布文章于
2025-03-10
VLDB 2022 | Llama:一种基于领域知识简单高效的配置调优系统
本文提出了一种基于领域知识的新型数据库配置调优框架,通过低维投影、特殊值采样和配置空间分桶等技术,有效降低了优化器的搜索范围,提高了样本效率,从而能够在不同的工作负载、优化器和 DBMS 版本上快速找到最佳配置。
发布文章于
2025-03-10
VLDB 2024 | 稳健时间序列预测的弱引导适应
本文介绍了DARF,一种弱引导自适应模型,旨在实现多元时间序列的稳健预测。为了实现多元时间序列的稳健预测,DARF配备了一个相关性稳健预测器,其编码器能够捕获多元相关性,从而提高预测精度。
发布文章于
2025-03-10
SIGMOD 2023 | 针对数据科学管道的谓词下推
论文提出了MagicPush方法,用于决定在包含关系型和非关系型操作符以及嵌入式UDF的数据管道中如何进行谓词下推。
发布文章于
2025-03-10
ICLR 2025 | 超稀疏存储网络
本文介绍了 UltraMem是一种新型的超稀疏存储网络架构,旨在解决大规模 Transformer 模型在推理时面临的高内存访问成本和计算复杂性问题。
发布文章于
2025-03-10
SIGMOD 2024 | 一个快速、可嵌入、模块化的分析查询引擎
本文介绍了DataFusion,一种快速、可嵌入、模块化的分析查询引擎,成功解决了传统紧耦合分析系统开发成本高昂、扩展性不足的难题。
发布文章于
2025-03-10
ICDE 2023 | CompressStreamDB:无需解压缩的细粒度自适应流处理
本文提出了 CompressStreamDB,它在流处理中应用压缩算法来提高系统性能。
发布文章于
2024-12-23
ICDE 2023 | 基于深度强化学习的道路网络上在线异常子轨迹检测
论文研究了道路网络上的在线异常子轨迹检测问题,并提出了第一个基于深度强化学习的解决方案,称为RL4OASD。RL4OASD是一种数据驱动的方法,无需标记数据即可进行训练。
发布文章于
2024-12-23
ICDE 2022 | MDZ:一种针对分子动力学数据的高效的有界误差有损压缩器
本文开发了一种基于数据在空间和时间维度上的规律性和相关性来显著提高预测精度的误差有界有损压缩器MDZ。
发布文章于
2024-12-23
ICDE 2021 | DISC:基于密度的跨越流数据的增量聚类
这篇论文介绍了基于密度聚类算法中的核心思想,讨论了基于密度聚类算法的局限性,提出了改进密度聚类算法的解决方法——DISC算法,详细地介绍了DISC算法的设计与实现,同时总结了DISC算法在相关数据集上的杰出性能。
发布文章于
2024-12-23
ICDE 2023 | START:融合时间规律和出行语义的轨迹表示学习
文章介绍了一种两阶段的轨迹表示学习方法START,其将时间规律性和出行语义结合到通用轨迹表示编码中。此外,本文设计了两个自监督的任务来训练模型,它充分考虑了轨迹的时空特征。
发布文章于
2024-12-23
ICDE 2023 | FLBooster:一个高效统一的联邦学习加速平台
文章介绍了一个用于联邦学习的框架和gpu加速系统。并行化了加密、解密和同态计算,使计算开销扁平化。它能最大化明文的冗余空间,不仅可以减少数据通信量,还会减少同态操作。
发布文章于
2024-12-23
ICDE 2023 | FXRZ: 一种面向科学数据集的特征驱动固定压缩率的有损压缩框架
本文提出了一种可固定压缩率的有损压缩框架FXRZ,具有低计算开销、压缩器无关、数据特征驱动等特点,能够有效地根据目标压缩比预测适当的误差界设置,从而使实际压缩率更接近预设目标。
发布文章于
2024-12-23
ICDE 2022 | 通过比率质量建模改进基于预测的有损压缩
本文介绍了一种为基于预测的有损压缩器开发的通用比率-质量分析模型,该模型可以有效地估计压缩比,以及有损压缩数据对事后分析质量的影响。
发布文章于
2024-12-23
ICDE 2023 | 预测COVID-19动态:聚类、广义时空注意力以及移动性和地理邻近性的影响
本文介绍了一种COVID-Forecaster新深度学习模型,它采用广义时空注意力来捕获不同地区、不同时间的流行病动态之间的时间依赖性。
发布文章于
2024-12-23
ICDE 2023 | Fed-SC: 高维度数据的联邦网络聚类
文章介绍了一种一次性联邦子空间聚类方案——Fed-SC,旨在解决高维数据下的联邦聚类问题。其填补了联邦聚类领域的重要空白,具有重要的研究意义和应用前景。
发布文章于
2024-12-23
ICDE 2024 | EcoCharge:基于估算成份的电动汽车充电桩的连续kNN排序框架
本文介绍了一种基于估算成份的电动汽车充电桩的连续KNN排序框架——EcoCharge。
发布文章于
2024-12-23
ICDE 2024 | 分离是为了更好的团聚:华为的数据湖存储
华为公司针对合作客户的业务需求进行分析,设计了一个新的数据湖存储系统StreamLake。在存储层,针对流数据和表数据的有效存储和访问,引入了流对象和表对象等存储抽象。在数据服务层,实现了支持ACID事务的LakeHouse。
发布文章于
2024-12-23
ICDE 2024 | Reverse Regret Query:反向遗憾查询
论文创新地提出反向遗憾查询问题 (RRQ) 问题,通过查找所有效用向量来确定给定产品的潜在客户。研究证明与现有的反向Top-k查询相比,RRQ能够更好地评估潜在客户。
发布文章于
2024-12-23
ICDE 2024 | 针对时序预测中空间联系的学习型时间感知图结构
论文介绍了TGCRN,一个用于预测空间相关时间序列的新框架。该框架第一个考虑到空间相关时间序列的周期性和趋势动态以进行时间序列预测的研究。
发布文章于
2024-12-23
ICDE 2023 | 一种用于基站轨迹地图匹配的学习增强式HMM模型
文章介绍了一种用于基站轨迹地图匹配的学习增强式HMM模型。多关系表征学习模块可以用于捕获为CTMM任务量身定制的多关系信息。
发布文章于
2024-12-23
ICDE 2022 | LITE:基于代码学习的Spark配置调优
本文提出了LITE系统,通过轻量级的自动调优方法,将小型数据集上的学习知识迁移到大型数据集,实现高效的Spark配置调优。
发布文章于
2024-12-23
ICDE 2023 | STWave:一种通过高效谱图注意力网络实现解耦交通预测的方法
论文介绍了一种新的解耦融合的交通预测框架STWave,不遵循复杂的交通端到端建模范式。具体而言,STWave首先通过DWT将交通时间序列分解为趋势和事件,从而使两个独立的分量互不干扰。
发布文章于
2024-12-23
ICDE 2023 | RNTrajRec:基于时空Transformer的路网增强轨迹恢复
本文提出了一个新的基于时空Transformer的框架——RNTrajRec,第一次尝试将路网表示与GPS轨迹表示结合起来进行轨迹恢复,以捕获给定低样本轨迹的丰富时空信息。
发布文章于
2024-12-23
ICDE 2024 | PH-Tree:高效地处理流场景下并发的连续Top-K查询
论文针对实时数据流上的多重连续Top-k查询问题,提出了一种新的用于流式数据高效MCTopk的创新索引PH-Tree。PH树通过将滑动窗口划分为多个不相交的分区,并在每个分区中维护候选对象集,采用最大堆结构来高效组织和管理Top-k对象。
发布文章于
2024-12-23
ICDE 2024 | SparDL:基于高效稀疏通信的分布式深度学习训练
论文分析了现有稀疏全规约(All-Reduce)框架的低效率问题,并提出了SparDL来解决这些问题。SparDL首次将多次选择过程与规约散射(Reduce-Scatter)操作相结合,以应对稀疏梯度累积(SGA)困境。
发布文章于
2024-12-23
VLDB 2020 | DeltaPQ: 用于高维相似性搜索的无损乘积量化代码压缩
论文研究了高维数据管理的无损压缩技术,提出了用于压缩量化代码并直接在压缩数据上执行查询的DeltaPQ压缩算法,并详细地介绍了DeltaPQ的算法设计与实践。
发布文章于
2024-12-23