时空实验室的个人主页

于2021-11-01 加入墨天轮

时空实验室

关注TA

写留言

230

文章

粉丝

48K+

浏览量

个人成就

发布230次内容

获得0次点赞

内容获得1次评论

获得2次收藏

回答了0次问答

文章分类

数据库

（75）

大数据

（36）

空间数据

（20）

时间序列

（17）

时间计算

（16）

预测模型

（16）

聚类

（14）

索引

（13）

算法

（11）

数据挖掘技术

（9）

数据挖掘算法

（9）

机器学习

（8）

特征选择

（8）

压缩率

（8）

无损压缩

（7）

数据挖掘

（7）

单元格

（7）

编码转换

（6）

概率计算

（6）

迭代计算

（5）

滑动窗口

（5）

序列模式

（5）

数据结构

（5）

自适应

（5）

相似性

（5）

有损压缩

（5）

数据库系统

（4）

时间戳

（4）

矩阵管理

（4）

异常值

（4）

数据库分区

（4）

r-tree

（4）

指纹

（4）

贝叶斯

（4）

空间向量

（4）

网络模型

（4）

快照技术

（4）

强化学习

（3）

阈值分割

（3）

动态模型

（3）

近似算法

（3）

量化分析

（3）

dbscan

（3）

相关函数

（1）

特征分解

（1）

内存频率

（1）

disc

（1）

pla

（1）

统计学

（1）

比特率

（1）

实时系统

（1）

innodb

（1）

矩阵图

（1）

数据库优化

（1）

网格系统

（1）

roi

（1）

系统和压缩内存占用cpu

（1）

时间成本

（1）

梯度

（1）

评估标准

（1）

冗余技术

（1）

psnr

（1）

矩阵变换

（1）

维度

（1）

路径规划

（1）

硬件解码

（1）

相似性度量

（1）

数据检索

（1）

误差分析

（1）

缓冲区分析

（1）

基站定位

（1）

文本分析

（1）

符号函数

（1）

三元组

（1）

分布式部署

（1）

shuffle

（1）

数据寄存器

（1）

mbr

（1）

变量

（1）

curl

（1）

批次管理

（1）

moe

（1）

fpga

（1）

进程间通信

（1）

架构

（1）

最大堆

（1）

模式匹配

（1）

并行处理

（1）

异或

（1）

社会网络

（1）

动态规划

（1）

论文格式

（1）

oasis

（1）

神经网络

（1）

catalyst

（1）

存储单元

（1）

正则化

（1）

单车

（1）

有效值

（1）

编辑距离

（1）

k-means

（1）

脏数据

（1）

图像梯度

（1）

排序算法

（1）

结构化方法

（1）

gps模块

（1）

伪随机

（1）

构造器

（1）

查找算法

（1）

通用

（1）

数据可视化

（1）

cfs

（1）

分类数据

（1）

面向过程

（1）

waffle

（1）

lstm

（1）

云数据库

（1）

信息存储

（1）

效用理论

（1）

哈希函数

（1）

虚拟内存

（1）

可视化

（1）

智能算法

（1）

语言翻译

（1）

shardingsphere

（1）

经纬度

（1）

数据库设计

（1）

效用函数

（1）

卷积神经网络

（1）

列存储

（1）

分布式事务

（1）

监督学习

（1）

矩阵分解

（1）

地理

（1）

apache

（1）

mit

（1）

框架

（1）

链表

（1）

样本空间

（1）

hop

（1）

时间序列预测法

（1）

缓存服务器

（1）

mysql索引

（1）

自然语言

（1）

矩阵

（1）

线性结构

（1）

模块化设计

（1）

路由

（1）

关系模型

（1）

cot

（1）

内存时序

（1）

符号计算

（1）

符号表

（1）

分布式数据库

（1）

似然函数

（1）

空间维度

（1）

代码优化

（1）

端到端

（1）

内存参数

（1）

sql语言

（1）

cts

（1）

flink

（1）

hmm

（1）

哈希表

（1）

grep

（1）

异构计算

（1）

空间插值

（1）

海量数据

（1）

随机算法

（1）

直线插补

（1）

新能源汽车

（1）

空间频率

（1）

gpu

（1）

置信度

（1）

信息安全

（1）

电动汽车

（1）

平均误差

（1）

达美航空

（1）

数据有效性

（1）

特征向量

（1）

数据分析

（1）

预算控制

（1）

外键

（1）

超平面

（1）

数据库主键

（1）

位图

（1）

自适应算法

（1）

数据项

（1）

geohash

（1）

图表工具

（1）

空间文

（1）

分布式技术

（1）

数据仓库

（1）

隐私保护

（1）

排名优化

（1）

线段树

（1）

展开

文章档案

2025年03月

(2)

2025年02月

(6)

2025年01月

(6)

2024年12月

(8)

2024年11月

(9)

2024年10月

(7)

2024年09月

(4)

2024年08月

(4)

2024年07月

(5)

2024年06月

(10)

2024年05月

(4)

2024年04月

(9)

2024年03月

(8)

2024年02月

(4)

2024年01月

(6)

2023年12月

(4)

2023年11月

(5)

2023年10月

(2)

2023年09月

(3)

2023年08月

(4)

2023年07月

(5)

2023年06月

(3)

2023年05月

(6)

2023年04月

(4)

2023年03月

(4)

2023年02月

(4)

2023年01月

(5)

2022年12月

(3)

2022年11月

(3)

2022年10月

(4)

2022年09月

(4)

2022年08月

(5)

2022年07月

(3)

2022年06月

(1)

2022年05月

(1)

2022年04月

(2)

2022年03月

(2)

2022年01月

(1)

2021年12月

(2)

2021年11月

(2)

2021年09月

(3)

2021年08月

(2)

2021年07月

(3)

2021年06月

(3)

2021年05月

(2)

2021年04月

(7)

2021年03月

(6)

2021年02月

(5)

2021年01月

(5)

2020年12月

(4)

2020年11月

(5)

2020年10月

(4)

2020年09月

(4)

2020年03月

(3)

展开

DSE精选文章 | FL-GUARD: 负联邦学习动态检测与修复总体框架

联邦学习旨在不暴露数据隐私的情况下，从分散在大量客户端的本地私有数据中训练全局模型。本文介绍了一种适用于任意联邦学习系统的总体框架FL-GUARD，以一种在算法运行时动态解决的新范式，处理负联邦学习问...

发布文章于

2025-03-10

SC 2024 | CUSZP2: 一种具有极高吞吐量和优化压缩率的GPU有损压缩器

本文提出了CUSZP2，一种基于GPU的高吞吐量、有损压缩器，旨在解决高性能计算（HPC）和机器学习中海量数据压缩的瓶颈问题。

发布文章于

2025-03-10

VLDB 2024 | Sparcle：通过空间感知提高数据清理系统的准确性

本文介绍了新颖的空间数据清理系统Sparcle，该系统的两个主要概念将空间意识注入基于规则的数据清洗系统核心引擎。

发布文章于

2025-03-10

DSE精选文章 | 云环境中面向安全动态Skyline查询处理的高效框架

Skyline查询可以从多维数据集中提取感兴趣的对象，在多标准决策的应用中被广泛使用。本文提出了一种名为安全动态Skyline查询（SCALE）的框架，通过数据加密及简化查询操作，可以实现密文上的高效...

发布文章于

2025-03-10

ICDE 2024 | 面向时空流数据预测的统一重放式持续学习框架

论文提出了一个统一的重放式持续学习框架URCL，旨在解决流数据场景下时空预测的挑战。通过引入回放缓冲区、时空混合机制、自监督学习模块，以及时空编码器与解码器的模块化架构，URCL有效缓解了灾难性遗忘问题，同时捕获复杂的时空依赖关系。

发布文章于

2025-03-10

TVCG 2024 | 大语言模型在检测误导性可视化方面有多好？

本文研究了LLMs在自动检测误导性可视化中的应用。三轮实验从最初的5种问题类型逐步扩展到21种问题，用以识别有效的提示策略。

发布文章于

2025-03-10

DSE精选文章 | 海量数据上显著Skyline计算

在许多实际应用中，skyline查询是一个重要操作，用于返回帕累托最优的元组，来提供最优解的候选集。在海量数据上，skyline查询常常返回过多结果。给定近似因子，P-skyline通过p-支配的定义...

发布文章于

2025-03-10

PVLDB 2024 | Chameleon：一种用于检索增强型语言模型的异构解耦加速器系统

论文介绍了一种为 RALM 推理设计的高效异构解耦加速器系统——Chameleon，通过整合FPGA和GPU资源，加速向量搜索和LLM推理过程。

发布文章于

2025-03-10

TVCG 2023 | 利用GeoChron可视化大尺度空间时间序列

本文介绍了GeoChron，一种有效的大规模ST序列可视化方法。文章将大规模ST序列的可视化问题表述为演化模式可视化问题，而Storyline技术可以很好地解决这一问题。

发布文章于

2025-03-10

DSE精选文章 | 基于整体架构的交通预测综述

本文旨在全面综述交通预测的整体架构，涵盖交通数据分析、数据建模及预测应用等方面。

发布文章于

2025-03-10

VLDB 2022 | Llama：一种基于领域知识简单高效的配置调优系统

本文提出了一种基于领域知识的新型数据库配置调优框架，通过低维投影、特殊值采样和配置空间分桶等技术，有效降低了优化器的搜索范围，提高了样本效率，从而能够在不同的工作负载、优化器和 DBMS 版本上快速找到最佳配置。

发布文章于

2025-03-10

VLDB 2024 | 稳健时间序列预测的弱引导适应

本文介绍了DARF，一种弱引导自适应模型，旨在实现多元时间序列的稳健预测。为了实现多元时间序列的稳健预测，DARF配备了一个相关性稳健预测器，其编码器能够捕获多元相关性，从而提高预测精度。

发布文章于

2025-03-10

SIGMOD 2023 | 针对数据科学管道的谓词下推

论文提出了MagicPush方法，用于决定在包含关系型和非关系型操作符以及嵌入式UDF的数据管道中如何进行谓词下推。

发布文章于

2025-03-10

DSE精选文章 | TSQ：一种高效响应时间序列查询的优化框架

本文提出了一种优化框架TSQ，并应用于openGauss数据库中以高效执行时序数据的相关查询任务。

发布文章于

2025-03-10

ICLR 2025 | 超稀疏存储网络

本文介绍了 UltraMem是一种新型的超稀疏存储网络架构，旨在解决大规模 Transformer 模型在推理时面临的高内存访问成本和计算复杂性问题。

发布文章于

2025-03-10

SIGMOD 2024 | 一个快速、可嵌入、模块化的分析查询引擎

本文介绍了DataFusion，一种快速、可嵌入、模块化的分析查询引擎，成功解决了传统紧耦合分析系统开发成本高昂、扩展性不足的难题。

发布文章于

2025-03-10

ICDE 2022 | RW-tree: 用于构建R-tree的负载感知学习框架

本文介绍了RW-tree，一个通过学习历史查询来优化R-tree的插入过程的框架。

发布文章于

2024-12-23

ICDE 2023 | 轨迹数据中的高效 MIT 查询

本文探索了轨迹数据 (MIT) 中的Max-Inf 查询，提出了一种称为QB-tree 的混合索引。

发布文章于

2024-12-23

ICDE 2023 | CompressStreamDB：无需解压缩的细粒度自适应流处理

本文提出了 CompressStreamDB，它在流处理中应用压缩算法来提高系统性能。

发布文章于

2024-12-23

ICDE 2023 | GAR：使用生成和排序方法提升自然语言查询到SQL查询的翻译准确率

本文介绍了GAR，针对NL2SQL问题提出的一种实用的方法。

发布文章于

2024-12-23

ICDE 2023 | DBAugur: 一种基于对抗性的多样化工作负载预测系统

文章提出了DBAugur，一个基于对抗的趋势预测系统，旨在预测不同工作负载的趋势。

发布文章于

2024-12-23

ICDE 2023 | REncoder：一种带有本地编码器的高效时空范围过滤器

论文介绍了一种新型的具有较高时空效率和精度的范围过滤器，REncoder。

发布文章于

2024-12-23

ICDE 2023 | 基于深度强化学习的道路网络上在线异常子轨迹检测

论文研究了道路网络上的在线异常子轨迹检测问题，并提出了第一个基于深度强化学习的解决方案，称为RL4OASD。RL4OASD是一种数据驱动的方法，无需标记数据即可进行训练。

发布文章于

2024-12-23

ICDE 2022 | MDZ：一种针对分子动力学数据的高效的有界误差有损压缩器

本文开发了一种基于数据在空间和时间维度上的规律性和相关性来显著提高预测精度的误差有界有损压缩器MDZ。

发布文章于

2024-12-23

ICDE 2023|快速轨迹简化的轻量级框架

论文研究了现有的轨迹简化方法的问题，提出了一个轻量级的基于表示学习的框架S3.

发布文章于

2024-12-23

ICDE 2021 | DISC：基于密度的跨越流数据的增量聚类

这篇论文介绍了基于密度聚类算法中的核心思想，讨论了基于密度聚类算法的局限性，提出了改进密度聚类算法的解决方法——DISC算法，详细地介绍了DISC算法的设计与实现，同时总结了DISC算法在相关数据集上的杰出性能。

发布文章于

2024-12-23

ICDE 2023 | START：融合时间规律和出行语义的轨迹表示学习

文章介绍了一种两阶段的轨迹表示学习方法START，其将时间规律性和出行语义结合到通用轨迹表示编码中。此外，本文设计了两个自监督的任务来训练模型，它充分考虑了轨迹的时空特征。

发布文章于

2024-12-23

ICDE 2023 | FLBooster:一个高效统一的联邦学习加速平台

文章介绍了一个用于联邦学习的框架和gpu加速系统。并行化了加密、解密和同态计算，使计算开销扁平化。它能最大化明文的冗余空间，不仅可以减少数据通信量，还会减少同态操作。

发布文章于

2024-12-23

ICDE 2023 | FXRZ: 一种面向科学数据集的特征驱动固定压缩率的有损压缩框架

本文提出了一种可固定压缩率的有损压缩框架FXRZ，具有低计算开销、压缩器无关、数据特征驱动等特点，能够有效地根据目标压缩比预测适当的误差界设置，从而使实际压缩率更接近预设目标。

发布文章于

2024-12-23

ICDE 2022 | 通过比率质量建模改进基于预测的有损压缩

本文介绍了一种为基于预测的有损压缩器开发的通用比率-质量分析模型，该模型可以有效地估计压缩比，以及有损压缩数据对事后分析质量的影响。

发布文章于

2024-12-23

ICDE 2023 | 探索并行过滤图，革新层次聚类算法

本文介绍了一种用于构建TMFG的并行算法，并设计了一种新的并行构建DBHT的算法

发布文章于

2024-12-23

ICDE 2023 | ROI需求流量预测：预训练、查询和微调框架

本文介绍了一种新颖且实用的流量预测设置——ROI-demand流量预测（RTP）。

发布文章于

2024-12-23

ICDE 2023 | 预测COVID-19动态：聚类、广义时空注意力以及移动性和地理邻近性的影响

本文介绍了一种COVID-Forecaster新深度学习模型，它采用广义时空注意力来捕获不同地区、不同时间的流行病动态之间的时间依赖性。

发布文章于

2024-12-23

ICDE 2023 | Fed-SC: 高维度数据的联邦网络聚类

文章介绍了一种一次性联邦子空间聚类方案——Fed-SC，旨在解决高维数据下的联邦聚类问题。其填补了联邦聚类领域的重要空白，具有重要的研究意义和应用前景。

发布文章于

2024-12-23

ICDE 2024 | EcoCharge：基于估算成份的电动汽车充电桩的连续kNN排序框架

本文介绍了一种基于估算成份的电动汽车充电桩的连续KNN排序框架——EcoCharge。

发布文章于

2024-12-23

ICDE 2024 | 分离是为了更好的团聚：华为的数据湖存储

华为公司针对合作客户的业务需求进行分析，设计了一个新的数据湖存储系统StreamLake。在存储层，针对流数据和表数据的有效存储和访问，引入了流对象和表对象等存储抽象。在数据服务层，实现了支持ACID事务的LakeHouse。

发布文章于

2024-12-23

ICDE 2024 | Reverse Regret Query：反向遗憾查询

论文创新地提出反向遗憾查询问题 (RRQ) 问题，通过查找所有效用向量来确定给定产品的潜在客户。研究证明与现有的反向Top-k查询相比，RRQ能够更好地评估潜在客户。

发布文章于

2024-12-23

ICDE 2023 | 异构数据上的分布式正则化联邦学习

本文介绍了异构数据上的分布式正则化联邦学习方法——rFedAvg和rFedAvg+。

发布文章于

2024-12-23

ICDE 2024 | 针对时序预测中空间联系的学习型时间感知图结构

论文介绍了TGCRN，一个用于预测空间相关时间序列的新框架。该框架第一个考虑到空间相关时间序列的周期性和趋势动态以进行时间序列预测的研究。

发布文章于

2024-12-23

ICDE 2023 | 一种用于基站轨迹地图匹配的学习增强式HMM模型

文章介绍了一种用于基站轨迹地图匹配的学习增强式HMM模型。多关系表征学习模块可以用于捕获为CTMM任务量身定制的多关系信息。

发布文章于

2024-12-23

ICDE 2022 | LITE：基于代码学习的Spark配置调优

本文提出了LITE系统，通过轻量级的自动调优方法，将小型数据集上的学习知识迁移到大型数据集，实现高效的Spark配置调优。

发布文章于

2024-12-23

ICDE 2023 | STWave：一种通过高效谱图注意力网络实现解耦交通预测的方法

论文介绍了一种新的解耦融合的交通预测框架STWave，不遵循复杂的交通端到端建模范式。具体而言,STWave首先通过DWT将交通时间序列分解为趋势和事件，从而使两个独立的分量互不干扰。

发布文章于

2024-12-23

ICDE 2023 | RNTrajRec：基于时空Transformer的路网增强轨迹恢复

本文提出了一个新的基于时空Transformer的框架——RNTrajRec，第一次尝试将路网表示与GPS轨迹表示结合起来进行轨迹恢复，以捕获给定低样本轨迹的丰富时空信息。

发布文章于

2024-12-23

ICDE 2024 | PH-Tree：高效地处理流场景下并发的连续Top-K查询

论文针对实时数据流上的多重连续Top-k查询问题，提出了一种新的用于流式数据高效MCTopk的创新索引PH-Tree。PH树通过将滑动窗口划分为多个不相交的分区，并在每个分区中维护候选对象集，采用最大堆结构来高效组织和管理Top-k对象。

发布文章于

2024-12-23

ICDE 2024 | SparDL：基于高效稀疏通信的分布式深度学习训练

论文分析了现有稀疏全规约（All-Reduce）框架的低效率问题，并提出了SparDL来解决这些问题。SparDL首次将多次选择过程与规约散射（Reduce-Scatter）操作相结合，以应对稀疏梯度累积（SGA）困境。

发布文章于

2024-12-23

VLDB 2023 | 机器学习模型的高效近似查询

本文形式化的解决了精确目标查询和召回目标查询两种非常适合机器学习预测结果的范式，并提出了两种假设和四种算法。

发布文章于

2024-12-23

VLDB 2023 | Lero: 学习排序查询优化器

本文提出了Lero，一个learning-to-rank的查询优化器。

发布文章于

2024-12-23

VLDB 2023 | Elf时序数据无损压缩海报出炉

VLDB 2023 Elf时序无损压缩海报出炉啦~

发布文章于

2024-12-23

VLDB 2023 | LMSFC：基于学习型单调空间填充曲线的多维索引

本文介绍了LMSFC，一个基于学习型空间填充曲线的高维索引。

发布文章于

2024-12-23

VLDB 2020 | DeltaPQ: 用于高维相似性搜索的无损乘积量化代码压缩

论文研究了高维数据管理的无损压缩技术，提出了用于压缩量化代码并直接在压缩数据上执行查询的DeltaPQ压缩算法，并详细地介绍了DeltaPQ的算法设计与实践。

发布文章于

2024-12-23