目录
产品简介
TileDB 是一种现代数据库,它将所有数据模式、代码和计算集成在一个产品中。作为一个数据库系统,TileDB 调整其内部结构来优化生命科学、地理空间研究、生成人工智能和其他数据科学领域的高级应用程序。TileDB 围绕多维数组构建,这是一种强大的结构,适合捕获任何数据模态 - 从向量、表格和图像,到 ML 模型、3D 点云和群体基因组数据集。TileDB 提供了一个开源工具生态系统,而其商业产品 TIleDB Cloud 则提供了一个安全平台,用于分布式计算、交互式分析、协作以及与一系列 TileDB 垂直解决方案的集成。
- TileDB开源:TileDB 开发了广泛的开源工具,以实现数据科学和科学计算生态系统的互操作性。
- TileDB Cloud:TileDB Cloud 是用于可复制代码、生成人工智能和全球范围协作的现代数据库。
TileDB 是一个用于存储和访问密集和稀疏多维数组的强大引擎,它可以帮助您高效地对任何复杂数据进行建模。它是一个可在 Linux、macOS 和 Windows 上运行的嵌入式 C++ 库。它是在 MIT 许可下开源的,由TileDB, Inc开发和维护。为了将该项目与其他 TileDB 产品区分开来,我们通常将其称为TileDB Embedded。
产品功能
您可以使用 TileDB 在各种应用程序中存储数据,例如基因组学、地理空间、金融等。TileDB 的强大之处在于,任何数据都可以有效地建模为密集或稀疏多维数组,这是大多数数据科学工具内部使用的格式。通过将数据和元数据存储在 TileDB 数组中,您可以消除所有数据存储和管理难题,同时使用您最喜欢的数据科学工具高效访问数据。
- 支持密集和稀疏数组
- 支持数据帧和键值存储(通过稀疏数组)
- 云存储(AWS S3、Google 云存储、Azure Blob 存储)
- 分块(平铺)数组
- 多重压缩、加密和校验和过滤器
- 完全多线程实现
- 并行IO
- 数据版本控制(快速更新、时间旅行)
- 数组元数据
- 数组组
- C++ 库之上的大量API
- 众多集成(Spark、Dask、MariaDB、GDAL 等)
所属公司
TileDB, Inc
TileDB 于 2017 年 5 月从麻省理工学院和英特尔实验室分离出来,并得到了众多世界级投资者的支持。
2023年10月10日,TileDB完成B轮融资。
相关资料
TileDB 官网:https://tiledb.com/
TileDB 官方文档:https://docs.tiledb.com
TileDB GitHub地址:https://github.com/TileDB-Inc/TileDB