目录
Relational DBMS简介
Fast distributed SQL query engine for big data analytics. Forked from Presto and originally named PrestoSQL.
用于大数据分析的快速分布式 SQL 查询引擎。从Presto分叉,最初命名为 PrestoSQL。
Trino产品优势
速度
Trino 是一个高度并行和分布式的查询引擎,它是从头开始构建的,用于高效、低延迟的分析。
规模
世界上最大的组织使用 Trino 来查询 EB 级数据湖和海量数据仓库等。
简单
Trino 是一个符合 ANSI SQL 的查询引擎,可与 R、Tableau、Power BI、Superset 等 BI 工具配合使用。
多才多艺的
支持多种用例:交互式速度的即席分析、多小时的大规模批量查询以及执行亚秒级查询的大容量应用程序。
就地分析
您可以在 Hadoop、S3、Cassandra、MySQL 和许多其他工具中本地查询数据,而无需复杂、缓慢且容易出错的数据复制过程。
查询联合
在单个查询中访问来自多个系统的数据。例如,将存储在 S3 对象存储中的历史日志数据与存储在 MySQL 关系数据库中的客户数据连接起来。
Runs everywhere
Trino 针对本地和云环境(如 Amazon、Azure、Google Cloud 等)进行了优化。
值得信赖
Trino 被世界上一些最大的组织用于关键业务运营,包括公开市场的财务业绩。
开放的
Trino 项目是非营利性 Trino 软件基金会下的社区驱动项目。
应用场景
交互式数据分析
Trino 使用的主要驱动力是交互式分析。用户直接使用 SQL 或通过用户界面生成查询,并等待尽快返回结果。Trino 在结果可用时立即将结果返回给用户。这使数据分析师和数据科学家能够查询大量数据、测试假设、运行 A/B 测试以及构建可视化或仪表板。
使用 SQL 对对象存储进行高性能分析
Trino 开发的最初用例是启用基于 SQL 的 HDFS/Hive 对象存储系统分析。Trino 的性能如此之高,以至于它可以实现过去不可能或需要数小时才能完成的分析。从基于 Hive 的系统迁移和查询云对象存储系统仍然是 Trino 的主要用例。
使用查询联合进行集中式数据访问和分析
使用相同 SQL 查询同一系统中的许多不同数据源的能力极大地简化了需要了解所有数据大图的分析。Trino 中的联合查询可以在同一个查询中访问您的对象存储、主要关系数据库以及新的流式处理或 NoSQL 系统。Trino 彻底改变了这个中央数据消费层的可能性。
跨不同系统的批处理 ETL
批量运行的大型提取、转换、加载 (ETL) 进程通常会占用大量资源。他们通常由工程师运行,只要最终完成,他们就不会优先返回。Trino 能够极大地加快 ETL 流程,允许它们都使用标准 SQL 语句,并在同一系统中处理大量数据源和目标。