virulent是什么意思ulent在线翻译读音例-支架英文


2023年4月19日发(作者:英语翻译论文)Trino⽂档-概览(新)
概览
Trino 是⼀个分布SQL查询引擎,设计⽤来查询⼤的分布式数据集,分布在⼀个或更多不同总类的数据源.
使⽤案例
这节全⾯介绍Trino,这样潜在的管理员和⽤户知道可以从Trino期待什么.
Trino 不能做什么
⾄从Trino被社区很多成员称为数据库,这是有意义的开始定义Trino不是什么.
不要误解事实,Trino 理解SQL是它提供标准数据库的特性. Trino 并不是⼀般⽤途的关系型数据库.它不能代替,像MySQL, PostgreSQL 或
Oracle. Trino不是被设计处理OTPL. 对于很多其它数据设计和数仓或分析优化总是这样.
Trino 可以做什么
Trino 是⼀个⼯具,被设计⾼效查询 数据使⽤分布式查询.如果你⼯具TB或PB的数据,你可能使⽤⼯具来与Hadoop和HDSF交互. Trino 被设
计作为另外选择⼯具,查询HDFS使⽤MapReduce管理任务,像Hive或Pig, 但是Trino 没有限制访问HDFS. Trino 可以有⼀个扩展的操作在
不同类型的数据源,包含传统关系性数据库和其它数据源像Cassandra.
Trino被设计处理数仓数据和分析:数据分析,聚合⼤量数据⽣成报告.这些⼯作量通常分类到OLAP.
1.2 Trino 概念
概览
为弄懂Trino ,你需要⾸先了解Persto⽂档中到处使⽤术语和概念.
然⽽这是⾮常容易了解statement 和query,作为终端⽤户你应该熟悉这些概念,像stages 和 split利⽤Trino来⾼效执⾏查询. 作为Trino管理
员或Trino做贡献者,你应该明⽩Trino概念怎样stage 映射到task,和怎样tasks包含⼀组driver来处理数据.
这部分提供固定定义为核⼼概念引⽤遍布在Trino中,并且这部分是排序从总体到细节.
Server类型
有两种Trino Server类型: coordinator 和worker.下边区域来解决他们的不同.
Coordinator
Trino coordinator 负责转换statement,设计query, 管理trino 中worker节点. 这是Trino安装的⼤脑,并且 也是⼀个客户端连接提交执⾏
statement的节点. 每个Trino安装必须有⼀个coordinator 和⼀个或多个worker. 对于开发或测试⽬的,单独⼀个Trino实例可以配置来执⾏
两个⾓⾊.
coordinator 保持跟踪每⼀个活着的worker和 调的执⾏query. coordinator 创建⼀个查询涉及⼀系列stage的逻辑模型,它翻译成⼀系列连
接的task梧组词二年级 运⾏在集群中worker.
Coordinator与worker交互使⽤REST API.
worker
Trino worker 在Trino 安装中是⼀个server, 它负责执⾏任和处理数据.Worker节点获得数据从connector 和彼此之间交互的中间数据.
coordinator负责获得结果从worker并且返回最终结果给client.
当Trino worker进程启动, 它通知⾃⼰给在coordinator上的发现server, 对于Trino coordinator可⽤为任务执⾏.

worker与其它worker交互并且Trino coordinator使⽤REST API.
数据源
通过这个⽂档,你会读到⼀些术语,像connector, catalog, schema, 和table. 这些基础概念覆盖Trino模型的⼀部分数据源并且被下⽂描述.
Connector
connector 适配Trino成为数据源,像Hive或关系型数据库.你可以认为connector 就想起数据库的d博学而笃志的意思 river. 它是Trino SPI的⼀个实现,允许
Trino与资源交互使⽤标准API.
Trino包含多种内建connectors: JVM connector,系统 connector可以提供访问系统内建表, TPCH connector设计⽤来服务 TPC-H
benchmark 数据.很多第3⽅开发者做贡献connector,导致 Trino 可以访问⼤量数据源.
每个 catalog 关联⼀个指定的connector.如果你检查catolog配置⽂件,你看到每个包含强制属性,它被catalog 管理使⽤来

创建connector为给定的catalog. 这是可能的有不⾄⼀个catalog 使⽤相同的connector 来访问两个不同实例相似的数据库. 例如,如果你有
两个hive集群,你可以姜夔暗香赏析 配置两个catalog在⼀个Trino集群,两个hive connector允许你查询数据从hive集群,甚⾄⾥边有相同SQL查询.
Catalog
Trino catalog 包含schema 和通过connector引⽤的数据源. 例如, 你可以配置JMX catalog来提供访问JMX 信息通过JMX connector.
当你在Trino中运⾏SQL statement,你运⾏它对应⼀个或多个catalog. 其它例⼦中catalogs 包含Hive catalog云连接hive数据源.
当在Trino中定位table,完整的表名总是从catalog的根开始.例如完整的表名指向 table 在 schema
_testtest_data
catalog 中.
hive
Catalogs 被定义在属性⽂件中,保存在Trino 配置⽬录.
Schema
Schema 是组成表的⼀种⽅式.放在⼀起, catalog 和schema定义⼀组可以被查询的表. 当⽤Trino访问 Hive或关系数据库像Mysql,
schema 翻译成相同概念在⽬标数据库. 其它类型的connector 可能⽤选择组织表到 schema⼀种⽅式,意味着了解底层数据源.
Table
table是⼀种⽆顺序的⾏,它可以组织到命名带有类型的列. 这也和任何关系型数据库相同.通过connector映射数据源到表.
Query执⾏模型
Trino 查询SQL statement并且转换这些statement到查询 query, 被执⾏通过分布集群中的coordinator 和worker.
Statement
Trino 执⾏ANSI兼容的SQL statement. 当Trino⽂档 指向⼀个statement ,它引⽤ statement 作为SQL ANSI标准定义, 它包含语句,表达
式和谓语.
⼀些读者可能好奇为什么这部分列出单独的概念为statement 和 query. 这是必要的因为,在Trino中 statement 只是指向代表SQL语句的
⽂本. 当 statement 被执⾏, Trino创建⼀个查询,伴随⼀个查询计划,然后分发到⼀系列worker.
Query
当Trino转换成statement,它转换它为⼀个查询语句,并且 创建分发查询计划, 它然后被实现通过⼀系列内部联接的stages运⾏在Trino
worker.当你检索关于Trino中的query, 你可以收到每个组件的快照,它涉及在产⽣结果集来响应statement.
statement 和query中的不同⾮常简单. statement可以被认为是⼀个SQL⽂本传递给Trino,当查询指向配置和被实例化组件来执⾏那个
statement. 查询包含stage, task 和 split, connector 和其它组件并且数据源⼯作⼀致在产⽣的结果.
Stage
当Trino执⾏query魏学洢核舟记写作背景 ,它做通过打散执⾏到⼀个层级的stage.例如,如果Trino需要聚合数据从⼗亿⾏保存到hvie,他做通过创建⼀个根 stage 去
聚合泊船瓜洲古诗ppt课件 多个stage输出, 所有这些被设计来实现不同区域的分布查询计划.

这个层级stage 包含query, 像树. 每个query有根stage,它负责聚合从其它stage的输出. stage 是coordinator 使⽤分布式查询计划成模型,
但是stage他们⾃⼰不运⾏在Trino worker.
Task
上部分提到的stage模型是分布查询⼀部分,但是stage他们⾃⼰不执⾏在Trino worker. task是\"主⼒\"在Trino架构,作为分布查询计算被解构
成⼀系列stage,它然后被翻译成task,作为或处理 task有输⼊和输出,并且当stage可能被执⾏以并⾏⽅式通过⼀系列tasks,⼀个
任务被执⾏以并⾏⽤⼀系列driver.
split
Task运⾏在split上,它是⼤数据集的⼀部分. Stage在分布查询计划获取数据的最低级别,通过来⾄connector的split,并且中间stage在分布查
询计划从其它stage上获取数据⾼级级别.
当Trino安排query, coordinator 查询connector 为⼀列表可⽤的split. coordinator 保持跟踪哪台机器运⾏任务,和被哪⼀个任务处理来切
分.
Driver
任务三十六计全部的名字 包含⼀个或多个并⾏扮演数据和组合operator ⽣成输出然后被任务聚合,再传递到其它stage的 另外任务. driver 是⼀系
列操作实例,或你可以认为driver作为在内存中物理 组的operator.它是最低级别并⾏在Trino架构中.drver有⼀个输⼊和⼀个输出.
Operator
Operator 消费,转换和⽣成数据. 例如,表可以扫描获得数据从connector 和⽣产数据,可以被其它 operator消费 ,并且⼀个过滤operator 消
费数据并且⽣成⼦数据通过输⼊数据应⽤预测.
Exchange
Exchange传输数据在Trino nodes之间为不同的 stage 查询. 任务⽣成数据 到输出buffer并且消费数据从其它任务⽤exchange 客户端.

彝语的英文译语怎么说-盗梦空间字幕下载


更多推荐

trino是什么意思no在线翻译语短语