From 8d1d144eedf645cb394ebed638ae75fc7ce81edf Mon Sep 17 00:00:00 2001 From: Mingyu Chen Date: Mon, 28 Nov 2022 20:39:53 +0800 Subject: [PATCH] [doc](1.2) add version tag for feature in 1.2 (#14624) --- .../admin-manual/system-table/backends.md | 6 ++- .../docs/admin-manual/system-table/rowsets.md | 6 ++- .../import/import-way/routine-load-manual.md | 4 +- docs/zh-CN/docs/data-table/basic-usage.md | 4 ++ docs/zh-CN/docs/data-table/data-model.md | 6 ++- .../ecosystem/external-table/hive-of-doris.md | 4 ++ .../external-table/hudi-external-table.md | 4 ++ .../external-table/iceberg-of-doris.md | 4 ++ .../ecosystem/external-table/jdbc-of-doris.md | 4 ++ .../ecosystem/external-table/odbc-of-doris.md | 6 ++- .../udf/java-user-defined-function.md | 4 ++ .../udf/native-user-defined-function.md | 4 ++ .../sql-functions/table-functions/hdfs.md | 6 ++- .../sql-functions/table-functions/s3.md | 7 +++- .../Alter/ALTER-TABLE-RENAME.md | 2 +- .../Backup-and-Restore/RESTORE.md | 4 +- .../Create/CREATE-CATALOG.md | 4 ++ .../Create/CREATE-POLICY.md | 4 ++ .../Create/CREATE-TABLE.md | 8 +--- .../Drop/DROP-CATALOG.md | 4 ++ .../Load/CLEAN-LABEL.md | 4 ++ .../Load/STREAM-LOAD.md | 40 ++++++++++--------- .../Manipulation/DELETE.md | 2 +- .../Data-Manipulation-Statements/OUTFILE.md | 2 + .../sql-reference/Data-Types/ARRAY.md | 8 ++++ .../sql-reference/Data-Types/DATETIMEV2.md | 9 +++++ .../sql-reference/Data-Types/DATEV2.md | 9 +++++ .../ADMIN-CANCEL-REBALANCE-DISK.md | 7 ++-- .../ADMIN-REBALANCE-DISK.md | 8 ++-- .../SHOW-CATALOG-RECYCLE-BIN.md | 4 ++ .../Show-Statements/SHOW-CATALOGS.md | 4 ++ 31 files changed, 148 insertions(+), 44 deletions(-) diff --git a/docs/zh-CN/docs/admin-manual/system-table/backends.md b/docs/zh-CN/docs/admin-manual/system-table/backends.md index 36dc1dcb8c..c80a5cae6e 100644 --- a/docs/zh-CN/docs/admin-manual/system-table/backends.md +++ b/docs/zh-CN/docs/admin-manual/system-table/backends.md @@ -28,8 +28,12 @@ under the License. ### Name + + backends + + ### description `backends` 是doris内置的一张系统表,存放在`information_schema`数据库下。通过`backends`系统表可以查看当前doris集群中的 `BE` 节点信息。 @@ -82,4 +86,4 @@ MySQL [information_schema]> select * from information_schema.backends; backends, information_schema -### Best Practice \ No newline at end of file +### Best Practice diff --git a/docs/zh-CN/docs/admin-manual/system-table/rowsets.md b/docs/zh-CN/docs/admin-manual/system-table/rowsets.md index a5ee2402af..c7579b0234 100644 --- a/docs/zh-CN/docs/admin-manual/system-table/rowsets.md +++ b/docs/zh-CN/docs/admin-manual/system-table/rowsets.md @@ -28,8 +28,12 @@ under the License. ### Name + + rowsets + + ### description `rowsets` 是doris内置的一张系统表,存放在`information_schema`数据库下。通过 `rowsets` 系统表可以查看各个`BE` 当前rowsets情况。 @@ -80,4 +84,4 @@ select * from information_schema.rowsets where BACKEND_ID = 10004 limit 10; rowsets, information_schema -### Best Practice \ No newline at end of file +### Best Practice diff --git a/docs/zh-CN/docs/data-operate/import/import-way/routine-load-manual.md b/docs/zh-CN/docs/data-operate/import/import-way/routine-load-manual.md index cd6d7d8364..71320d8993 100644 --- a/docs/zh-CN/docs/data-operate/import/import-way/routine-load-manual.md +++ b/docs/zh-CN/docs/data-operate/import/import-way/routine-load-manual.md @@ -306,10 +306,10 @@ CREATE ROUTINE LOAD example_db.test1 ON example_tbl > > [https://github.com/edenhill/librdkafka/blob/master/CONFIGURATION.md](https://github.com/edenhill/librdkafka/blob/master/CONFIGURATION.md) - - **访问 Kerberos 认证的 Kafka 集群** + + 访问开启kerberos认证的Kafka集群,需要增加以下配置: - security.protocol=SASL_PLAINTEXT : 使用 SASL plaintext diff --git a/docs/zh-CN/docs/data-table/basic-usage.md b/docs/zh-CN/docs/data-table/basic-usage.md index 37141b9b6c..e46c72e688 100644 --- a/docs/zh-CN/docs/data-table/basic-usage.md +++ b/docs/zh-CN/docs/data-table/basic-usage.md @@ -403,6 +403,8 @@ mysql> SELECT * FROM table1 ORDER BY citycode; ### SELECT * EXCEPT + + `SELECT * EXCEPT` 语句指定要从结果中排除的一个或多个列的名称。输出中将忽略所有匹配的列名称。 ```sql @@ -419,6 +421,8 @@ MySQL> SELECT * except (username, citycode) FROM table1; **注意**:`SELECT * EXCEPT` 不会排除没有名称的列。 + + ### Join 查询 查询示例: diff --git a/docs/zh-CN/docs/data-table/data-model.md b/docs/zh-CN/docs/data-table/data-model.md index 5bde21a0ff..50bf754b98 100644 --- a/docs/zh-CN/docs/data-table/data-model.md +++ b/docs/zh-CN/docs/data-table/data-model.md @@ -312,7 +312,9 @@ PROPERTIES ( 即Unique 模型的读时合并实现完全可以用聚合模型中的 REPLACE 方式替代。其内部的实现方式和数据存储方式也完全一样。这里不再继续举例说明。 -### 写时合并(1.2版本新增) + + +### 写时合并 Unqiue模型的写时合并实现,与聚合模型就是完全不同的两种模型了,查询性能更接近于duplicate模型,在有主键约束需求的场景上相比聚合模型有较大的查询性能优势,尤其是在聚合查询以及需要用索引过滤大量数据的查询中。 @@ -364,6 +366,8 @@ PROPERTIES ( 2. 旧的Merge-on-read的实现无法无缝升级到新版本的实现(数据组织方式完全不同),如果需要改为使用写时合并的实现版本,需要手动执行`insert into unique-mow-table select * from source table`. 3. 在Unique模型上独有的delete sign 和 sequence col,在写时合并的新版实现中仍可以正常使用,用法没有变化。 + + ## Duplicate 模型 在某些多维分析场景下,数据既没有主键,也没有聚合需求。因此,我们引入 Duplicate 数据模型来满足这类需求。举例说明。 diff --git a/docs/zh-CN/docs/ecosystem/external-table/hive-of-doris.md b/docs/zh-CN/docs/ecosystem/external-table/hive-of-doris.md index 74ee575da5..f348d97947 100644 --- a/docs/zh-CN/docs/ecosystem/external-table/hive-of-doris.md +++ b/docs/zh-CN/docs/ecosystem/external-table/hive-of-doris.md @@ -26,6 +26,8 @@ under the License. # Hive External Table of Doris + + Hive External Table of Doris 提供了 Doris 直接访问 Hive 外部表的能力,外部表省去了繁琐的数据导入工作,并借助 Doris 本身的 OLAP 的能力来解决 Hive 表的数据分析问题: 1. 支持 Hive 数据源接入Doris @@ -34,6 +36,8 @@ Hive External Table of Doris 提供了 Doris 直接访问 Hive 外部表的能 本文档主要介绍该功能的使用方式和注意事项等。 + + ## 名词解释 ### Doris 相关 diff --git a/docs/zh-CN/docs/ecosystem/external-table/hudi-external-table.md b/docs/zh-CN/docs/ecosystem/external-table/hudi-external-table.md index f077e71456..a28ef746ca 100644 --- a/docs/zh-CN/docs/ecosystem/external-table/hudi-external-table.md +++ b/docs/zh-CN/docs/ecosystem/external-table/hudi-external-table.md @@ -26,6 +26,8 @@ under the License. # Hudi External Table of Doris + + Hudi External Table of Doris 提供了 Doris 直接访问 Hudi 外部表的能力,外部表省去了繁琐的数据导入工作,并借助 Doris 本身的 OLAP 的能力来解决 Hudi 表的数据分析问题: 1. 支持 Hudi 数据源接入Doris @@ -33,6 +35,8 @@ Hudi External Table of Doris 提供了 Doris 直接访问 Hudi 外部表的能 本文档主要介绍该功能的使用方式和注意事项等。 + + ## 名词解释 ### Doris 相关 diff --git a/docs/zh-CN/docs/ecosystem/external-table/iceberg-of-doris.md b/docs/zh-CN/docs/ecosystem/external-table/iceberg-of-doris.md index dd231ed589..b86fad3251 100644 --- a/docs/zh-CN/docs/ecosystem/external-table/iceberg-of-doris.md +++ b/docs/zh-CN/docs/ecosystem/external-table/iceberg-of-doris.md @@ -26,6 +26,8 @@ under the License. # Iceberg External Table of Doris + + Iceberg External Table of Doris 提供了 Doris 直接访问 Iceberg 外部表的能力,外部表省去了繁琐的数据导入工作,并借助 Doris 本身的 OLAP 的能力来解决 Iceberg 表的数据分析问题: 1. 支持 Iceberg 数据源接入Doris @@ -33,6 +35,8 @@ Iceberg External Table of Doris 提供了 Doris 直接访问 Iceberg 外部表 本文档主要介绍该功能的使用方式和注意事项等。 + + ## 名词解释 ### Doris 相关 diff --git a/docs/zh-CN/docs/ecosystem/external-table/jdbc-of-doris.md b/docs/zh-CN/docs/ecosystem/external-table/jdbc-of-doris.md index dbae5a2bba..d333e8850f 100644 --- a/docs/zh-CN/docs/ecosystem/external-table/jdbc-of-doris.md +++ b/docs/zh-CN/docs/ecosystem/external-table/jdbc-of-doris.md @@ -26,6 +26,8 @@ under the License. # JDBC External Table Of Doris + + JDBC External Table Of Doris 提供了Doris通过数据库访问的标准接口(JDBC)来访问外部表,外部表省去了繁琐的数据导入工作,让Doris可以具有了访问各式数据库的能力,并借助Doris本身的OLAP的能力来解决外部表的数据分析问题: 1. 支持各种数据源接入Doris @@ -33,6 +35,8 @@ JDBC External Table Of Doris 提供了Doris通过数据库访问的标准接口( 本文档主要介绍该功能的使用方式等。 + + ### Doris中创建JDBC的外表 具体建表语法参照:[CREATE TABLE](../../sql-manual/sql-reference/Data-Definition-Statements/Create/CREATE-TABLE.md) diff --git a/docs/zh-CN/docs/ecosystem/external-table/odbc-of-doris.md b/docs/zh-CN/docs/ecosystem/external-table/odbc-of-doris.md index f5c1e94756..b9c4bb3ec3 100644 --- a/docs/zh-CN/docs/ecosystem/external-table/odbc-of-doris.md +++ b/docs/zh-CN/docs/ecosystem/external-table/odbc-of-doris.md @@ -26,6 +26,8 @@ under the License. # ODBC External Table Of Doris + + ODBC External Table Of Doris 提供了Doris通过数据库访问的标准接口(ODBC)来访问外部表,外部表省去了繁琐的数据导入工作,让Doris可以具有了访问各式数据库的能力,并借助Doris本身的OLAP的能力来解决外部表的数据分析问题: 1. 支持各种数据源接入Doris @@ -34,6 +36,8 @@ ODBC External Table Of Doris 提供了Doris通过数据库访问的标准接口( 本文档主要介绍该功能的实现原理、使用方式等。 + + ## 名词解释 ### Doris相关 @@ -397,4 +401,4 @@ sudo alien -i oracle-instantclient19.13-sqlplus-19.13.0.0.0-2.x86_64.rpm 12. 读写sqlserver外表的编码配置 - 由于sqlserver的odbc外表连接时,无法直接通过`charset`来配置编码,用户可以使用`ClientCharset`(for freetds)配置项来设置, 比如 "ClientCharset" = "UTF-8"。 \ No newline at end of file + 由于sqlserver的odbc外表连接时,无法直接通过`charset`来配置编码,用户可以使用`ClientCharset`(for freetds)配置项来设置, 比如 "ClientCharset" = "UTF-8"。 diff --git a/docs/zh-CN/docs/ecosystem/udf/java-user-defined-function.md b/docs/zh-CN/docs/ecosystem/udf/java-user-defined-function.md index 73b548640d..b4823c1d19 100644 --- a/docs/zh-CN/docs/ecosystem/udf/java-user-defined-function.md +++ b/docs/zh-CN/docs/ecosystem/udf/java-user-defined-function.md @@ -26,6 +26,8 @@ under the License. # Java UDF + + Java UDF 为用户提供UDF编写的Java接口,以方便用户使用Java语言进行自定义函数的执行。相比于 Native 的 UDF 实现,Java UDF 有如下优势和限制: 1. 优势 * 兼容性:使用Java UDF可以兼容不同的Doris版本,所以在进行Doris版本升级时,Java UDF不需要进行额外的迁移操作。与此同时,Java UDF同样遵循了和Hive/Spark等引擎同样的编程规范,使得用户可以直接将Hive/Spark的UDF jar包迁移至Doris使用。 @@ -36,6 +38,8 @@ Java UDF 为用户提供UDF编写的Java接口,以方便用户使用Java语言 * 性能:相比于 Native UDF,Java UDF会带来额外的JNI开销,不过通过批式执行的方式,我们已经尽可能的将JNI开销降到最低。 * 向量化引擎:Java UDF当前只支持向量化引擎。 + + ### 类型对应关系 |Type|UDF Argument Type| diff --git a/docs/zh-CN/docs/ecosystem/udf/native-user-defined-function.md b/docs/zh-CN/docs/ecosystem/udf/native-user-defined-function.md index ff0e79d135..5e5118326a 100644 --- a/docs/zh-CN/docs/ecosystem/udf/native-user-defined-function.md +++ b/docs/zh-CN/docs/ecosystem/udf/native-user-defined-function.md @@ -26,6 +26,8 @@ under the License. # UDF + + UDF 主要适用于,用户需要的分析能力 Doris 并不具备的场景。用户可以自行根据自己的需求,实现自定义的函数,并且通过 UDF 框架注册到 Doris 中,来扩展 Doris 的能力,并解决用户分析需求。 UDF 能满足的分析需求分为两种:UDF 和 UDAF。本文中的 UDF 指的是二者的统称。 @@ -37,6 +39,8 @@ UDF 能满足的分析需求分为两种:UDF 和 UDAF。本文中的 UDF 指 如果用户使用 UDF 功能并扩展了 Doris 的函数分析,并且希望将自己实现的 UDF 函数贡献回 Doris 社区给其他用户使用,这时候请看文档 [Contribute UDF](./contribute-udf.md)。 + + ## 编写 UDF 函数 在使用UDF之前,用户需要先在 Doris 的 UDF 框架下,编写自己的UDF函数。在`contrib/udf/src/udf_samples/udf_sample.h|cpp`文件中是一个简单的 UDF Demo。 diff --git a/docs/zh-CN/docs/sql-manual/sql-functions/table-functions/hdfs.md b/docs/zh-CN/docs/sql-manual/sql-functions/table-functions/hdfs.md index 06676c2f2c..5ac5061240 100644 --- a/docs/zh-CN/docs/sql-manual/sql-functions/table-functions/hdfs.md +++ b/docs/zh-CN/docs/sql-manual/sql-functions/table-functions/hdfs.md @@ -28,8 +28,12 @@ under the License. ### Name + + hdfs + + ### Description HDFS表函数(table-valued-function,tvf),可以让用户像访问关系表格式数据一样,读取并访问 HDFS 上的文件内容。目前支持`csv/csv_with_names/csv_with_names_and_types/json/parquet/orc`文件格式。 @@ -110,4 +114,4 @@ MySQL [(none)]> desc function hdfs( ### Best Practice - 关于HDFS tvf的更详细使用方法可以参照 [S3](./s3.md) tvf, 唯一不同的是访问存储系统的方式不一样。 \ No newline at end of file + 关于HDFS tvf的更详细使用方法可以参照 [S3](./s3.md) tvf, 唯一不同的是访问存储系统的方式不一样。 diff --git a/docs/zh-CN/docs/sql-manual/sql-functions/table-functions/s3.md b/docs/zh-CN/docs/sql-manual/sql-functions/table-functions/s3.md index b808bb36c4..a27b8c56df 100644 --- a/docs/zh-CN/docs/sql-manual/sql-functions/table-functions/s3.md +++ b/docs/zh-CN/docs/sql-manual/sql-functions/table-functions/s3.md @@ -27,7 +27,12 @@ under the License. ## S3 ### Name -S3 + + + +s3 + + ### description diff --git a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Alter/ALTER-TABLE-RENAME.md b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Alter/ALTER-TABLE-RENAME.md index 42b3c08fcc..801cd9cb2a 100644 --- a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Alter/ALTER-TABLE-RENAME.md +++ b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Alter/ALTER-TABLE-RENAME.md @@ -66,7 +66,7 @@ RENAME ROLLUP old_rollup_name new_rollup_name; RENAME PARTITION old_partition_name new_partition_name; ``` -4.修改 column 名称 +4. 修改 column 名称 语法: diff --git a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Backup-and-Restore/RESTORE.md b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Backup-and-Restore/RESTORE.md index 4461c47505..8541500331 100644 --- a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Backup-and-Restore/RESTORE.md +++ b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Backup-and-Restore/RESTORE.md @@ -56,8 +56,8 @@ PROPERTIES ("key"="value", ...); - PROPERTIES 目前支持以下属性: - "backup_timestamp" = "2018-05-04-16-45-08":指定了恢复对应备份的哪个时间版本,必填。该信息可以通过 `SHOW SNAPSHOT ON repo;` 语句获得。 - "replication_num" = "3":指定恢复的表或分区的副本数。默认为3。若恢复已存在的表或分区,则副本数必须和已存在表或分区的副本数相同。同时,必须有足够的 host 容纳多个副本。 - - "reserve_replica" = "true":默认为 false。当该属性为 true 时,会忽略 replication_num 属性,恢复的表或分区的副本数将与备份之前一样。支持多个表或表内多个分区有不同的副本数。 - - "reserve_dynamic_partition_enable" = "true":默认为 false。当该属性为 true 时,恢复的表会保留该表备份之前的'dynamic_partition_enable'属性值。该值不为true时,则恢复出来的表的'dynamic_partition_enable'属性值会设置为false。 + - "reserve_replica" = "true":默认为 false。当该属性为 true 时,会忽略 replication_num 属性,恢复的表或分区的副本数将与备份之前一样。支持多个表或表内多个分区有不同的副本数。 + - "reserve_dynamic_partition_enable" = "true":默认为 false。当该属性为 true 时,恢复的表会保留该表备份之前的'dynamic_partition_enable'属性值。该值不为true时,则恢复出来的表的'dynamic_partition_enable'属性值会设置为false。 - "timeout" = "3600":任务超时时间,默认为一天。单位秒。 - "meta_version" = 40:使用指定的 meta_version 来读取之前备份的元数据。注意,该参数作为临时方案,仅用于恢复老版本 Doris 备份的数据。最新版本的备份数据中已经包含 meta version,无需再指定。 diff --git a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Create/CREATE-CATALOG.md b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Create/CREATE-CATALOG.md index 38f37ae1a0..1f16a19496 100644 --- a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Create/CREATE-CATALOG.md +++ b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Create/CREATE-CATALOG.md @@ -28,8 +28,12 @@ under the License. ### Name + + CREATE CATALOG + + ### Description 该语句用于创建外部数据目录(catalog) diff --git a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Create/CREATE-POLICY.md b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Create/CREATE-POLICY.md index c2904081ff..707486b226 100644 --- a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Create/CREATE-POLICY.md +++ b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Create/CREATE-POLICY.md @@ -28,8 +28,12 @@ under the License. ### Name + + CREATE POLICY + + ### Description 创建策略,包含以下几种: diff --git a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Create/CREATE-TABLE.md b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Create/CREATE-TABLE.md index 0549659923..7dbfd26e26 100644 --- a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Create/CREATE-TABLE.md +++ b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Create/CREATE-TABLE.md @@ -227,9 +227,7 @@ distribution_desc ) ``` - - - 3. MULTI RANGE:批量创建RANGE分区,定义分区的左闭右开区间,设定时间单位和步长,时间单位支持年、月、日、周和小时。 + 3. MULTI RANGE:批量创建RANGE分区,定义分区的左闭右开区间,设定时间单位和步长,时间单位支持年、月、日、周和小时。 ``` PARTITION BY RANGE(col) @@ -241,8 +239,6 @@ distribution_desc ) ``` - - * `distribution_desc` 定义数据分桶方式。 @@ -348,7 +344,7 @@ distribution_desc * `light_schema_change` - 是否使用light schema change优化。 + 是否使用light schema change优化。 如果设置成 `true`, 对于值列的加减操作,可以更快地,同步地完成。 diff --git a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Drop/DROP-CATALOG.md b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Drop/DROP-CATALOG.md index 25ee2d3b9b..4f2c707477 100644 --- a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Drop/DROP-CATALOG.md +++ b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Drop/DROP-CATALOG.md @@ -28,8 +28,12 @@ under the License. ### Name + + CREATE CATALOG + + ### Description 该语句用于删除外部数据目录(catalog) diff --git a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Manipulation-Statements/Load/CLEAN-LABEL.md b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Manipulation-Statements/Load/CLEAN-LABEL.md index 83d9a90600..a4e6b13ee5 100644 --- a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Manipulation-Statements/Load/CLEAN-LABEL.md +++ b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Manipulation-Statements/Load/CLEAN-LABEL.md @@ -28,8 +28,12 @@ under the License. ### Name + + CLEAN LABEL + + ### Description 用于手动清理历史导入作业的 Label。清理后,Label 可以重复使用。 diff --git a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Manipulation-Statements/Load/STREAM-LOAD.md b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Manipulation-Statements/Load/STREAM-LOAD.md index 103640934c..97473b3d1d 100644 --- a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Manipulation-Statements/Load/STREAM-LOAD.md +++ b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Manipulation-Statements/Load/STREAM-LOAD.md @@ -40,28 +40,28 @@ curl --location-trusted -u user:passwd [-H ""...] -T data.file -XPUT http://fe_h 该语句用于向指定的 table 导入数据,与普通Load区别是,这种导入方式是同步导入。 -​ 这种导入方式仍然能够保证一批导入任务的原子性,要么全部数据导入成功,要么全部失败。 +这种导入方式仍然能够保证一批导入任务的原子性,要么全部数据导入成功,要么全部失败。 -​ 该操作会同时更新和此 base table 相关的 rollup table 的数据。 +该操作会同时更新和此 base table 相关的 rollup table 的数据。 -​ 这是一个同步操作,整个数据导入工作完成后返回给用户导入结果。 +这是一个同步操作,整个数据导入工作完成后返回给用户导入结果。 -​ 当前支持HTTP chunked与非chunked上传两种方式,对于非chunked方式,必须要有Content-Length来标示上传内容长度,这样能够保证数据的完整性。 +当前支持HTTP chunked与非chunked上传两种方式,对于非chunked方式,必须要有Content-Length来标示上传内容长度,这样能够保证数据的完整性。 -​ 另外,用户最好设置Expect Header字段内容100-continue,这样可以在某些出错场景下避免不必要的数据传输。 +另外,用户最好设置Expect Header字段内容100-continue,这样可以在某些出错场景下避免不必要的数据传输。 参数介绍: 用户可以通过HTTP的Header部分来传入导入参数 1. label: 一次导入的标签,相同标签的数据无法多次导入。用户可以通过指定Label的方式来避免一份数据重复导入的问题。 - 当前Doris内部保留30分钟内最近成功的label。 + 当前Doris内部保留30分钟内最近成功的label。 2. column_separator:用于指定导入文件中的列分隔符,默认为\t。如果是不可见字符,则需要加\x作为前缀,使用十六进制来表示分隔符。 - ​ 如hive文件的分隔符\x01,需要指定为-H "column_separator:\x01"。 + 如hive文件的分隔符\x01,需要指定为-H "column_separator:\x01"。 - ​ 可以使用多个字符的组合作为列分隔符。 + 可以使用多个字符的组合作为列分隔符。 3. line_delimiter:用于指定导入文件中的换行符,默认为\n。可以使用做多个字符的组合作为换行符。 @@ -69,17 +69,17 @@ curl --location-trusted -u user:passwd [-H ""...] -T data.file -XPUT http://fe_h 如果源文件与表schema不对应,那么需要这个字段进行一些数据转换。这里有两种形式column,一种是直接对应导入文件中的字段,直接使用字段名表示; - ​ 一种是衍生列,语法为 `column_name` = expression。举几个例子帮助理解。 + 一种是衍生列,语法为 `column_name` = expression。举几个例子帮助理解。 - ​ 例1: 表中有3个列“c1, c2, c3”,源文件中的三个列一次对应的是"c3,c2,c1"; 那么需要指定-H "columns: c3, c2, c1" + 例1: 表中有3个列“c1, c2, c3”,源文件中的三个列一次对应的是"c3,c2,c1"; 那么需要指定-H "columns: c3, c2, c1" - ​ 例2: 表中有3个列“c1, c2, c3", 源文件中前三列依次对应,但是有多余1列;那么需要指定-H "columns: c1, c2, c3, xxx"; + 例2: 表中有3个列“c1, c2, c3", 源文件中前三列依次对应,但是有多余1列;那么需要指定-H "columns: c1, c2, c3, xxx"; - ​ 最后一个列随意指定个名称占位即可 + 最后一个列随意指定个名称占位即可 - ​ 例3: 表中有3个列“year, month, day"三个列,源文件中只有一个时间列,为”2018-06-01 01:02:03“格式; + 例3: 表中有3个列“year, month, day"三个列,源文件中只有一个时间列,为”2018-06-01 01:02:03“格式; - ​ 那么可以指定-H "columns: col, year = year(col), month=month(col), day=day(col)"完成导入 + 那么可以指定-H "columns: col, year = year(col), month=month(col), day=day(col)"完成导入 5. where: 用于抽取部分数据。用户如果有需要将不需要的数据过滤掉,那么可以通过设定这个选项来达到。 @@ -99,7 +99,7 @@ curl --location-trusted -u user:passwd [-H ""...] -T data.file -XPUT http://fe_h 11. exec_mem_limit: 导入内存限制。默认为 2GB。单位为字节。 -12. format: 指定导入数据格式,默认是csv,也支持:csv_with_names(支持csv文件行首过滤),csv_with_names_and_types(支持csv文件前两行过滤) 或 json格式。 +12. format: 指定导入数据格式,默认是csv,也支持: csv_with_names(支持csv文件行首过滤),csv_with_names_and_types(支持csv文件前两行过滤) 或 json格式。 13. jsonpaths: 导入json方式分为:简单模式和匹配模式。 @@ -134,11 +134,13 @@ curl --location-trusted -u user:passwd [-H ""...] -T data.file -XPUT http://fe_h 21. send_batch_parallelism: 整型,用于设置发送批处理数据的并行度,如果并行度的值超过 BE 配置中的 `max_send_batch_parallelism_per_job`,那么作为协调点的 BE 将使用 `max_send_batch_parallelism_per_job` 的值。 -22. hidden_columns: 用于指定导入数据中包含的隐藏列,在Header中不包含columns时生效,多个hidden column用逗号分割。 +22. hidden_columns: 用于指定导入数据中包含的隐藏列,在Header中不包含columns时生效,多个hidden column用逗号分割。 + ``` - hidden_columns: __DORIS_DELETE_SIGN__,__DORIS_SEQUENCE_COL__ - 系统会使用用户指定的数据导入数据。在上述用例中,导入数据中最后一列数据为__DORIS_SEQUENCE_COL__。 - ``` + hidden_columns: __DORIS_DELETE_SIGN__,__DORIS_SEQUENCE_COL__ + 系统会使用用户指定的数据导入数据。在上述用例中,导入数据中最后一列数据为__DORIS_SEQUENCE_COL__。 + ``` + 23. load_to_single_tablet: 布尔类型,为true表示支持一个任务只导入数据到对应分区的一个 tablet,默认值为 false,该参数只允许在对带有 random 分区的 olap 表导数的时候设置。 RETURN VALUES diff --git a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Manipulation-Statements/Manipulation/DELETE.md b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Manipulation-Statements/Manipulation/DELETE.md index e02b671bb7..998fe38421 100644 --- a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Manipulation-Statements/Manipulation/DELETE.md +++ b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Manipulation-Statements/Manipulation/DELETE.md @@ -49,7 +49,7 @@ column_name1 op { value | value_list } [ AND column_name2 op { value | value_lis 2. 使用聚合类的表模型(AGGREGATE、UNIQUE)只能指定 key 列上的条件。 3. 当选定的 key 列不存在于某个 rollup 中时,无法进行 delete。 4. 条件之间只能是“与”的关系。若希望达成“或”的关系,需要将条件分写在两个 DELETE 语句中。 -5. 如果为分区表,需要指定分区,如果不指定,doris 会从条件中推断出分区。两种情况下,doris 无法从条件中推断出分区: 1) 条件中不包含分区列;2) 分区列的 op 为 not in。当分区表未指定分区,或者无法从条件中推断分区的时候,需要设置会话变量 delete_without_partition 为 true,此时 delete 会应用到所有分区。 +5. 如果为分区表,需要指定分区,如果不指定,doris 会从条件中推断出分区。两种情况下,doris 无法从条件中推断出分区: 1) 条件中不包含分区列;2) 分区列的 op 为 not in。当分区表未指定分区,或者无法从条件中推断分区的时候,需要设置会话变量 delete_without_partition 为 true,此时 delete 会应用到所有分区。 注意: 1. 该语句可能会降低执行后一段时间内的查询效率。 diff --git a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Manipulation-Statements/OUTFILE.md b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Manipulation-Statements/OUTFILE.md index bcf9bf635b..82f8ecec33 100644 --- a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Manipulation-Statements/OUTFILE.md +++ b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Manipulation-Statements/OUTFILE.md @@ -63,6 +63,8 @@ INTO OUTFILE "file_path" ``` 指定导出格式. 支持 CSV、PARQUET、CSV_WITH_NAMES、CSV_WITH_NAMES_AND_TYPES、ORC. 默认为 CSV。 + + > 注:PARQUET、CSV_WITH_NAMES、CSV_WITH_NAMES_AND_TYPES、ORC 在 1.2 版本开始支持。 3. properties diff --git a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Types/ARRAY.md b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Types/ARRAY.md index 699d0ba9e4..7507aea1c3 100644 --- a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Types/ARRAY.md +++ b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Types/ARRAY.md @@ -26,6 +26,14 @@ under the License. ## ARRAY +### name + + + +ARRAY + + + ### description `ARRAY` diff --git a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Types/DATETIMEV2.md b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Types/DATETIMEV2.md index 6a70352418..f4fcfc9e77 100644 --- a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Types/DATETIMEV2.md +++ b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Types/DATETIMEV2.md @@ -25,13 +25,22 @@ under the License. --> ## DATETIMEV2 + + + +DATATIMEV2 + + + ### description + DATETIMEV2([P]) 日期时间类型,可选参数P表示时间精度,取值范围是[0, 6],即最多支持6位小数(微秒)。不设置时为0。 取值范围是['0000-01-01 00:00:00[.000000]', '9999-12-31 23:59:59[.999999]']. 打印的形式是'YYYY-MM-DD HH:MM:SS.ffffff' ### note + 相比DATETIME类型,DATETIMEV2更加高效,并且支持了最多到微秒的时间精度。 ### keywords diff --git a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Types/DATEV2.md b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Types/DATEV2.md index e78a0cc9f7..0a3f2505b4 100644 --- a/docs/zh-CN/docs/sql-manual/sql-reference/Data-Types/DATEV2.md +++ b/docs/zh-CN/docs/sql-manual/sql-reference/Data-Types/DATEV2.md @@ -25,6 +25,15 @@ under the License. --> ## DATEV2 + +### name + + + +DATAV2 + + + ### description DATEV2类型 日期类型,目前的取值范围是['0000-01-01', '9999-12-31'], 默认的打印形式是'YYYY-MM-DD' diff --git a/docs/zh-CN/docs/sql-manual/sql-reference/Database-Administration-Statements/ADMIN-CANCEL-REBALANCE-DISK.md b/docs/zh-CN/docs/sql-manual/sql-reference/Database-Administration-Statements/ADMIN-CANCEL-REBALANCE-DISK.md index 4ddf546c25..80260e7ac4 100644 --- a/docs/zh-CN/docs/sql-manual/sql-reference/Database-Administration-Statements/ADMIN-CANCEL-REBALANCE-DISK.md +++ b/docs/zh-CN/docs/sql-manual/sql-reference/Database-Administration-Statements/ADMIN-CANCEL-REBALANCE-DISK.md @@ -24,12 +24,14 @@ under the License. ## ADMIN-CANCEL-REBALANCE-DISK - - ### Name + + ADMIN CANCEL REBALANCE DISK + + ### Description 该语句用于取消优先均衡BE的磁盘 @@ -58,4 +60,3 @@ ADMIN CANCEL REBALANCE DISK ### Best Practice - diff --git a/docs/zh-CN/docs/sql-manual/sql-reference/Database-Administration-Statements/ADMIN-REBALANCE-DISK.md b/docs/zh-CN/docs/sql-manual/sql-reference/Database-Administration-Statements/ADMIN-REBALANCE-DISK.md index 1966bc1fba..ede1bac576 100644 --- a/docs/zh-CN/docs/sql-manual/sql-reference/Database-Administration-Statements/ADMIN-REBALANCE-DISK.md +++ b/docs/zh-CN/docs/sql-manual/sql-reference/Database-Administration-Statements/ADMIN-REBALANCE-DISK.md @@ -24,12 +24,14 @@ under the License. ## ADMIN-REBALANCE-DISK - - ### Name + + ADMIN REBALANCE DISK + + ### Description 该语句用于尝试优先均衡指定的BE磁盘数据 @@ -66,5 +68,3 @@ ADMIN REBALANCE DISK ### Best Practice - - diff --git a/docs/zh-CN/docs/sql-manual/sql-reference/Show-Statements/SHOW-CATALOG-RECYCLE-BIN.md b/docs/zh-CN/docs/sql-manual/sql-reference/Show-Statements/SHOW-CATALOG-RECYCLE-BIN.md index b379b4fb80..589da1ec6f 100644 --- a/docs/zh-CN/docs/sql-manual/sql-reference/Show-Statements/SHOW-CATALOG-RECYCLE-BIN.md +++ b/docs/zh-CN/docs/sql-manual/sql-reference/Show-Statements/SHOW-CATALOG-RECYCLE-BIN.md @@ -28,8 +28,12 @@ under the License. ### Name + + SHOW CATALOG RECYCLE BIN + + ### Description 该语句用于展示回收站中可回收的库,表或分区元数据信息 diff --git a/docs/zh-CN/docs/sql-manual/sql-reference/Show-Statements/SHOW-CATALOGS.md b/docs/zh-CN/docs/sql-manual/sql-reference/Show-Statements/SHOW-CATALOGS.md index 0dc838b020..174d90c4a2 100644 --- a/docs/zh-CN/docs/sql-manual/sql-reference/Show-Statements/SHOW-CATALOGS.md +++ b/docs/zh-CN/docs/sql-manual/sql-reference/Show-Statements/SHOW-CATALOGS.md @@ -28,8 +28,12 @@ under the License. ### Name + + SHOW CATALOGS + + ### Description 该语句用于显示已存在是数据目录(catalog)