[typo](docs) fix err to dynamic schema table doc (#19380)

This commit is contained in:
yongkang.zhong
2023-05-08 16:35:57 +08:00
committed by GitHub
parent 4a65f8cad9
commit bc1bf420d1
2 changed files with 10 additions and 23 deletions

View File

@ -1,6 +1,6 @@
---
{
"title": "[Experimental] Dynamie schema table",
"title": "Dynamic schema table",
"language": "en"
}
---
@ -24,14 +24,7 @@ specific language governing permissions and limitations
under the License.
-->
# Dynamic Table
<version since="2.0.0">
Dynamic Table
</version>
<version since="2.0.0"></version>
A dynamic schema table is a special kind of table which schema expands automatically with the import procedure. Currently, this feature is mainly used for importing semi-structured data such as JSON. Because JSON is self-describing, we can extract the schema information from the original document and infer the final type information. This special table can reduce manual schema change operations and easily import semi-structured data and automatically expand its schema.
@ -132,4 +125,4 @@ For types that cannot be unified, such as:
{"id" : [123]}
{"id" : 123}
-- Importing will result in an error."
```
```

View File

@ -1,6 +1,6 @@
---
{
"title": "动态schema表",
"title": "动态 Schema 表",
"language": "zh-CN"
}
---
@ -24,18 +24,12 @@ specific language governing permissions and limitations
under the License.
-->
# 动态表
<version since="2.0.0"></version>
<version since="2.0.0">
动态表
</version>
动态schema表是一种特殊的表,其schema随着导入自动进行扩展。目前该功能,主要用于半结构数据,例如JSON等的导入、自动列生成。因为JSON是类型自描述的,所以我们可以从原始文档中提取schema信息,推断最终类型信息。这种特殊的表可以减少人工schema change的操作,并轻松导入半结构数据并自动扩展其schema。
动态 Schema 表是一种特殊的表,其 Schema 随着导入自动进行扩展。目前该功能,主要用于半结构数据,例如 JSON 等的导入、自动列生成。因为 JSON 是类型自描述的,所以我们可以从原始文档中提取 Schema 信息,推断最终类型信息。这种特殊的表可以减少人工 Schema Change 的操作,并轻松导入半结构数据并自动扩展其 Schema。
## 名词解释
- schema change, 改变表的结构, 例如增加列、减少列, 修改列类型
- Schema Change, 改变表的结构, 例如增加列、减少列, 修改列类型
- 静态列, 在建表时指定的列, 例如分区列、主键列
- 动态列, 随着导入自动识别并增加的列
@ -111,16 +105,16 @@ curl -X PUT -T example_batch.json --location-trusted -u root: -H "read_json_by_l
-- 指定 -H "strip_outer_array:true", 整个文件当做一个JSON array解析, array中的每个元素是一行, 解析效率更高效
curl -X PUT -T example_batch_array.json --location-trusted -u root: -H "strip_outer_array:true" -H "format:json" http://127.0.0.1:8147/api/regression_test_dynamic_table/test_dynamic_table/_stream_load
```
对于dynamic table, 你也可以使用S3load或者Routine load, 使用方式类似
对于 Dynamic Table, 你也可以使用 S3 Load 或者 Routine Load, 使用方式类似
## 对动态列增加索引
```sql
-- 将在titile列上新建倒排索引, 并按照english分词
-- 将在 titile 列上新建倒排索引, 并按照english分词
CREATE INDEX title_idx ON test_dynamic_table (`title`) using inverted PROPERTIES("parser"="english")
```
## 类型冲突
在第一批导入会自动推断出统一的类型, 并以此作为最终的Column类型,所以建议保持Column类型的一致, 例如
在第一批导入会自动推断出统一的类型, 并以此作为最终的 Column 类型,所以建议保持 Column 类型的一致, 例如
```
{"id" : 123}
{"id" : "123"}