Files
oceanbase/docs/docs-cn/7.developer-guide-1/4.create-and-manage-database-objects/2.create-and-manage-tables/2.create-a-table-1.md
2022-02-10 14:51:49 +08:00

9.6 KiB

创建表

可以通过执行 DDL 语句 CREATE TABLE 来创建一个表。

使用 CREATE TABLE 语句建表

  • 下面示例使用 CREATE TABLE 语句创建订单表 ware 和 cust 表。
obclient> create table ware(w_id int
   , w_ytd decimal(12,2)
    , w_tax decimal(4,4)
    , w_name varchar(10)
    , w_street_1 varchar(20)
    , w_street_2 varchar(20)
    , w_city varchar(20)
    , w_state char(2)
    , w_zip char(9)
    , unique(w_name, w_city)
    , primary key(w_id)
    );
Query OK, 0 rows affected (0.06 sec)

obclient> create table cust (c_w_id int NOT NULL
     , c_d_id int NOT null
     , c_id int NOT null
     , c_discount decimal(4, 4)
     , c_credit char(2)
     , c_last varchar(16)
     , c_first varchar(16)
     , c_middle char(2)
     , c_balance decimal(12, 2)
     , c_ytd_payment decimal(12, 2)
     , c_payment_cnt int
     , c_credit_lim decimal(12, 2)
     , c_street_1 varchar(20)
     , c_street_2 varchar(20)
     , c_city varchar(20)
     , c_state char(2)
     , c_zip char(9)
     , c_phone char(16)
     , c_since date
     , c_delivery_cnt int
     , c_data varchar(500)
     , index icust(c_last, c_d_id, c_w_id, c_first, c_id)
     , FOREIGN KEY (c_w_id) REFERENCES ware(w_id)
     , primary key (c_w_id, c_d_id, c_id)
     );
Query OK, 0 rows affected (0.06 sec)

说明

由于 ALTER TABLE 语法不支持后期增加主键,所以需要在建表的时候设置主键。

使用 CREATE TABLE 复制表数据

在 MySQL 租户里,可以使用 CREATE TABLE AS SELECT 复制表的数据,但是结构并不完全一致,会丢失约束、索引、默认值、分区等信息。使用 CREATE TABLE LIKE 可以复制表结构,但是不包括数据。

  • 示例:MySQL 租户的 CREATE TABLE 复制表结构和数据的区别
obclient> create table t1(
    id bigint not null primary KEY
    , name varchar(50) not NULL
    , gmt_create timestamp not null default current_timestamp
) partition by hash(id) partitions 8;
Query OK, 0 rows affected (0.10 sec)

obclient> insert into t1(id,name) values(1,'A'),(2,'B'),(3,'C');
Query OK, 3 rows affected (0.03 sec)
Records: 3  Duplicates: 0  Warnings: 0

obclient> create table t1_like like t1;
Query OK, 0 rows affected (0.11 sec)

obclient> create table t1_copy as select * from t1;
Query OK, 3 rows affected (0.12 sec)

obclient> show create table t1_like\G
*************************** 1. row ***************************
       Table: t1_like
Create Table: CREATE TABLE `t1_like` (
  `id` bigint(20) NOT NULL,
  `name` varchar(50) NOT NULL,
  `gmt_create` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP,
  PRIMARY KEY (`id`)
) DEFAULT CHARSET = utf8mb4 ROW_FORMAT = DYNAMIC COMPRESSION = 'zstd_1.0' REPLICA_NUM = 3 BLOCK_SIZE = 16384 USE_BLOOM_FILTER = FALSE TABLET_SIZE = 134217728 PCTFREE = 10 PROGRESSIVE_MERGE_NUM = 2
 partition by hash(id)
(partition p0,
partition p1,
partition p2,
partition p3,
partition p4,
partition p5,
partition p6,
partition p7)
1 row in set (0.02 sec)

obclient> show create table t1_copy\G
*************************** 1. row ***************************
       Table: t1_copy
Create Table: CREATE TABLE `t1_copy` (
  `id` bigint(20) DEFAULT NULL,
  `name` varchar(50) DEFAULT NULL,
  `gmt_create` timestamp NULL DEFAULT NULL
) DEFAULT CHARSET = utf8mb4 ROW_FORMAT = DYNAMIC COMPRESSION = 'zstd_1.0' REPLICA_NUM = 3 BLOCK_SIZE = 16384 USE_BLOOM_FILTER = FALSE TABLET_SIZE = 134217728 PCTFREE = 10
1 row in set (0.00 sec)

obclient> show create table t1\G
*************************** 1. row ***************************
       Table: t1
Create Table: CREATE TABLE `t1` (
  `id` bigint(20) NOT NULL,
  `name` varchar(50) NOT NULL,
  `gmt_create` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP,
  PRIMARY KEY (`id`)
) DEFAULT CHARSET = utf8mb4 ROW_FORMAT = DYNAMIC COMPRESSION = 'zstd_1.0' REPLICA_NUM = 3 BLOCK_SIZE = 16384 USE_BLOOM_FILTER = FALSE TABLET_SIZE = 134217728 PCTFREE = 10 PROGRESSIVE_MERGE_NUM = 2
 partition by hash(id)
(partition p0,
partition p1,
partition p2,
partition p3,
partition p4,
partition p5,
partition p6,
partition p7)
1 row in set (0.01 sec)

关于表和分区

在 OceanBase 数据库中,数据存储在表中,而数据表示的最小粒度是分区。普通的非分区表,就只有一个分区;而分区表,通常有多个分区,分区名默认以 p 开头,按数字顺序从 0 开始编号。所以分区是表的子集。

通常分区对用户的应用是透明的,应用只需要使用 SQL 读写表即可。只有某些场景下,为了提升分区表的查询性能,应用也可以使用 SQL 直接访问某个具体的分区,SQL 语法格式是:

SELECT ... FROM parted_table PARTITION (pN) WHERE query_condition ;
  • 示例:通过 SQL 直接访问分区表的分区
obclient> select o_id,o_c_id,o_carrier_id,o_ol_cnt,o_all_local,o_entry_d from ordr partition (p1) where o_w_id=1 and o_d_id=2 and o_id=2100;
+------+--------+--------------+----------+-------------+------------+
| o_id | o_c_id | o_carrier_id | o_ol_cnt | o_all_local | o_entry_d  |
+------+--------+--------------+----------+-------------+------------+
| 2100 |      8 |            8 |       11 |           1 | 2020-02-15 |
+------+--------+--------------+----------+-------------+------------+
1 row in set (0.01 sec)

obclient> select ol_o_id, ol_number,ol_delivery_d,ol_amount,ol_i_id,ol_supply_w_id,ol_quantity from ordl partition (p1) where ol_w_id=1 and ol_d_id=2 and ol_o_id=2100;
+---------+-----------+---------------+-----------+---------+----------------+-------------+
| ol_o_id | ol_number | ol_delivery_d | ol_amount | ol_i_id | ol_supply_w_id | ol_quantity |
+---------+-----------+---------------+-----------+---------+----------------+-------------+
|    2100 |         1 | 2020-02-15    |      0.00 |   87133 |              1 |           5 |
|    2100 |         2 | 2020-02-15    |      0.00 |   47413 |              1 |           5 |
|    2100 |         3 | 2020-02-15    |      0.00 |    9115 |              1 |           5 |
|    2100 |         4 | 2020-02-15    |      0.00 |   42985 |              1 |           5 |
|    2100 |         5 | 2020-02-15    |      0.00 |   43621 |              1 |           5 |
|    2100 |         6 | 2020-02-15    |      0.00 |    5787 |              1 |           5 |
|    2100 |         7 | 2020-02-15    |      0.00 |   62576 |              1 |           5 |
|    2100 |         8 | 2020-02-15    |      0.00 |   91592 |              1 |           5 |
|    2100 |         9 | 2020-02-15    |      0.00 |   34452 |              1 |           5 |
|    2100 |        10 | 2020-02-15    |      0.00 |   13792 |              1 |           5 |
|    2100 |        11 | 2020-02-15    |      0.00 |   94326 |              1 |           5 |
+---------+-----------+---------------+-----------+---------+----------------+-------------+
11 rows in set (0.01 sec)

说明

如果是组合分区,可以访问更细粒度的分区,详细描述请参考"分区路由"章节。

在 OceanBase 数据库里,节点间的数据迁移的最小粒度是分区,每个分区在集群里有三个副本,内容保持同步,角色上有区分。三副本会有一个主副本(Leader 副本)和两个备副本(Follower 副本),只有主副本可以提供写服务,默认也只有主副本可以提供读服务。主副本上的事务提交时会将事务日志同步到两个备副本,三副本使用 Paxos 协议表决事务是否提交成功。有时候为了不影响主副本,可以让备副本承担部分读请求,这就是应用常用的读写分离的解决方案,这种读备称为 弱一致性读 。使用这种方案,应用读需要承担读延时的风险,这个延时最大允许值会通过参数(max_stale_time_for_weak_consistency)控制。

  • 示例:使用 SQL Hint 实现读写分离。

弱一致读的 Hint 语法是 /*+ read_consistency(weak) */ 。通常的读默认是强一致性读,就不用 Hint 了。

obclient> select /*+ read_consistency(weak) */ o_id,o_c_id,o_carrier_id,o_ol_cnt,o_all_local,o_entry_d from ordr where o_w_id=1 and o_d_id=2 and o_id=2100;
+------+--------+--------------+----------+-------------+------------+
| o_id | o_c_id | o_carrier_id | o_ol_cnt | o_all_local | o_entry_d  |
+------+--------+--------------+----------+-------------+------------+
| 2100 |      8 |            8 |       11 |           1 | 2020-02-15 |
+------+--------+--------------+----------+-------------+------------+
1 row in set (0.00 sec)

复制表

复制表是分布式数据库 OceanBase 的高级优化手段。

通常 OceanBase 集群是三副本架构,默认每个表的每个分区在 OceanBase 中会有三个副本数据,角色上分为一个主副本(Leader 副本)和两个备副本(Follower副本),默认提供读写服务的是主副本。

复制表可以指定在租户的每台机器上都有一个备副本,并且主副本跟所有备份的数据使用全同步策略保持强同步。这样做的目的是为了让业务有些 SQL 关联查询时能在同一节点内部执行,以获取更好的性能。

复制表的语法是在 CREATE TABLE 语句后增加 DUPLICATE_SCOPE 选项。

  • 示例:创建复制表。
obclient> create table item (i_id int
     , i_name varchar(24)
     , i_price decimal(5,2)
     , i_data varchar(50)
     , i_im_id int
     , primary key(i_id))  pctfree=0 BLOCK_SIZE=16384
      duplicate_scope='cluster' locality='F@zone1,F@zone2,R{all_server}@zone3' primary_zone='zone1';
Query OK, 0 rows affected (0.06 sec)