DDL概述-阿里云开发者社区

DDL概述

2018-11-14 1492

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

实时计算 Flink 版，5000CU*H 3个月

简介：

语法

CREATE TABLE tableName
(columnName dataType [, columnName dataType ]*)
[ WITH (propertyName=propertyValue [, propertyName=propertyValue ]*) ];

说明

阿里云实时计算 Flink本身不带有数据存储功能，因此所有涉及表创建DDL的操作,实际上均是对于外部数据表、存储的引用声明。例如下列操作。

create table tt_stream(
a varchar,
b varchar,
c varchar
) with (
type='datahub',
topic='blink_tt_test',
accessId='06xxxxxxxxx',
accessKey='a6xxxxxxxxxxxxxxxxxxxxxxxxxx'
);

此处并非是在实时计算Flink SQL中创建一个DataHub的Topic，而是声明了一个名称为tt_stream的表引用。下游所有对这张Topic相关的DML操作均可以使用tt_stream别名来进行操作。

实时计算对于声明表的作用域是在当前作业(一个SQL文件提交后生成一个实时计算作业)，即上述有关tt_stream的声明仅在当前SQL有效。在同一个Project下的其他SQL文件同样可以声明名称为tt_stream的表。
按照SQL标准定义，DDL语法中关键字、表名、列名等不区分大小写。
表名、列名必须以字母或者数字开头，并且名称中只能包含字母、数字、下划线。
DDL声明不完全根据名称进行映射（取决于上游插件的性质）。如果插件支持根据key取值(如DataHub)，则不要求字段个数完全一致。但名称需要一致。如果上游插件不支持根据key取值（如TT），则对字段数量和顺序有严格要求。实时计算建议您引用声明的字段名称、个数和外部表一致，避免出现定义混乱导致数据错乱的情况。
因此，我们推荐名称、列数、顺序完全一致。

字段映射

根据外部数据源是否有Schema分为两大类别。

顺序映射

适用于以TT、MetaQ为代表的不带有Schema系统。这类系统通常是非结构化存储系统。推荐的操作是，您可以在DDL SQL声明中对字段名称进行自定义，但需按照外部表字段的类型、列数进行对齐。

以TT为例，TT的一条记录格式：

asavfa,sddd32,sdfdsv

示例，TT的字段名按照命名规范来设置。

create table tt_stream(
a varchar,
b varchar,
c varchar
) with (
type='tt',
topic='blink_tt_test',
accessId='0622XXXXXX',
accessKey='a62cfe8XXXXXXXXX'
);

名称映射

适用于以DataHub、TDDL为代表的带有Schema的系统。这类系统在表存储级别定义了字段名称以及字段类型。推荐您在Flink SQL中严格按照外部数据存储Schema进行定义，包括名称、列数、顺序完全一致。

注意：
如果外部数据存储的字段名称是大小写敏感类型（例如OTS），则在流计算SQL中需要在区分大小写的字段名称处使用‘｀’进行转换。以DataHub为例，在DDL语法中，声明字段名和目标表的字段名需要名称完全一致。

Datahub定义的Schema如下:

字段名	类型
name	varchar
age	bigint
value	varchar

我们推荐用户将所有列进行声明引用，注意可以少字段，不可以多字段。针对上述DataHub声明的DDL如下:

create table stream_result (
name varchar,
age bigint,
value varchar
) with (
type='datahub',
endpoint='http://dh-cn-hangzhou.aliyuncs.com',
accessId='xxxxxx',
accessKey='xxxxxxxxxxxxxxxxxxxxxxxxxxxx',
project='project',
topic='topic'
);

处理大小写敏感

SQL标准定义中，大小写是不敏感的，例如:

create table stream_result (
name varchar,
value varchar
);

和下列语句含义一致：

create table STREAM_RESULT (
NAME varchar,
VALUE varchar
);

但实时计算引用的大量外部数据源，可能要求大小写敏感。例如，TableStore对于大小写是敏感的。如果在TableStore定义了一个NAME的大写字段，我们应该如下定义:

create table STREAM_RESULT (
`NAME` varchar,
`VALUE` varchar
);

在之后所有的DML操作中，对于这个字段引用均需要添加反引号，例如:

INSERT INTO xxx
SELECT
`NAME`,
`VALUE`
FROM
XXX;

本文转自实时计算——DDL概述

DDL概述

语法

说明

字段映射

顺序映射

名称映射

处理大小写敏感

热门文章

最新文章

相关课程

相关电子书

相关实验场景