E-MapReduce中引导操作安装使用Kylin

简介: 目前E-MapReduce的开源组件还未包含Kylin,下面介绍一种通过创建集群时设置的引导操作来完成集群上Kylin的部署。

        目前E-MapReduce的开源组件还未包含Kylin,下面介绍一种通过创建集群时设置的引导操作来完成集群上Kylin的部署。

1.引导操作shell脚本(kylin_bootstrap.sh)

入参:

参数名 取值 备注
regionId cn-hangzhou/cn-beijing 创建集群所在的regionId
isVpc 0/1 创建的是否是vpc集群
#!/bin/bash
regionId="$1"
isVpc=$2

echo $regionId
echo $isVpc
if [ ! $regionId ]; then
    regionId="cn-hangzhou"
fi

if [ ! $isVpc ]; then
    isVpc=0
fi

isMaster=`hostname --fqdn | grep emr-header-1`
masterIp=`cat /etc/hosts | grep emr-header-1 | awk '{print $1}'`

bucket=""
if [[ $regionId == "cn-hangzhou" ]]; then
    bucket="emr-agent-pack"
elif [[ $regionId == "cn-beijing" ]]; then
    bucket="emr-bj"
elif [[ $regionId == "cn-shanghai" ]]; then
    bucket="emr-public-shanghai"
elif [[ $regionId == "cn-shenzhen" ]]; then
    bucket="emr-public-shenzhen"
fi

kylinpackUrl="http://emr-agent-pack.oss-cn-hangzhou-int    ernal.aliyuncs.com/kylin/apache-kylin-1.6.0-hbase1.x-bin.tar.gz"
if [[ isVpc -eq 1 ]]; then
    kylinpackUrl="http://$bucket.vpc100-oss-$regionId.aliyuncs.com/kylin/apache-kylin-1.6.0-hbase1.x-bin.tar.gz"
else
    kylinpackUrl="http://$bucket.oss-$regionId-internal.aliyuncs.com/kylin/apache-kylin-1.6.0-hbase1.x-bin.tar.gz"
fi

cd /opt/apps
wget $kylinpackUrl
tar xvf apache-kylin-1.6.0-hbase1.x-bin.tar.gz
rm -rf /opt/apps/apache-kylin-1.6.0-hbase1.x-bin.tar.gz
chown -R hadoop:hadoop /opt/apps/apache-kylin-1.6.0-hbase1.x-bin

ln -s /opt/apps/apache-kylin-1.6.0-hbase1.x-bin /usr/lib/kylin-current
echo "export KYLIN_HOME=/usr/lib/kylin-current" >>/etc/profile.d/hadoop.sh
echo "export HIVE_CONF=/etc/emr/hive-conf" >>/etc/profile.d/hadoop.sh

echo "
if [ $isMaster ]; then
    sleep 5
    su -l hadoop -c '/opt/apps/apache-kylin-1.6.0-hbase1.x-bin/bin/kylin.sh start'
else
    echo 'slave no need to start kylin'
fi
" >/usr/local/emr/emr-bin/script/hive/after_start.sh

2.OSS存储kylin_bootstrap.sh

将1中的kylin_bootstrap.sh脚本上传到OSS中,创建集群的时候需要从OSS中选择

3.创建E-MapReduce集群(添加引导操作)

在E-MapReduce中创建集群(必须勾选HBase),在创建集群的基础配置页面,点击添加引导操作,选择2中OSS的kylin_bootstrap.sh脚本,并且根据需求填写可选参数(即1中介绍的脚本入参),如下图所示(在深圳region创建classic集群)
kylinbootstrap
)

4.验证

集群创建完成,状态显示为空闲后,打隧道到master节点,在浏览器中输http://localhost:7070/kylin , 查看Kylin是否正常。

备注
上述创建的Kylin是非HA,只有master上面一台Kylin的webserver。
如果需要多台,则可以在slave上面启动,需要做如下操作:
1). 修改kylin.properties 详见Kylin文档

kylin.rest.servers=emr-header-1:7070,emr-worker-1:7070,emr-worker-2:7070 //比如启动了三台
kylin.server.mode=all //只要有一台配置成all,其它配置成query

2). 在slave节点启动Kylin,并重启master节点的Kylin

sudo su hadoop
/usr/lib/kylin-current/bin/kylin.sh start

3). 配置SLB负载均衡

 通过阿里云的SLB负载均衡,将上述启动的所有Kylin的webserver进行负载均衡的配置,[详见SLB](https://help.aliyun.com/document_detail/27551.html?spm=5176.doc27552.6.561.90KCkd)
相关实践学习
数据湖构建DLF快速入门
本教程通过使⽤数据湖构建DLF产品对于淘宝用户行为样例数据的分析,介绍数据湖构建DLF产品的数据发现和数据探索功能。
快速掌握阿里云 E-MapReduce
E-MapReduce 是构建于阿里云 ECS 弹性虚拟机之上,利用开源大数据生态系统,包括 Hadoop、Spark、HBase,为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。 本课程主要介绍阿里云 E-MapReduce 的使用方法。
目录
相关文章
|
分布式计算 API 调度
Apache Oozie-- 实战操作--集成 hue& 调度 mapreduce 程序|学习笔记
快速学习Apache Oozie-- 实战操作--集成 hue& 调度 mapreduce 程序
143 0
Apache Oozie-- 实战操作--集成 hue& 调度 mapreduce 程序|学习笔记
|
分布式计算 Hadoop Java
Apache Oozie-- 实战操作--调度 mapreduce 程序|学习笔记
快速学习 Apache Oozie-- 实战操作--调度 mapreduce 程序
104 0
Apache Oozie-- 实战操作--调度 mapreduce 程序|学习笔记
|
分布式计算 NoSQL JavaScript
初识Mongodb之MapReduce操作篇
初识Mongodb之MapReduce操作篇
293 0
初识Mongodb之MapReduce操作篇
|
存储 分布式计算 分布式数据库
【HBase】(九)MapReduce 操作 Hbase
【HBase】(九)MapReduce 操作 Hbase
372 0
|
存储 SQL 运维
阿里云 E-MapReduce ClickHouse 操作指南 05 期 — 常见问题
阿里云 E-MapReduce(简称 EMR )是运行在阿里云平台上的一种大数据处理的系统解决方案。ClickHouse 作为开源的列式存储数据库,主要用于在线分析处理查询(OLAP),能够使用 SQL 查询实时生成分析数据报告。而阿里云 EMR ClickHouse 则提供了开源 OLAP 分析引擎 ClickHouse 的云上托管服务。
阿里云 E-MapReduce ClickHouse 操作指南 05 期 — 常见问题
|
消息中间件 分布式计算 关系型数据库
阿里云 E-MapReduce ClickHouse 操作指南 04 期 — 数据导入
阿里云 E-MapReduce(简称 EMR )是运行在阿里云平台上的一种大数据处理的系统解决方案。ClickHouse 作为开源的列式存储数据库,主要用于在线分析处理查询(OLAP),能够使用 SQL 查询实时生成分析数据报告。而阿里云 EMR ClickHouse 则提供了开源 OLAP 分析引擎 ClickHouse 的云上托管服务。
阿里云 E-MapReduce ClickHouse 操作指南 04 期 — 数据导入
|
存储 SQL XML
阿里云 E-MapReduce ClickHouse 操作指南 03 期 — ClickHouse 运维
阿里云 E-MapReduce(简称 EMR )是运行在阿里云平台上的一种大数据处理的系统解决方案。ClickHouse 作为开源的列式存储数据库,主要用于在线分析处理查询(OLAP),能够使用 SQL 查询实时生成分析数据报告。而阿里云 EMR ClickHouse 则提供了开源 OLAP 分析引擎 ClickHouse 的云上托管服务。
阿里云 E-MapReduce ClickHouse 操作指南 03 期 — ClickHouse 运维
|
存储 分布式计算 网络协议
阿里云 E-MapReduce ClickHouse 操作指南 02期 — 快速入门
阿里云 E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理的系统解决方案。ClickHouse 作为开源的列式存储数据库,主要用于在线分析处理查询(OLAP),能够使用 SQL 查询实时生成分析数据报告。而阿里云 EMR ClickHouse 则提供了开源 OLAP 分析引擎 ClickHouse 的云上托管服务。
阿里云 E-MapReduce ClickHouse 操作指南 02期 — 快速入门
|
存储 SQL 运维
阿里云 E-MapReduce ClickHouse 操作指南 01期 — ClickHouse 概述
阿里云 E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理的系统解决方案。ClickHouse 作为开源的列式存储数据库,主要用于在线分析处理查询(OLAP),能够使用 SQL 查询实时生成分析数据报告。而阿里云 EMR ClickHouse 则提供了开源 OLAP 分析引擎 ClickHouse 的云上托管服务。
阿里云 E-MapReduce ClickHouse 操作指南 01期 — ClickHouse 概述