自建Hive数据仓库跨版本迁移到阿里云Databricks数据洞察
自建Hive数据仓库跨版本迁移到阿里云Databricks数据洞察
场景描述 客户在IDC或者公有云环境自建Hadoop集群构建数据仓库和分析系统,购买阿里云Databricks数据洞察集群之后,涉及到数仓数据和元数据的迁移以及Hive版本的订正更新。 方案优势 1. 全托管Spark集群免运维,节省人力成本。 2. Databricks数据洞察与阿里云其他产品(OSS、RDS、MaxCompute、EMR)进行深度整合,支持以这些产品为数据源的输入和输出。 3. 使用Databricks Runtime商业版引擎相比开源Spark性能有3-5倍的提升。 解决问题 1. Hive数仓数据迁移OSS方案。 2. Hive元数据库迁移阿里云RDS方案。 3. Hive跨版本迁移到Databricks数据洞察使用Delta表查询以提高查询效率。
拥有已经通过备案的域名 开通 ECS、OSS、Databricks数据洞察、RDS和 VPN网关等服务。文档版本:20210425 1 自建 Hive数据仓库跨版本迁移到阿里云 Databricks数据洞察 资源规划说明 资源规划说明 本方案仅作为实践演练使用,在生产环境中执行时请结合业务系统实际架构进行 调整。本方案购买的所有云产品规格均为演示需要,请...
来自: 最佳实践 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,文件存储HDFS,spark
自建Hive数仓迁移到阿里云EMR
自建Hive数仓迁移到阿里云EMR
场景描述 客户在IDC或者公有云环境自建Hadoop集群构 建数据仓库和分析系统,购买阿里云EMR集群之 后,涉及到将数据仓库和Hive元数据的数据库迁 移上云。目前主流Hive数据仓库迁移场景为1.x 版本迁移到阿里云EMR(Hive2.x版本),涉及到 数据订正更新步骤。 解决的问题 Hive数据仓库的数据迁移方案 Hive元数据库的迁移方案 Hive跨版本迁移后的数据订正 产品列表 E-MapReduce,VPC,ECS,OSS,VPN网关。
敬海、游士 审阅人 关、期会、游圣 文档变更记录 版本编号 日期 作者 审核人 说明 V1.0 2019-12-20 云魁 关、期会、游圣 创建 V1.1 2019-12-25 筱晖 云魁 文档优化 V1.2 2020-01-09 云魁、关 增加附录 使用 CADT创 V1.3 2021-07-21 游士 建资源,更新部 分命令 文档版本:20210721 I 自建Hive数据仓库跨版本迁移...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,VPN网关,E-MapReduce,云速搭
自建Hadoop迁移到阿里云EMR
自建Hadoop迁移到阿里云EMR
场景描述 场景1:自建Hadoop集群数据(HDFS)迁移到 阿里云EMR集群的HDFS文件系统; 场景2:自建Hadoop集群数据(HDFS)迁移到 计算存储分离架构的阿里云EMR集群,以OSS 和JindoFS作为EMR集群的后端存储。 解决的问题 客户自建Hadoop迁移到阿里云EMR集群的 技术方案; 基于IPSecVPN隧道构建安全和低成本数据 传输链路 产品列表 E-MapReduce,VPC,ECS,OSS,VPN网关。
在 EMR集群的 master节点进行大量数据迁移 步骤1 在 4.3节验证了少量数据的迁移,我们选择另一个较大数据量的文件夹进行迁移,本 实 践 方 案 中 以 源 Hadoop 集 群 中 如 下 为 例 进 行 演 示/usr/dfs/data/flume/kafka/20191113,在您进行演练时,请以实际环境为准。步骤2 参考 4.3节步骤 3启动数据迁移任务,将...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,VPN网关,E-MapReduce,云速搭
CDH迁移升级CDP最佳实践
CDH迁移升级CDP最佳实践
当前 CDH 免费版停止下载,终止服务,针对需要企业版服务能力并且CDH 升级过程对业务影响较小的客户,通过安装新的 CDP 集群,将现有数据拷贝至新集群,然后将新集群切换为生产集群,升级过程没有数据丢失风险,停机时间较短,适合大部分互联网客户升级使用。
该 authz_export.tar.gz 文件包含一个为 jar 文件和目录的配置。它还有一 个 authz_export.sh文件。该配置 目录包含可用于参考的默认配置。目录结构如下:Jars Config Authz_export.sh 使用源集群中的 sentry 服务器的 sentry 运行目录中的配置文件替换上述解压的 sentry-site.xml 和 core-site.xml文件。sentry的运行...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云速搭
Spring Cloud Netflix应用迁移EDAS
Spring Cloud Netflix应用迁移EDAS
场景描述 Spring Cloud Netflix微服务应用迁移到EDAS 服务(SpringCloud Alibaba云版本)的方法, 迁移后充分利用阿里云监控、调用链、限流降级 等能力,优化应用生命周期管理。 解决问题 1.帮助自建SpringCloudNetflix微服务应用 通过简单修改迁移到阿里云企业级分布式 应用服务(EDAS)平台。 2.迁移到EDAS后,简化应用的运维,提升监 控、调用链探测、限流降级等管理能力,提 高对应用的全生命周期管理。 产品列表 企业级分布式应用服务(EDAS) 负载均衡(SLB) 专有网络(VPC) 云服务器(ECS)
use piggymetrics 在 mongo命令行,执行如下 PiggyMetrics项目的模块 MongoDB的 account-service-dump.js中的脚本。文档版本:20200106 25 Spring Cloud Netflix应用迁移 EDAS 搭建线下微服务应用环境 db.accounts.update({"_id":"demo"},{"_id":"demo","lastSeen":new Date(),"note":"demo note","expenses":[{"amount":...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,负载均衡 SLB,企业级分布式应用服务 EDAS
EMR集群安全认证和授权管理 
EMR集群安全认证和授权管理 
场景描述 阿里云EMR服务Kafka和Hadoop安全集群使 用Kerberos进行用户安全认证,通过Apache Ranger服务进行访问授权管理。本最佳实践中以 Apache Web服务器日志为例,演示基于Kafka 和Hadoop的生态组件构建日志大数据仓库,并 介绍在整个数据流程中,如何通过Kerberos和 Ranger进行认证和授权的相关配置。 解决问题 1.创建基于Kerberos的EMR Kafka和 Hadoop集群。 2.EMR服务的Kafka和Hadoop集群中 Kerberos相关配置和使用方法。 3.Ranger中添加Kafka、HDFS、Hive和 Hbase服务和访问策略。 4.Flume中和Kafka、HDFS相关的安全配 置。 产品列表:E-MapReduce、专有网络VPC、云服务器ECS、云数据库RDS版
该关系的值是该特定主机或 域的 Kerberos 领 称。主 机 名 和 应 小 写。详见:https://web.mit.edu/kerberos/krb5-1.4/krb5-1.4.1/doc/krb5- admin/domain_realm.html [capaths]为了执行直接(非分层)跨领域身份验证,需要一个数据库来构造领域 之间的 身份 验 证路径,本节用于定 义该 数 据库。详见:...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云数据库RDS MySQL 版,E-MapReduce
容器跨可用区高可用
容器跨可用区高可用
场景描述 本实践适合使用容器服务ACK结合阿里云上的 其他产品构建跨可用区高可用应用的场景。在一 开始创建容器服务ACK的时候就把容器集群建 成多个可用区的架构,某可用区挂掉后,不影响 应用和集群的高可用。容器服务ACK通常配合 高可用SLB,RDS,Redis等产品,实现跨可用 区高可用。 解决问题 1.利用容器服务ACK搭建跨可用区高可用 的应用 2.容器服务ACK结合SLB,RDS,REDIS构 建高可用应用 产品列表 容器服务ACK RDSforMysql版 云数据库Redis版 文件存储NAS
文档版本:20220622 51 容器跨可用区高可用最佳实践 部署 wordpress应用 图中图片的文件名称是 flower.jpg.:步骤14 登录容器的终端查看 步骤15 登录后,发现如下:可以看到,图片已经存放在了“wp-content/uploads”目录下,wordpress默认按照图 片上传的“年/月”为目录名称,保存图片,这里是/2022/01目录。文档版本:...
来自: 最佳实践 | 相关产品:云服务器ECS,云数据库RDS MySQL 版,文件存储NAS,容器服务 ACK,云数据库 Redis 版,云速搭CADT
基于湖仓一体架构使用MaxCompute对OSS湖数据分析预测
基于湖仓一体架构使用MaxCompute对OSS湖数据分析预测
本篇最佳实践先创建EMR集群作为数据湖对象,Hive元数据存储在DLF,外表数据存储在OSS。然后使用阿里云数据仓库MaxCompute以创建外部项目的方式与存储在DLF的元数据库映射打通,实现元数据统一。最后通过一个毒蘑菇的训练和预测demo,演示云数仓MaxCompute如何对于存储在EMR数据湖的数据进行加工处理以达到业务预期。
参数说明 1.endpoint:必须是DLF的跨域域名或者internal域名,具体的可提工单咨询(后 续会提供公网link参考)2.ramRoleArn:如果MaxCompute和DLF是同一账号下且已完成一键授权,则此 参数省略。本例就是省略此参数。若是跨账号授权或者自定义授权请参考附录A 3.ossEndpoint:指定与DLF同地域的OSS内网endpoint。请参考 ...
来自: 最佳实践 | 相关产品:对象存储 OSS,E-MapReduce,DataWorks,大数据计算服务 MaxCompute,API网关,数据湖构建,云速搭
数据湖-在线学习场景数据分析
数据湖-在线学习场景数据分析
场景描述 本场景以在线教育中一个答题闯关类的应用为 例,使用WebServer来模拟演示这类日志数据 的分析处理。通过Nginx和Pythonflask搭建 WebServer,模拟应用中的关键页面,比如登 录、课程内容等,之后构造若干用户使用的模拟 日志数据,投递到数据湖进行分析后获取应用 PV、UV、课程内容访问排行、平均得分等等。 解决问题 基于数据湖(EMR+OSS)搭建大数据平台。 EMR和OSS使用和配置。 数据统一存储到OSS。 产品列表 E-MapReduce 对象存储OSS 云服务器ECS 访问控制RAM 专有网络VPC
user_id={user 8 课程_id} 代表id为8的用户查看了3号 题目 步骤2 源代码位于附件中,下载后目录如下图:app153-server目录下为后端程序,整个目录拷贝到APP服务器(即2.1章节中创建 的ECS服务器)的/home下,如下图:文档版本:20200331 33数据湖-在线学习场景数据分析 应用场景 app153-web目录下为前端程序,将目录目录...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,访问控制,E-MapReduce
新零售商超基于Serverless服务化改造
新零售商超基于Serverless服务化改造
某零售商超行业龙头企业,主要业务涵盖购物中心、大卖场、综合超市、标准超市、精品超市、便利店、无人值守智慧商店等零售业态,涉及全渠道零售、仓储物流、餐饮、消费服务、数据服务、金融业务、跨境贸易等领域。为了持续支持业务高速且稳定地发展,其在快速上云后,将核心业务改造为全Serverless架构的中台模式,采用函数计算 + API网关 + 表格存储OTS 作为计算网络存储核心,弹性支撑日常和大促峰谷所需资源,轻松支撑618/双11/双12大促。 核心价值 l 全 Serverless 架构:FC + API 网关 + OTS Serverless 解决方案。 l 弹性高可用:毫秒级弹性扩容、充足的资源池水位、跨可用区高可用。 l 敏捷开发免运维:函数式极简编程可专注于业务创新,无采购和部署成本、提供监控报警等完备的可观测能力。
文档版本:20210519 34 新零售商超基于 Serverless服务化改造 架构环境搭建 步骤7 上线后,可访问 API网关提供的二级域名,该二级域名仅供测试使用,客户端直接调 用时会有每天 1000次访问限制。建议为分组绑定独立域名,使用独立域名访问不会 受到此限制,详见配置过程:...
来自: 最佳实践 | 相关产品:云数据库RDS MySQL 版,数据传输,函数计算,API网关,表格存储
金融行业从经典网络向VPC容器化改造
金融行业从经典网络向VPC容器化改造
本实践介绍经典网络向VPC容器化改造实践 以及配置步骤,可适用于金融等行业 方案优势 容器化完成经典网络完成向VPC网络改 造 应用发布灵活 运维效率提升 解决问题 1.经典网络管理困难 2.应用发布不灵活 3.运维效率低 产品列表 专有网络VPC 容器服务Kubernetes版 日志服务SLS 云数据库RDS版 NAT网关 容器镜像服务ACR 云盘
这里以WordPress为例 重新回到dev_claissic的ssh连接窗口,如果失去连接可以重新登陆sshroot@101.37.252.32#创建应用目录 mkdir-p/makeWordpress cd/makeWordpress#下载应用程序 wget https://raw.githubusercontent.com/docker-library/wordpress/841f2801d0a6d0cf73321a5554 d6bade4c143417/php7.3/apache/Dockerfile #获取...
来自: 最佳实践 | 相关产品:专有网络 VPC,云数据库RDS MySQL 版,容器服务 ACK,日志服务(SLS),容器镜像服务 ACR
金融专属大数据workshop
金融专属大数据workshop
实践目标 学习搭建一个实时数据仓库,掌握数据采集、存储、计算、输出、展示等整个业务流程。 整个实时数据仓库系统全部基于阿里云产品进行架构搭建,用户可以掌握并学会运用各个服务组件及各个组件之间如何联动。 理解阿里云原生实时离线一体数仓解决方案架构以及掌握交付落地的实践使用方法。 前置知识要求 熟练掌握SQL语法 对大数据体系系统知识有一定的了解
本实例架构图:文档版本:20210803(发布日期)11阿里云最佳实践金融大数据WorkShop 最佳实践项目实践(注:CADT暂不支持创建实时计算Flink集群,下一章节将通过页面创建)需要注意:使用CADT进行资源创建时,所有的实例需要设置为自定义名称 步骤1 登录CADT控制台。...
来自: 最佳实践 | 相关产品:块存储,云服务器ECS,云数据库RDS MySQL 版,对象存储 OSS,弹性公网IP,数据传输,DataWorks,大数据计算服务 MaxCompute,DataV数据可视化,实时计算,数据总线,Quick BI,Hologres
小型互联网迁移阿里云
小型互联网迁移阿里云
场景描述 本方案主要适用于中小型互联网企业,从他云 迁移到阿里云的最佳实践。方案中会概述网络 规划、服务器、数据库、存储数据、Kafka和 镜像数据的迁移方案描述。同时在实践环节, 增加服务器和RDS的迁移操作演练和验证。 解决问题 提供服务器、数据库等关键环节的平滑迁移方 案 提供云上高可用架构参考 提供模拟简单的演练回归流程机制 产品列表 云服务器(ECS)、迁云工具(SMC)、数据库 (RDS)、数据库(Redis)、数据传输(DTS)、 负载均衡(SLB)、专有络(VPC)等
业务流量切换及回归机制 步骤1 修改域名公网 DNS 解析,将用户访问部分流量切换到阿里云应用。步骤2 将他云的应用连接切换到阿里云并公网访问源数据库(他云),保证单写。读业务读取 阿里云 RDS。步骤3 观察应用业务状态;应用访问正常,将全部流量切换到阿里云应用。回滚方案:将连接地址切回。9.1.更换数据库地址 1)...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云数据库RDS MySQL 版,对象存储 OSS
基于Flink的资讯场景实时数仓
基于Flink的资讯场景实时数仓
场景描述 本实践针对资讯聚合类业务场景,Step by Step介绍 如何搭建实时数仓。 解决问题 1.如何搭建实时数仓。 2.通过实时计算Flink实现实时ETL和数据流。 3.通过实时计算Flink实现实时数据分析。 4.通过实时计算Flink实现事件触发。 产品列表 实时计算 专有网络VPC 云数据库RDSMySQL版 分析型数据库MySQL版 消息队列Kafka 对象存储OSS NAT网关 DataV数据可视化
INSERT INTO kafka_sink_total_summary_pvuv_category_day/*各类实时 pv/uv*/SELECT `event_date`,`category_id`,`category_name`,COUNT(`client_ip`)as pv,COUNT(distinct `client_ip`)as uv,CURRENT_TIMESTAMP as currenttime FROM input_view GROUP BY `event_date`,`category_id`,`category_name`;步骤2 参考 4.2.1....
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云数据库RDS MySQL 版,NAT网关,云原生数据仓库AnalyticDB My,云速搭CADT
域名交易
提供域名交易,域名出售,二手域名,域名买卖。操作便捷、支付快速安全。"
基于支付宝担保交易打造的域名交易系统,为买卖双方提供安全、便捷的域名交易服务,支持域名一口价、带价PUSH、竞价议价、域名抢注、域名回购等多种交易方式。买卖域名,像淘宝一样简单!
来自: 云产品 | 相关产品:域名信息,二手域名,域名交易,域名买卖
域名注册
中国卓越的域名注册服务商,近1000万个域名在万网注册。"
阿里云域名申请-超过4000万域名在这里注册,新人多重好礼,新用户特惠,域名注册就选阿里云,阿里旗下品牌-万网 22年品质如一,海量资源像淘宝一样简单!
来自: 云产品 | 相关产品:域名查询,域名信息,二手域名,域名注册
备案服务
为企业/个人提供快速、专业、高效的域名备案、网站备案及icp备案等备案服务。
在中华人民共和国境内提供互联网信息服务,应当依法履行ICP备案手续,阿里云为您免费提供备案服务.
来自: 云产品 | 相关产品:备案
< 1 >
共有1页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用