自建Hive数据仓库跨版本迁移到阿里云Databricks数据洞察
自建Hive数据仓库跨版本迁移到阿里云Databricks数据洞察
场景描述 客户在IDC或者公有云环境自建Hadoop集群构建数据仓库和分析系统,购买阿里云Databricks数据洞察集群之后,涉及到数仓数据和元数据的迁移以及Hive版本的订正更新。 方案优势 1. 全托管Spark集群免运维,节省人力成本。 2. Databricks数据洞察与阿里云其他产品(OSS、RDS、MaxCompute、EMR)进行深度整合,支持以这些产品为数据源的输入和输出。 3. 使用Databricks Runtime商业版引擎相比开源Spark性能有3-5倍的提升。 解决问题 1. Hive数仓数据迁移OSS方案。 2. Hive元数据库迁移阿里云RDS方案。 3. Hive跨版本迁移到Databricks数据洞察使用Delta表查询以提高查询效率。
深度融合 Databricks数据洞察与阿里云其它产品(例如,OSS、MongoDB、Elasticseach、RDS和 MaxCompute等)进行了深度整合,支持以这些产品作为 Spark计算 的输入源或者输出目的地。文档版本:20210425 VI 自建 Hive数据仓库跨版本迁移到阿里云 Databricks数据洞察 前置条件 前置条件 为了顺利完成本实践,您需要提前...
来自: 最佳实践 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,文件存储HDFS,spark
基于Elasticsearch的订单检索加速最佳实践
基于Elasticsearch的订单检索加速最佳实践
随着企业信息化程度越来越高,核心业务数据存储在传统关系型数据库中不可避免地会遇到一个问题:单表记录不断增多,数据检索速度会变慢,尤其是对中文的模糊查询(建立普通索引完全不起作用)。虽然数据库自身在不断完善,但效果有限且没办法灵活扩展,复杂场景无法应对。 本方案基于阿里云Elasticsearch作为二级索引库,数据集成产品提供Binlog实时订阅,实时解析、增量数据实时更新及二级索引库之间进行数据实时同步,为数据库提供“能力增益”, 不仅能从根本解决主库抗压问题,提升稳定性;同时支持高效率、高性能、高弹性、低成本、多复杂场景的检索加速服务。
性能优越:PB级数据准实时搜索引擎,查询结果毫秒级返回。功能强大:支持多种数据结构的复杂查询及字段级的全文匹配、模糊匹配、同时集 成了阿里达摩院 NLP分词器等多种分词插件,性能效果双保障。文档版本:20210517 1 基于 Elasticsearch的订单检索加速最佳实践 最佳实践概述 高弹性低成本:集群一键平滑弹性扩缩容,灵活...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云数据库RDS MySQL 版,DataWorks,Elasticsearch
地址标准化
地址标准化(Address Purification)是依托阿里云海量的地址语料库,及超强的NLP算法实力所沉淀出的高性能、高准确率、功能覆盖最全的标准地址算法服务。可为企业、政府机关及开发者提供地址数据清洗。地址标准化通过地址解析、补全、匹配等赋能业务的上层应用。
不填写不展示.(地址标准化大模型)支撑地址标准化产品的多功能应用,为地理文本搜索引擎Query分析、召回、排序等多项能力带来了效果升级。MGeo是首对地图进行模态表示并实现地图-文本跨模态理解的多模态模型,基于其多任务预训练技术融合多种地理文本特色预训练为社区提供首开源普惠的地理文本预训练模型。同时MGeo...
来自: 云产品
数据库异地灾备
数据库异地灾备
场景描述 适用于不满足于单地域,对数据可靠性 (RPO)和服务可用性(RTO)要求更高 的,希望防范断电、断网等机房故障,抵 御地震、台风等自然灾害,具备异地容灾 备份恢复能力的客户业务场景。 解决问题 1.实时备份,RPO达到秒级 2.表级恢复,故障恢复时间大大缩短 3.长期归档,自动管理备份生命周期 4.异地灾备,构建数据库灾备中心 产品列表 专有网络VPC 云服务器ECS 弹性公网IP(EIP) 负载均衡SLB 云数据库RDSMySQL 数据库备份服务DBS 对象存储服务OSS 数据湖分析服务DLA 数据管理服务DMS 数据传输服务DTS
基于阿里云分布式文件系统和 SSD盘高性 能存储,RDS支持 MySQL、SQL Server、PostgreSQL、PPAS和 MariaDB ,提供了容灾、备份、恢复、监控、迁移等方面的全套解决方案,彻底解决数据 库运维的烦恼。MySQL 是全球最受欢迎的开源数据库之一,作为开源软件组合 LAMP(Linux+Apache+MySQL+Perl/PHP/Python)中的重要一环,...
来自: 最佳实践 | 相关产品:云数据库RDS MySQL 版,对象存储 OSS,数据管理,数据湖分析,数据库备份DBS,云速搭CADT
微服务引擎的线上流量治理
微服务<em>引擎</em>的线上流量治理
随着业务不断创新,微服务架构及数字化转型不断落地,在这个过程中,大量企业采用了开源的组件构建了微服务,比如有开源微服务全家桶之称的Spring Cloud体系或Apache Dubbo等,微服务的好处之一,在于快速迭代,如何在迭代过程中保障线上流量不受损? 开源产品无运维工具,常常需要投入较大的运维人力和成本。 本实践将重点介绍如何快速集成主流开源微服务框架,实现业务零改造,解决开源框架在生产落地过程中的痛点,例如无损上下线、标签路由等,并通过托管微服务开源组件(API网关、注册中心、配置中心等)的服务,提供白屏化监控告警、容灾、宕机重启、扩缩容等能力,帮助企业释放业务无关的运维成本,聚焦业务本身的运维和发展。 方案优势 快速集成:通过JavaAgent技术实现Sping Cloud和Dubbo框架可以实现业务零改造接入。 免运维:托管微服务依赖开源中间件的服务,提供白屏化监控告警、容灾、宕机重启、扩缩容等能力,帮助我们客户释放业务无关的运维成本,聚焦自身业务本身的运维和发展。 开源增强:提供开源框架在生产落地过程中的痛点,例如应用无损上下线/金丝雀发布/南北+东西流量打通等,帮助客户的业务提高自身SLA和降低自研成本。
微服务引擎的线上流量治理 最佳实践 业务架构 背景描述 随着业务不断创新,微服务架构及数字化转型不 断落地,在这过程中,大量企业采用了开源的 组件构建了微服务,比如有开源微服务全家桶之 称的 Spring Cloud体系或 Apache Dubbo等,微服务的好处之一,在于快速迭代,如何在迭代 过程中保障线上流量不受损?...
来自: 最佳实践 | 相关产品:容器服务 ACK,微服务引擎,云速搭CADT
CDH迁移升级CDP最佳实践
CDH迁移升级CDP最佳实践
当前 CDH 免费版停止下载,终止服务,针对需要企业版服务能力并且CDH 升级过程对业务影响较小的客户,通过安装新的 CDP 集群,将现有数据拷贝至新集群,然后将新集群切换为生产集群,升级过程没有数据丢失风险,停机时间较短,适合大部分互联网客户升级使用。
Capacity Scheduler易与 Ranger集成,这意味着可以通过 Ranger策略来控制 些用户可以/不能提交作业到指定队列。Capacity Scheduler支持节点分区和节点标签。Capacity Scheduler更适合于云原生环境,例如:提供更的封装服务,支持自动 扩展等等。性能优势:Capacity Scheduler采用基于全局调度的技术框架,能够一次查找...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云速搭
企业上云workshop
企业上云workshop
本文模拟了如下场景: 1. 线下 IDC 环境中部署了一个业务系统,业务是利用 wordpress 系统提供网站服务。 2. 本文详细介绍了如何将以上线下系统搬迁到云上, 包括如何在云上构建以上业务系统,如何迁移线下 系统到云上,如何割接。 3. 最后介绍了迁移上云后,如何部署安全系统。 解决问题 IDC 业务系统搬迁上云 云上构建业务系统 部署安全系统
使用准备的免费证书 因为签发证书需要 3-5工作日,为了顺利完成演示,需要提前准备一免费的证书,适用于*.lustre.site域名。免费的证书不能被浏览器验证签发单位,所以浏览器上显示 的 https是红色的;使用正式的商业证书时是绿色的。步骤1 登录 SSL证书控制台。(https://yundunnext.console.aliyun.com/?p=cas)步骤2...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云数据库RDS MySQL 版,对象存储 OSS,负载均衡 SLB,弹性公网IP,文件存储NAS,云数据库PolarDB,Web应用防火墙,云防火墙,SSL证书,云速搭
基于弹性供应组构建大数据分析集群
基于弹性供应组构建大数据分析集群
场景描述 基于弹性供应组(APG)搭建spark计算集 群,提供一键开启跨售卖方式、跨可用区、 跨实例规格的计算集群交付模式的实践。 方案优势 1.超低成本:跨售卖方式提供计算实 例,按秒计费,可全部使用spot实例 交付,最高可省90%成本。 2.稳定可靠:跨可用域、跨实例规格, 降低spot被集体释放的风险;自动托 管,分钟级巡检,动态保证集群的算 力。 3.快速交付:单次可在5分钟内交付 2000个实例。 4.多策略组合:可分别指定spot和按量 实例的交付策略,以及差额补足的策 略,包括成本最低、打散和折中。 解决问题 1.大规模计算集群成本高。 2.创建ECS实例方式单一,无法跨计费 方式、可用区及规格等核心参数。 3.当可用区资源紧张,无法自动保证基于 spot类型的稳定算力。 产品列表 专有网络VPC 云服务器ECS
最佳实践频道 阿里云最佳实践分享群 如二维码过期,请搜索群号:31852400 云服务器 ECS(产品名称)文档模板(手册名称)/文档版本信息 阿里云 企业上云实践 基于弹性供应组构建大数据 分析集群最佳实践 文档版本:20200619 文档版本:20150122(发布日期)II 基于弹性供应组构建大数据集群分析 文档版本信息 文档版本信息 ...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,弹性公网IP
自建K8S集群迁移ACK弹性裸金属集群
自建K8S集群迁移ACK弹性裸金属集群
场景描述 在微服务化改造之后,企业在享受K8S带来应 用管理的便利的同时,存在硬件性能不足,本 地扩展性差,容器容灾难,K8S管理复杂等问 题。 解决问题 1.增强K8S扩展性:如何通过弹性裸金属服务 器的强劲硬件性能,实现云端资源急速扩 展,从容应对应用访问压力大的问题。 2.如何简化云端K8S运维:通过阿里云容器服 务(ACK)实现敏捷开发和部署落地,加速 企业业务迭代。 3.如何综合考虑迁移和容灾:如何整合云上和 云下容器资源实现遇到故障时可以通过健 康检查实现自动容灾。 4.如何不改应用上云:如何实现应用上云数据 库连接零修改。 5.数据库上云及回退:如何实现上云回退; 产品列表 ACK/ECS/SLB/NAT网关/弹性裸金属服务器/DTS/RDS MySQL
步骤3 在搜索框中,通过关键字找到“自建 K8S集群迁移 ACK弹性裸金属集群”这模板,选中后,单击基于应用新建。文档版本:20220128 7 自建 K8S集群迁移 ACK弹性裸金属集群 环境部署 步骤4 在架构设计页面,完成以下操作:双击所有 ecs图标,设置 ecs的密码,建议:Test1234!双击 ack图标,设置 ACK的密码,建议:Test1234...
来自: 最佳实践 | 相关产品:云数据库RDS MySQL 版,负载均衡 SLB,容器服务 ACK,NAT网关,弹性裸金属服务器(神龙),云速搭
基于Flink的资讯场景实时数仓
基于Flink的资讯场景实时数仓
场景描述 本实践针对资讯聚合类业务场景,Step by Step介绍 如何搭建实时数仓。 解决问题 1.如何搭建实时数仓。 2.通过实时计算Flink实现实时ETL和数据流。 3.通过实时计算Flink实现实时数据分析。 4.通过实时计算Flink实现事件触发。 产品列表 实时计算 专有网络VPC 云数据库RDSMySQL版 分析型数据库MySQL版 消息队列Kafka 对象存储OSS NAT网关 DataV数据可视化
步骤3 在搜索框中,输入“flink”,通过关键字找到“基于 flink的资讯场景实时数仓”这模 文档版本:20220223(发布日期)10 基于 Flink的资讯场景实时数仓 基础环境部署 板,选中后,单击基于应用新建。步骤4 在架构设计页面,完成以下操作:双击 ecs图标,并设置 ecs的密码,建议:Test1234!双击 oss图标,修改 bucket...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云数据库RDS MySQL 版,NAT网关,云原生数据仓库AnalyticDB My,云速搭CADT
基于湖仓一体架构使用MaxCompute对OSS湖数据分析预测
基于湖仓一体架构使用MaxCompute对OSS湖数据分析预测
本篇最佳实践先创建EMR集群作为数据湖对象,Hive元数据存储在DLF,外表数据存储在OSS。然后使用阿里云数据仓库MaxCompute以创建外部项目的方式与存储在DLF的元数据库映射打通,实现元数据统一。最后通过一个毒蘑菇的训练和预测demo,演示云数仓MaxCompute如何对于存储在EMR数据湖的数据进行加工处理以达到业务预期。
配置DataWorks和PAI 此方案通过DataWorks创建一工作空间,选择MaxCompute作为计算引擎,并开 通PAIStudio作为机器学习服务(用于后续演示使用MaxCompute的SQL完成机器 学习)。通过odpscmd客户端在工作空间下创建外部项目(externalproject)与DLF 的元数据库做映射关联。前提是DLF已经授权给MaxCompute。目前DataWorks的...
来自: 最佳实践 | 相关产品:对象存储 OSS,E-MapReduce,DataWorks,大数据计算服务 MaxCompute,API网关,数据湖构建,云速搭
在线业务智能增长解决方案
基于阿里巴巴自主研发的高性能召回、排序引擎,为企业提供一站式智能增长开发平台。通过性能更优、效果更好的智能搜索、信息流服务,提升在线业务转化效果与用户体验,助力商业价值提升,驱动企业智能增长。
通过性能更优、效果更的智能搜索、信息流服务,提升在线业务转化效果与用户体验,助力商业价值提升,驱动企业智能增长.在线业务智能增长解决方案.开通 MaxCompute.上传全量数据(DataWorks),并授权智能推荐读取.智能推荐服务支持 MaxCompute的数据源类型.创建/购买实例.智能推荐管理控制台创建实例,可选择行业、场景并...
来自: 解决方案
跨境电商语言工具
跨境电商语言工具集成阿里云达摩院先进的NLP技术及海量电商领域双语语料,为跨境贸易平台及商家沉淀一套完整的全链路商品信息语言翻译及标题优化工具
帮助平台或商家诊断当前商品图片中的文字所属语种,便于在目标市场国家获得更的商品转化效果。支持诊断是否为中/英/俄语图片.图片语种诊断.结合标题诊断结果、平台搜索、点击、购买、浏览等数据,自动智能优化标题,帮助提升商品曝光及转化率,支持英文、俄语、西班牙语.标题智能优化.根据产品关键词、商品属性及详描中的...
来自: 云产品
NLP自学习平台
阿里云NLP自学习平台是面向算法小白用户的自适应标注、训练和服务平台,支持34种算法能力。仅需标注或上传适量数据,即可通过平台创建算法模型并使用。
开放搜索是基于阿里巴巴自主研发的大规模分布式搜索引擎搭建的一站式智能搜索业务开发平台,目前为包括淘宝、天猫在内的阿里集团核心业务提供搜索服务支持。通过内置各行业的查询语义理解、机器学习排序算法等能力,提供充分开放的引擎能力,助力开发者快速搭建更高性能、更高搜索基线效果的智能搜索服务.查看自学习平台的...
来自: 云产品
互联网、电商Elasticsearch搜索
互联网、电商Elasticsearch<em>搜索</em>
场景描述 每一个生活在互联网中的用户,每天都在经 历各种各样的“搜索”,查找电商网站商品、 信用卡账单、查电子发票、查附近的餐厅酒 店、查偶像、查交通等等。相对于传统的关 系型数据库,Elasticsearch只需要几毫秒的 时间,即可查询PB级数据并从中找到匹配 信息。利用Elasticsearch高可用性和易用 性,能够快速处理网站、APP丢给它的文本、 数字、日期、IP以及地理数据。 解决问题 1.电商网站商品、订单、物流等搜索 2.保险行业保单查询 3.互联网教育行业课程搜索 4.O2O行业地理位置搜索等 产品列表 云服务器ECS 专有网络VPC 负载均衡SLB 云数据库RDSMySQL版 Dataworks Elasticsearch 数据传输服务DTS
配置 Elasticsearch搜索引擎 说明:此部分演示电商网站 Demo搜索引擎替换为 Elasticsearch搜索引擎,真实的业 务系统一般前端会对接 App Server,Server端通过第三部分的 API对接 Elasticsearch 搜索引擎。此部分非必须,如果需要做演示可对接这部分。步骤1 使用电商网站的公网 IP/admin登录电商网站后台管理系统。步骤2 ...
来自: 最佳实践 | 相关产品:云服务器ECS,云数据库RDS MySQL 版,数据传输,DataWorks,Elasticsearch
机器翻译
阿里云机器翻译提供多行业、多场景、多模态的语言服务。机器翻译涵盖通用版/专业版/定制版机器翻译引擎、语种识别、图片翻译、文档翻译、语音/视频翻译、人机协同翻译平台、电商内容多语言工具、机器翻译自学习平台等产品。
提供医疗领域定制翻译模型,有效提升在医疗领域下的机器翻译质量,助力客户更跨语言沟通.盛诺一家(医疗).新增文档翻译在线编辑平台,支持DOC等文档自动解析、翻译和排版!文档智能平台免费公测中,点击查看详情.上线文本翻译/图片翻译包年产品!包年更优惠!加钉群沟通:23369411.2023金秋云创季NLP自然语言处理分会场...
来自: 云产品
图数据库GDB
图数据库(Graph Database, 简称GDB)是阿里云自主研发的图数据库产品,经历阿里巴巴集团内丰富的应用场景打磨,具备行业最佳实践经验。是基于图技术的行业多元异构数据的融合、分析、决策引擎,是知识图谱的最佳底座。
基于达摩院的智能搜索推荐算法和知识图谱技术,融合阿里巴巴电商策略沉淀,为企业提供贯穿搜索和推荐的一站式服务。助力企业快速过渡冷启动过程,面向业务场景定制化方案,持续提升核心业务指标,实现业务营收增长.将搜索和推荐融合提供一站式服务,精准理解用户意图并提供新化智能推荐,推用户之所想.搜索推荐一站式服务...
来自: 云产品
云数据库RDS PostgreSQL
云数据库RDS PostgreSQL 版完全兼容开源PostgreSQL,基于云原生架构,软硬协同优化,提供稳定可靠、高性价比的数据库服务。通过丰富的插件拓展,支撑各领域场景化业务,如自研Ganos多维多模时空引擎及开源PostGIS地理信息引擎、向量引擎、时序引擎等百余款插件。
通过全文搜索,应用将不再需要额外搭建搜索引擎,只通过SQL操作即可实现全文检索(Full Text Search)及模糊查询.支持向量相似.支持pgvector(高维向量)、Smlar(文本相似)、Pase(高维向量模块)等插件,满足AIGC、图像识别、图像检索等场景需求.支持实时推荐.支持ltree(树模块)、varbitx(位图模块)、pg_roaringbitmap(高级位图...
来自: 云产品
云速搭部署 Elasticsearch 应用
云速搭部署 Elasticsearch 应用
本实践通过云速搭实现一个 DTS+Elasticsearch 的搜索引擎架构,构建一个快速分析和检索 业务数据的系统。
更多信息,请参见:http://www.aliyun.com/product/bigdata/product/elasticsearch 文档版本:20211029 3 云速搭部署 Elasticsearch应用 云速搭架构设计入门 云速搭架构设计入门 方案架构 通过云速搭实现一 DTS+Elasticsearch的搜索引擎架构,构建一快速分析和检索 业务数据的系统。文档版本:20211029 4 云速搭部署 ...
来自: 最佳实践 | 相关产品:专有网络 VPC,数据传输,Elasticsearch,云速搭CADT
< 1 2 3 4 >
共有4页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用