大数据近实时数据投递MaxCompute
大数据近实时<em>数据</em>投递MaxCompute
本文介绍离线大数据场景使MaxCompute构建云 上近实时数仓,打通云下数据上云链路,解决数据复杂类型支持和动态分区问题,满足高级数据处理需求的最佳实践。 l混合云环境下,现有业务系统零改造,打通数据上云链路。 l使用UDF实现复杂数据类型转换和数据动态分区。 l使用DataWorks配置周期调度业务流程,数据自动入仓。 l借助MaxCompute优化计算引擎,实现降本增效。 产品列表 云服务器ECS 专有网络VPC 访问控制RAM 数据总线DataHub E-MapReduceEMR DataWorks 大数据计算服务MaxCompute
MaxCompute已与数据集成、DataWorks、QuickBI、机器学习 PAI、ADB、推荐引擎、移动数据分析等大数据产 品打通,可快速集成使用,轻松应对各种大数据应用场景。本文以线下现有业务大数据离线数仓建设为背景,介绍如何在现有业务应用系统零 改造的前提下,从 Kafka集群切入,打通数据上云链路,解决数据复杂类型支持和 动态...
来自: 最佳实践 相关产品:块存储,专有网络 VPC,云服务器ECS,访问控制,E-MapReduce,DataWorks,大数据计算服务 MaxCompute,数据总线,云速搭CADT
Databricks数据洞察
阿里云Databricks数据洞察是基于Apache Spark的全托管数据分析平台, 内核采用更高效、稳定的商业版Databricks Runtime和Delta Lake。可满足数据分析师、数据工程师和数据科学家在大数据场景下对数据湖分析、实时数仓、离线数仓、BI数据分析、AI机器学习等需求
支持Ad hoc查询,无缝对接多种BI分析工具.BI数据分析.支持机器学习.AI数据探索.流批一体数据仓库.流批一体数据仓库.简化机器学习生命周期,快速进行模型测试、实验、以及生产部署,并可视化结果.Spark SQL/Data Frame进行的分布式的数据预处理,EDA和特征工程.利于Spark ML、ML相关模块做特征处理,进行ML/DL模型分布式训练...
来自: 云产品
混合云数据库统一管理
混合云数据库统一管理
本最佳实践描述在混合云场景下,用户利用数据库网关将IDC自建数据库和云上RDS实例统一管理。通过DMS管理云上RDS实例和IDC自建数据库,并通过DTS实现IDC数据库和云上RDS的数据同步, DBS将数据备份到云上
全生态服务:通过数据库网关,各种数据库产品将逐步接入,实现跨云和云上云 下的全生态服务(如数据库迁移、容灾、跨库 JOIN、数据分析数据安全等能力),保证您享受云端数据库产品带来的一致性服务。文档版本:20201224(发布日期)20 混合云数据库统一管理 数据库网关接入 3.2.创建数据库网关 在 VPC-Cloud配置数据库...
来自: 最佳实践 | 相关产品:数据传输,数据管理
互联网、电商Elasticsearch搜索
互联网、电商Elasticsearch搜索
场景描述 每一个生活在互联网中的用户,每天都在经 历各种各样的“搜索”,查找电商网站商品、 信用卡账单、查电子发票、查附近的餐厅酒 店、查偶像、查交通等等。相对于传统的关 系型数据库,Elasticsearch只需要几毫秒的 时间,即可查询PB级数据并从中找到匹配 信息。利用Elasticsearch高可用性和易用 性,能够快速处理网站、APP丢给它的文本、 数字、日期、IP以及地理数据。 解决问题 1.电商网站商品、订单、物流等搜索 2.保险行业保单查询 3.互联网教育行业课程搜索 4.O2O行业地理位置搜索等 产品列表 云服务器ECS 专有网络VPC 负载均衡SLB 云数据库RDSMySQL版 Dataworks Elasticsearch 数据传输服务DTS
阿里云 Elasticsearch:提供 100%兼容开源 Elasticsearch的功能,以及 Security、Machine Learning、Graph、APM等商业功能,致力于数据分析数据搜索等场 景服务。与开源社区背后商业公司 Elastic战略合作,为客户提供企业级权限管控、安全监控告警、自动报表生成等场景服务。更多信息,请参见 elasticsearch简介:...
来自: 最佳实践 | 相关产品:云服务器ECS,云数据库RDS MySQL 版,数据传输,DataWorks,Elasticsearch
智能媒体管理IMM
阿里云智能媒体管理IMM是一款场景化封装数据智能分析检索管理工具。为云上的视频、文档、图片等非结构化数据提供一站式数据处理、分析、检索等管理能力,让数据更有价值。
文档格式转换、预览.智能媒体管理IMM支持共48种文件类型不同办公文档的格式转换与预览,帮助用户搭建文档内容中心.图片内容识别.智能媒体管理IMM支持25个主标签,上千个子标签,图片场景快速添加标签,帮助图片内容管理....根据图片分析数据存储等不同应用场景,封装整合完整的处理能力,让数据快速流转.智能媒体管理 IMM.
来自: 云产品
基因计算分析解决方案
基因测序技术日新月异,围绕着基因组学的基础科学研究和临床医学应用,也正在取得突破性的进展。阿里云为海量基因组学数据的计算分析提供高效安全的完整解决方案,帮助生物科技公司、科研人员和医疗健康机构构建广泛可靠、敏捷智能的基础平台和业务系统。
强大云基础设施支撑,支持多种接入方式,提供完备的计算分析工具套件.数据存储和传输全程加密,安全可靠,合法合规.丰富的生信应用生态,助您快速开启云上计算分析之旅.基因计算分析.基因计算分析.支持社区流程标准,实现云端高效并行的分析.统一标准,简化开发测试过程,帮助用户轻松实现云上高效的分析流程.用户只需关注...
来自: 解决方案
远程办公-AD管控下的弹性云桌面
远程办公-AD管控下的弹性云桌面
在弹性云桌面中部署企业基础办公环境时,IT人员通常会面临以下问题,本文希望通过场景实践的方式,示范如何结合使用不同阿里云产品,来解决这些问题:用户如何管理?企业已有AD用户如何上云?云上共享文件服务权限怎么管?数据安全问题有保障吗?该如何设置?云桌面能使用本地机房或IDC中的服务吗? 本文使用的应用场景: 场景1:客户A在云上新建Windows ActiveDirectory(以下简称AD);弹性云桌面,和NAS文件存储服务部署在AD所在的VPC内。场景2:客户B在阿里云上已有AD和NAS。弹性云桌面创建在与AD不同的VPC中。AD与云桌面的VPC通过CEN连接。场景3:客户C在云下IDC有自建AD和文件服务。弹性云桌面创建在阿里云上。云下机房与阿里云弹性云桌面所在VPC通过IPsec VPN连接。 方案优势: 易部署:弹性云桌面支持快速便捷的桌面环境创建、部署、统一管控与运维。 CEN和VPN网关服务开通即用,配置实时生效,快速完成部署。 低成本:弹性云桌面无需前期传统硬件投资,帮您快速构建安全、高性能、低成本的桌面办公体系。可广泛应用于具有高数据安全管控、高性能计算等要求的金融、设计、视频、教育等领域。VPN网关基于Internet建立加密通道,比建立专线更便宜,快速实现混合云。 安全性:VPN网关使用IKE(秘钥交换协议)和IPSec对传输数据或进行加密,保证数据安全可靠。云桌面自带的安全策略保证数据不落地。 集中管控:通过Windows AD对云桌面用户和共享文件服务进行统一权限管控。可实现AD用户自动同步上云,和文件级别的权限管控。
广泛应用于容器存储、大数据分析、Web 服务和内容管理、应用程 序开发和测试、媒体和娱乐工作流程、数据库备份。支持冷热数据分级存储。详情请查看:https://www.aliyun.com/product/nas CEN 云企业网(Cloud Enterprise Network)提供一种能够快速构建混合云和分布式 业务系统的全球网络,帮助用户打造一张具有企业级规模...
来自: 最佳实践 | 相关产品:云服务器ECS,弹性公网IP,文件存储NAS,NAT网关,云企业网,VPN网关,云桌面,云速搭CADT
超级计算集群实现自然语言处理训练
超级计算集群实现自然语言处理训练
场景描述 本方案适用于自然语言训练场景,使用神龙 GPU云服务器(SCCGN6)+CPFS进行NLP的 训练,采用Bert模型。这里不使用容器,直接 使用裸机进行NLP的Bert训练,使用飞天AI加 速训练工具可以有效提升多机多卡的训练效率。 解决问题 使用神龙GPU云服务器搭建NLP训练环 境 使用SCC的RDMA网络 使用CPFS存储训练数据 使用飞天AI加速训练工具加速训练 产品列表 神龙GPU云服务器(SCCGN6) SCC超级计算集群 CPFS共享存储
 超级计算集群(SuperComputingCluster,SCC)使用高速RDMA网络互联的 CPU以及GPU等异构加速设备,面向高性能计算、人工智能/机器学习、科学/工程计算、数据分析、音视频处理等应用,提供极致计算性能和并行效率的计算 集群服务。更多信息,请参见超级计算集群https://cn.aliyun.com/product/scc。 CPFS...
来自: 最佳实践 | 相关产品:文件存储NAS,超级计算集群
专有云企业版
阿里云专有云企业版是面向政企客户的全栈云平台,可一键式弹性扩展至公共云,提供不同应用场景需求下的混合云方案,支撑企业级核心应用平滑上云。
数据计算、处理分析较同类开源产品提升倍;支持超过EB级别OSS数据数据湖,数据存储较开源体系压缩3-5倍.高性能、低成本.完全自主研发,无单点架构和多副本机制服务可用性不低于99.9%;金融级安全体系,数据保护伞、安链、安全多边计算.和PAI平台深度融合,数据应用更智能;运行态势全感知、故障自动预警.智能、易运维...
来自: 云产品
CDN
阿里云内容分发网络CDN(全称Content Delivery Network)将源站内容分发至全国所有的节点,缩短用户查看资源的延迟,提高用户访问网站的响应速度与网站的可用性,解决源站带宽小、用户访问量大、网点分布不均等问题。
一站式的监控、告警、站点JS分析、卡顿分析、拨测等工具,快速进行数据分析,掌控业务动态,助力业务高速发展.端到端业务感知.提供离线日志分析、实时日志分析等能力,可根据业务需求,定制分析逻辑,快速定位CDN服务问题.集成云监控、ARMS等产品,提供前端JS分析、拨测、告警等能力,快速发现问题.提供PV/UV、topURL、热门...
来自: 云产品
数据可视化DataV
数据可视化DataV是阿里云一款数据可视化应用搭建工具,旨让更多的人看到数据可视化的魅力,帮助非专业的工程师通过图形化的界面轻松搭建专业水准的可视化应用,满足您会议展览、业务监控、风险预警、地理信息分析等多种业务的展示需求。
强大的地理数据分析能力,提供了一套强大的地理数据分析算子,用户可通过算子或者可视化组件进行包括空间查询、空间分析的操作,实现多源地理数据的同屏分析;云端部署和共享能力,用户可以将自己的可视化分析地图和应用部署到阿里云服务器上,方便自己和他人的访问和使用;DataV-可视分析地图.Ganos 时空数据库引擎.Polar...
来自: 云产品
基因分析平台
阿里云基因分析平台可以提供端到端的基因计算PaaS服务。支持GA4GH行业标准,集成生信分析应用,大幅优化成本效率,快速处理海量基因数据。
安全可靠合规.CPU/MEM细粒度计费,大规模计算调度和文件访问I/O效率优化,集成Sentieon,GPU/FPGA等加速工具,大幅度降低NGS数据分析费用.计算费用优化.从0起始到千万样本,容量灵活,适用于任意规模的用户。无需提前规划,完全按业务弹性扩展,并行处理所有计算作业,且只需为使用资源付费.规模灵活弹性.支持社区标准的...
来自: 云产品
数据库异地灾备
数据库异地灾备
场景描述 适用于不满足于单地域,对数据可靠性 (RPO)和服务可用性(RTO)要求更高 的,希望防范断电、断网等机房故障,抵 御地震、台风等自然灾害,具备异地容灾 备份恢复能力的客户业务场景。 解决问题 1.实时备份,RPO达到秒级 2.表级恢复,故障恢复时间大大缩短 3.长期归档,自动管理备份生命周期 4.异地灾备,构建数据库灾备中心 产品列表 专有网络VPC 云服务器ECS 弹性公网IP(EIP) 负载均衡SLB 云数据库RDSMySQL 数据库备份服务DBS 对象存储服务OSS 数据湖分析服务DLA 数据管理服务DMS 数据传输服务DTS
DLA 无缝集成各类商业分析工具,提供便捷的数据可视化。详见:https://www.aliyun.com/product/datalakeanalytics DMS:数据管理服务(Data Management Service,简称 DMS)支持 MySQL、SQL Server、PostgreSQL、Oracle、MongoDB、Oceanbase等关系型数据库和 NoSQL 数据库的管理。它是一种集数据管理、结构管理、用户授权、...
来自: 最佳实践 | 相关产品:云数据库RDS MySQL 版,对象存储 OSS,数据管理,数据湖分析,数据库备份DBS,云速搭CADT
自建ElasticSearch迁移阿里云
自建ElasticSearch迁移阿里云
场景描述 以ElasticSearch为例,演示搭建模拟业务系统、 VPN网关和IPSecVPN隧道,介绍如何通过快照 的方式,将ElasticSearch索引数据安全备份到 阿里云OSS存储空间,以及介绍如何将备份在 OSS的快照仓库恢复到阿里云ElasticSearch实 例,进一步达到ElasticSearch迁移上云的目的。 解决的问题 自建ElasticSearch的云上/跨云备份需求。 自建ElasticSearch迁移到阿里云 ElasticSearch服务实例。 产品列表 VPC,ECS,VPN网关,OSS,阿里云ElasticSearch,云速搭CADT
阿里云 Elasticsearch 提供 100%兼容开源 Elasticsearch的功能,以及 Security、Machine Learning、Graph、APM等商业功能,致力于数据分析数据搜索等场景服 务。与开源社区背后商业公司 Elastic战略合作,为客户提供企业级权限管控、安全监控告警、自动报表生成等场景服务。Logstash 文档版本:20210802 III 自建 Elastic...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,VPN网关,Elasticsearch,云速搭
自建Hadoop迁移MaxCompute
自建Hadoop迁移MaxCompute
场景描述 客户基于ECS、IDC自建或在友商云平台自建了大数 据集群,为了降低企业大数据计算平台的成本,提高 大数据应用开发效率,更有效保障数据安全,把大数 据集群的数据、作业、调度任务以及业务数据库整体 迁移到MaxCompute和其他云产品。 解决的问题 自建Hadoop集群搬迁到MaxCompute 自建Hbase集群搬迁到云Hbase 自建Kafka或应用数据准实时同步到 MaxCompute 自建Azkaban任务迁移到Dataworks任务 产品列表 MaxCompute,Dataworks、云数据库Hbase版、Datahub、VPC,ECS。
将表 datahub_dataconnector_apache_logs 灌 入 odps_apache_logs 本实践方案中 Hive数据仓库中的原始表 apache_logs有一个分区字段 ds(日期值),每天生成一个分区。在使用 MMA工具迁移到 MaxCompute表 odps_apache_logs的 过程中,保留了该分区字段,因此在 MaxCompute上可以看到该表有一个分区字段:Datahub ...
来自: 最佳实践 | 相关产品:云服务器ECS,DataWorks,大数据计算服务 MaxCompute,云数据库 HBase 版,数据总线,云速搭
云上数据集成解决方案
云上数据集成解决方案提供可跨异构数据存储系统、可靠、安全、低成本、可弹性扩展的数据传输交互服务,有效帮助您解 决云环境、个人站点环境下异构数据存储系统的数据互通难题,让您数据不再成为孤岛!助您实现大数据分析和实时商务智能。
运营团队每天处理分析庞大的天气查询以及广告业务日志,以分析用户行为和挖掘用户个性化需求,亟需将数据集中起来进行大数据分析,同时对数据传输集中工具也提出了更高的要求.网聚宝的数据来源非常广泛,包括三大类数据源:第三方自有的平台、公共的电商平台、公开的信息平台,如何通过数据采集服务分别将这些数据采集到...
来自: 解决方案
低成本跨境文件传输
低成本跨境文件传输
场景描述 1.跨境对象存储数据传输需求。 2.对跨境传输成本控制严苛。 3.能接受一定程度网络抖动带来的文件同步 延迟。 4.系统需要有足够的弹性和扩展性应对大规 模文件的写入。 方案优势/解决问题 1.运维低成本:开发人员关注代码逻辑即可; 2.网络成本低:相比CEN高速通道的方式网 络成本降低; 3.同步服务部署成本低:文件发生变化触发函 数计算任务,按量触发,不用准备ECS; 4.弹性高效:一个文件同步触发一个函数工作 流任务,充分利用资源高效同步。 产品列表 专用网络VPC 云服务器ECS 弹性公网IP 函数计算 对象存储OSS 函数工作流
您无需开发就能快捷完成日志 采集、消费、投递以及查询分析等功能,提升运维、运营效率,建立 DT 时代 海量日志处理能力。官网链接:https://help.aliyun.com/document_detail/48869.html 文档版本:20211025(发布日期)III 低成本跨境文件传输最佳实践 目录 目录 文档版本信息.I 法律声明.I 前言.II 目录.IV 最佳实践...
来自: 最佳实践 | 相关产品:云服务器ECS,对象存储 OSS,函数计算,Serverless 工作流
Serverless图片分类和身份证过滤
Serverless图片分类和身份证过滤
场景描述 场景一:大型图库智能管理通过深度学习算法,自动识别图像中的常见的场景,客户可以基于函数计算对接智能媒体管理的图像识别功能,轻松实现图片的自动管理和分组,完成大型图像库的智能管理。 场景二:身份证图片过滤 通过扫描存储在OSSbucket中的图片,通 过智能媒体管理进行身份证识别,找到海量图片中的身份证图片,对敏感信息进行处理。 解决问题 1.通过无服务器计算实现图片处理自动化 2.OSS触发器的使用 3.使用函数计算调用阿里云的AIP或SDK 产品列表 函数计算 智能媒体管理IMM 对象存储OSS
为云上文档、图片数据,提 供一站式数据处理、分析、检索等管控体验。针对不同的业务场景,封装整合完整 的处理能力,让数据快速流转。更多信息,请参见 IMM 简介(https://www.aliyun.com/product/imm)。对象存储 OSS:是阿里云提供的海量、安全、低成本、高可靠的云存储服务。您 可以在任何应用、任何时间、任何地点存储...
来自: 最佳实践 | 相关产品:对象存储 OSS,函数计算,智能媒体管理
Elasticsearch
阿里云检索分析服务 Elasticsearch 版是100%兼容开源的分布式检索、分析套件。提供ELK等开源全托管的产品服务能力。为结构化/非结构化数据提供低成本、高性能及可靠性的检索、分析平台级产品服务。具备读写分离、存算分离、弹性伸缩、智能化运维、免费的X-Pack高级商业特性等产品特性。
凭借 Elasticsearch 数据分析能力实现海量物流数据的价值挖掘,并使用Kibana进行可视化展现.物流供应链服务类企业.采用 Elasticsearch 订单索引架构,不仅降低了50%的成本,同时达到毫秒级准实时查询,QPS提升近1倍,并保障了数据安全.电商平台服务类企业.日志集中采集、管理,实现超8000个/秒的文档索引能力,为业务分析...
来自: 云产品
< 1 2 3 4 ... 14 >
共有14页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用