基于hadoop生态系统的大数据解决方案综述

_相关内容

低成本RDS历史库

大数据生态 无缝对接Spark、Hive、Flink、Presto等开源大数据生态产品,支持API访问和文件读取等多种对接方式,简单高效满足用户海量数据分析需求。典型应用 用户交易记录通过App写入MySQL,LTS将MySQL中实时同步到Lindorm,近三个月状态...

从Oracle迁移应用至阿里云PolarDB全流程指南

概述 阿里巴巴基于多年去IOE(即IBM的大型机或小型机、Oracle的数据库、EMC的存储设备)最佳实践,总结出一套专业的迁移Oracle上云的方法论以及解决方案。并建立专业的团队和专业的工具帮助企业最小成本、最低风险、最短周期迁移Oracle上云...

SQL常见问题

解决方案 如果您使用实时计算引擎vvr-4.0.8-flink-1.13及以后的版本,则可以根据需求来选择解决方案:如果您需要多并发读取MySQL CDC的数据,则在DDL中必须配置主键(PK)。如果您不需要多并发读取MySQL CDC的数据,需要将 scan....

低成本历史库

大数据生态 无缝对接Spark、Hive、Flink、Presto等开源大数据生态产品,支持API访问和文件读取等多种对接方式,简单高效满足用户海量数据分析需求。典型应用 用户交易记录通过App写入MySQL,LTS将MySQL中实时同步到Lindorm,近三个月状态...

开源支持

MaxCompute是阿里巴巴自研的一站式的快速、完全托管的TB/PB/EB级数据仓库解决方案。本文将为您介绍MaxCompute相关的开源功能。SDK MaxCompute提供Java SDK和Python SDK接口实现创建、查看、删除MaxCompute表等操作。通过SDK,您可以通过...

应用场景:低成本历史库

大数据生态 无缝对接Spark、Hive、Flink、Presto等开源大数据生态产品,支持API访问和文件读取等多种对接方式,简单高效满足用户海量数据分析需求。典型应用 用户交易记录通过APP写入MySQL,LTS将MySQL中实时同步到Lindorm,近三个月状态...

云原生可观测服务内容说明

1.服务概述 1.1 服务说明 云原生可观测服务是在客户系统上云、用云过程中,提供以阿里云产品体系为主,开源生态组件为辅的统一可观测方案设计、验证与落地的专家服务。该服务基于客户现实情况,以及可观测治理目标,为客户提供统一可观测...

自媒体:易撰

自媒体 网站地址:易撰 客户介绍 长沙营智信息技术有限公司是专业的新媒体大数据服务商,其旗下知名品牌易撰,基于新媒体大数据挖掘技术及NLP算法分析,为各内容创客、广告主提供全面、科学、精准的大数据分析服务以及大数据架构解决方案。...

什么是云原生数据库PolarDB分布式版

本文介绍什么是 云原生数据库PolarDB分布式版,也称为 PolarDB分布式版,本手册中简称为 PolarDB-X...专有云DBStack:轻量级数据库管理服务平台,集成阿里云核心数据库产品,满足构建高性能、高可用、低成本的全场景数据解决方案用户需求。

Iceberg概述

您可以借助Iceberg快速地在HDFS或者阿里云OSS上构建自己的数据湖存储服务,并借助开源大数据生态的Spark、Flink、Hive和Presto等计算引擎来实现数据湖的分析。核心能力 Apache Iceberg设计初衷是为了解决Hive数仓上云的问题,经过多年迭代...

RDS术语

M MaxCompute 大数据计算服务MaxCompute(原名ODPS)是一种快速、完全托管的TB/PB级数据仓库解决方案,提供了完善的数据导入方案以及多种经典的分布式计算模型,能够快速地解决海量数据计算问题。通过数据集成服务,可将RDS数据导入...

RDS术语

M MaxCompute 大数据计算服务MaxCompute(原名ODPS)是一种快速、完全托管的TB/PB级数据仓库解决方案,提供了完善的数据导入方案以及多种经典的分布式计算模型,能够快速地解决海量数据计算问题。通过数据集成服务,可将RDS数据导入...

概览

面向AIGC中文文生图模型的WebUI使用 AI个人写真 推荐算法定制概述 推荐解决方案综述 灵骏智算资源组使用指南 智能文创解决方案 智能货柜商品分析解决方案 机器阅读理解解决方案 多模态检索解决方案 工业质检解决方案 图像内容风控解决方案 ...

PolarDB HTAP实时数据分析技术解密

MySQL生态HTAP数据库解决方案 MySQL是一款主要面向OLTP场景设计的开源数据库。开源社区的研发方向侧重于加强其事务处理的能力,例如:提升单核性能、多核扩展性能、增强集群能力以提升可用性等。在处理大数据量下复杂查询所需要的能力方面...

RDS术语

M MaxCompute 大数据计算服务MaxCompute(原名ODPS)是一种快速、完全托管的TB/PB级数据仓库解决方案,提供了完善的数据导入方案以及多种经典的分布式计算模型,能够快速地解决海量数据计算问题。通过数据集成服务,可将RDS数据导入...

系统检查点或作业快照

本文为您介绍实时计算Flink版系统检查点或作业快照相关的常见问题。两次Checkpoint最小间隔时间计算方式 VVR 8.x和VVR 6.x使用的GeminiStateBackend有什么区别?报错:org.apache.flink.util.SerializedThrowable 报错:You are using the ...

RDS术语

M MaxCompute 大数据计算服务MaxCompute(原名ODPS)是一种快速、完全托管的TB/PB级数据仓库解决方案,提供了完善的数据导入方案以及多种经典的分布式计算模型,能够快速地解决海量数据计算问题。通过数据集成服务,可将RDS数据导入...

RDS术语

M MaxCompute 大数据计算服务MaxCompute(原名ODPS)是一种快速、完全托管的TB/PB级数据仓库解决方案,提供了完善的数据导入方案以及多种经典的分布式计算模型,能够快速地解决海量数据计算问题。通过数据集成服务,可将RDS数据导入...

深度解析Lindorm搜索索引(SearchIndex)特性

索引是加速数据库查询的重要手段,Lindorm除了提供高性能的二级索引外,同时支持搜索索引(SearchIndex),主要面向复杂的多维查询场景,并能够覆盖...在之前,面对上面的诉求,一般的解决方案是MySQL+搜索引擎。业务双写到两个系统中,或者借助...

DataWorks On CDP/CDH使用说明

DataWorks支持基于CDH(Cloudera's Distribution Including Apache Hadoop,以下简称CDH)和CDP(Cloudera Data Platform,以下简称CDP)集群创建Hive、MR、Presto和Impala等节点,实现CDP/CDH任务工作流的配置、定时调度和元数据管理等...

2021年

诊断功能主要支持7天以内的SQL、MapReduce类型的作业诊断,基于作业运行时产生的各个阶段状态信息,与作业历史运行数据进行对比分析,得出作业相比历史在某些环节或诊断维度上的缺陷和问题,并针对问题给出相应的原因和解决方案。...

2022年

基于MaxCompute的智能推荐解决方案 基于MaxCompute+开放搜索的电商、零售行业搜索开发实践 基于MaxCompute+PAI的用户增长方案实践 基于MaxCompute的实时数据处理实践 基于MaxCompute分布式Python能力的规模数据科学分析 基于MaxCompute+...

东软案例

企业面向客户、合作伙伴和内部员工建设IT系统及应用复杂度和数量会随着产品智能、互联化的深入持续增长,对映可用性保障运维监控采集数据采集种类,以及需要存储的数据量同步激增,现有监控系统基于RRD数据库或关系数据库搭建的单模引擎的...

AIOps 解决方案专家服务内容说明

智能算法列表 类型 算法名称 算法逻辑 异常诊断类算法 One-Class SVM 基于历史批量数据的做算法学习并进行异常诊断 异常诊断类算法 孤立深林 基于历史批量数据的做算法学习并进行异常诊断 异常诊断类算法 Robust Covariance 基于历史批量...

管理控制台功能概览

扩展程序Extensions 数据湖集成(湖仓一体)阿里云的湖仓一体是以MaxCompute为数仓,以Hadoop平台、云对象存储OSS为数据湖的“一仓多湖”的架构,可以打破数据湖与数据仓库割裂的体系,并将数据湖的灵活性、生态丰富能力与数据仓库的企业级...

大数据用户画像解决方案

进入互联网,特别是移动互联网时代,用户随时随地都会在...多维度&复杂查询:原生全局二级索引、Lindorm Search满足多维度查询需求 方案详情&专家服务 解决方案详情参见:基于Lindorm的大数据用户画像解决方案 任何问题,欢迎联系 技术支持。

基于MaxCompute进行大数据BI分析

通过MaxCompute、AnalyticDB MySQL强大的数据加工和分析能力,降低大数据平台建设的门槛,轻松解决了海量数据的计算问题。同时有效降低企业成本,并保障数据安全。与第三方开源生态无缝对接,在不侵入用户应用的情况下,传输日志至日志服务...

自助建站方式汇总

搭建Magento电子商务网站 Magento是一款开源的电子商务网站,其丰富的模块化架构体系及拓展功能可为中型站点提供解决方案。Magento使用PHP开发,并使用MySQL存储数据。网站类型 部署方式 说明 搭建Magento电子商务网站 使用云市场镜像...

外部表

MaxCompute 大数据计算服务MaxCompute为您提供快速且完全托管的数据仓库解决方案,并可以通过与OSS的结合,高效经济地分析处理海量数据。MaxCompute外部表 该功能基于MaxCompute新一代的V2.0计算框架,可以帮助您直接对OSS中的海量文件进行...

SmartData使用说明(EMR-3.20.0~3.22.0版本)

应用场景 E-MapReduce目前提供了三种大数据存储系统,E-MapReduce OssFileSystem、E-MapReduce HDFS和E-MapReduce JindoFS,其中OssFileSystem和JindoFS都是云上存储的解决方案,下表为这三种存储系统和开源OSS各自的特点。特点 开源OSS E-...

功能简介

数据资源平台中的数据标准、数据模型、数据加工场景、数据服务API、云计算资源配置等资产,经过验证最终可沉淀为一个特定的解决方案。支持通过不同的创建方式,灵活的选择解决方案中包含的内容。依托数据资源平台中管理的大量元数据,确保...

解决方案

数据资源平台中的数据标准、数据模型、数据加工场景、数据服务API、云计算资源配置等资产,经过验证最终可沉淀为一个特定的解决方案。支持通过不同的创建方式,灵活的选择解决方案中包含的内容。依托数据资源平台中管理的大量元数据,确保...

生态集成

云原生数据仓库AnalyticDB PostgreSQL版 具备完善和开放的生态系统,支持无缝对接业界以及阿里云生态的数据管理工具,BI报表可视化工具,ETL工具,数据迁移工具,同时可以与业界流行的流式处理系统,日志类系统,大数据类系统,传统数仓及...

新零售:特步

业务架构 客户价值 基于 PolarDB-X+RDS的分布式数据解决方案+业务中台提升客户数据链路的时效性以及客户业务系统的吞吐能力,使订单、库存、商品、销售的数据能实时从业务端到业务中台再到报表系统做销售业务决策。基于 PolarDB-X+RDS的...

计算设置概述

亚信DP5.3 Hadoop 基于开源生态,依托电信级技术能力构建的大数据生产运营一体化支撑平台。星环ArgoDB Transwarp ArgoDB是星环科技的分布式分析性数据库。说明 星环ArgoDB不支持智能研发版。设置Dataphin实例的计算引擎为TDH或ArgoDB 星环...

数据安全

多可用区部署 云原生多模数据库 Lindorm 的多可用区部署方案是指将一个Lindorm实例部署在多个可用区,多可用区实例具备更高的容灾能力,同时Lindorm实例可以实现多个可用区之间数据的强一致,也可以在数据最终一致的情况下发出请求,快速...

数仓场景:即席查询

本文通过示例为您介绍如何基于EMR Serverless StarRocks的视图能力构建数仓场景-即席查询解决方案。前提条件 已创建DataFlow或自定义集群,具体操作请参见 创建集群。已创建EMR Serverless StarRocks实例,具体操作请参见 创建实例。已创建...

新零售行业解决方案

基于阿里云ADAM和 PolarDB PostgreSQL版(兼容Oracle)替代商业版数据库,优化IT的成本结构,每年不但节省大量License授权费用,并且极地提升了系统可用性 应用和数据库都部署在云上,可以充分利用云资源的弹性能力,解决网络延迟问题,...

DBS沙箱功能概览

相比现有基于大数据平台的历史数据离线分析方案,DBS沙箱功能提供原始数据库SQL接口,不需要开发人员编写离线分析脚本,并由于使用快照存储机制,存储成本也更低。费用说明 更多信息,请参见 DBS沙箱费用。后续步骤 自建MySQL应急恢复...

资产质量概述

资产质量基于Dataphin平台,为数据的开发及使用提供全套的数据质量解决方案。数据质量的功能包括质量规则配置、质量监控、调度配置、智能报警、校验治理等。前提条件 已购买资产质量增值服务,详情请参见 开通Dataphin。背景信息 面对各行...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用