大数据与云计算专业的职业面向

_相关内容

MaxFrame概述

MaxFrame是由阿里自研的分布式计算框架,支持Python编程接口、兼容Pandas接口且自动进行分布式计算,同时可直接使用MaxCompute计算资源及数据接口,MaxCompute Notebook、镜像管理等功能共同构成了MaxCompute完整的Python开发生态。...

什么是物联网边缘计算

提供的路由路径如下:设备至IoT Hub 设备至函数计算 设备至流数据分析 函数计算至函数计算 函数计算至IoT Hub 流数据分析至IoT Hub 流数据分析至函数计算 IoT Hub至函数计算 断网续传 边缘计算节点在断网或弱网情况下提供数据恢复能力。...

基于Flink的资讯场景实时数仓

实时计算 实时计算(Alibaba Cloud Realtime Compute)是阿里提供的基于Apache Flink构建的企业级大数据计算平台。在PB级别的数据集上可以支持亚秒级别的处理延时,赋能用户标准实时数据处理流程和行业解决方案;支持Datastream API作业...

常见术语

原生数据湖分析(简称DLA)是新一代大数据解决方案,采取计算与存储完全分离的架构,支持数据库(RDS\PolarDB)消息实时归档建仓,提供弹性的SparkPresto,满足在线交互式查询、流处理、批处理、机器学习等诉求,也是传统Hadoop方案...

功能特性

Serverless Presto概述 DLA Serverless Spark DLA Serverless Spark基于原生架构,提供面向数据湖场景的数据分析和计算。开通DLA服务后,您只需简单的配置,就可以提交Spark作业;无需关心Spark集群部署。Serverless Spark概述

什么是原生数据湖分析

原生数据湖分析(简称DLA)是新一代大数据解决方案,采取计算与存储完全分离的架构,支持数据库(RDS\PolarDB\NoSQL)消息实时归档建仓,提供弹性的SparkPresto,满足在线交互式查询、流处理、批处理、机器学习等诉求,也是传统...

应用场景

数据分析业务 云数据库 Memcache 版搭配大数据计算服务 MaxCompute。实现对大数据的分布式分析处理,适用于商业分析、挖掘等大数据处理场景。通过数据集成服务可自助实现数据云数据库 Memcache 版 MaxCompute 间的同步,简化数据操作...

客户案例

MaxCompute已被广泛应用于各领域处理大数据,帮助众多企业解决了海量数据分析问题,同时降低企业运维成本,企业人员可更专注于业务开发。本文为您介绍MaxCompute的精选客户案例。MaxCompute的全量客户案例信息,请参见 行业客户案例...

什么是原生多模数据库Lindorm

流引擎 原生多模数据库 Lindorm 流引擎是 面向流式数据处理 的引擎,提供了流式数据的存储和轻计算功能,帮助您轻松实现流式数据存储至 原生多模数据库 Lindorm,构建基于流式数据的处理和应用。向量引擎 原生多模数据库 Lindorm ...

什么是数据资源平台

支持面向多种云计算资源中的表及字段进行预览和表数据自动探查,提供表级别、字段级别探查结果图表化展示。数据标准:提供逻辑表标准、字段标准(数据元、指标、维度、数据字典等)管理能力。帮助用户通过设计标准数据元素,定义关键业务...

选型配置说明

HDFS、YARN、Hive、Spark、Presto、Impala、JindoData、DeltaLake、Hudi、Iceberg、OpenLDAP、Knox、Kyuubi等 Dataflow 实时数据流场景,其中核心组件Flink是阿里提供的基于Apache Flink和E-MapReduce Hadoop构建的企业级大数据计算平台...

政务迁移实践

云化咨询服务:阿里云迁移团队结合企业的战略目标,为企业三五年甚至更久的云化规划提供战略咨询服务,以专业的云专家助力企业在云计算时代进一步创新发展。例如为IT系统运行在阿里云的客户,提供云计算与新技术应用规划、架构、容器及微...

自媒体:易撰

PolarDB-X 专注解决海量数据存储、超高并发吞吐、表瓶颈以及复杂计算效率等数据库瓶颈问题,历经各届天猫双十一及阿里各行业客户业务的考验,助力企业加速完成业务数字化转型。本文介绍易撰如何通过 PolarDB-X 应对业务挑战。所属行业...

企业版产品系列

计算存储分离 采用计算存储分离的架构,满足公共云计算环境下根据业务发展弹性扩展集群的刚性需求。数据库的计算节点仅存储元数据,而将数据文件、Redo Log等存储在共享分布式存储(PolarStore)的数据库存储节点中。各计算节点之间仅...

操作流程

数据服务API:数据API是一种由云计算资源中的数据通过参数配置生成API的API类型,生成API后可以方便后续调用,减少资源操作成本。上线API 通过上线API操作才能使API被调用。服务调用流程(工作组内)及说明 流程图 流程说明 流程 说明 API...

基于混合负载的查询优化

混合计算引擎 提供InteractiveBatch计算模式,同时提供低延迟实时分析能力与大数据的高吞吐批计算能力,分别满足交互式查询复杂离线计算场景。Interactive模式:采用MPP计算架构,调度粒度为整个查询所有任务,计算过程中pipeline流式...

应用场景

Lindorm是阿里自研的原生多模型数据库,面向海量多模型数据的低成本存储分析,构建万物互联时代的数据底座。Lindorm支持宽表模型、时序模型,提供自研的宽表引擎、时序引擎和搜索引擎,兼容HBase、Phoenix、OpenTSDB、Solr等多种开源...

基本介绍

背景信息 云数据库HBase增强版是由 原生多模数据库Lindorm宽表引擎 提供的、完全兼容HBase的上托管数据库,从2011年开始云数据库HBase增强版正式承载阿里内部业务的海量数据实时存储需求,支撑服务了淘宝、支付宝、菜鸟、优酷、高德等...

什么是MaxCompute

产品优势 MaxCompute的主要优势如下:简单易用 面向数据仓库实现高性能存储、计算。预集成多种服务,标准SQL开发简单。内建完善的管理和安全能力。免运维,按量付费,不使用不产生计算费用。匹配业务发展的弹性扩展能力 存储和计算独立扩展...

原生大数据计算服务 MaxCompute

原生大数据计算服务(MaxCompute)是一种快速、完全托管的TB/PB级数据仓库解决方案。MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海量数据计算问题,有效降低企业成本,并保障数据安全。

授权信息

本文为您介绍 原生大数据计算服务 MaxCompute(MaxCompute)为RAM权限策略定义的操作(Action)、资源(Resource)和条件(Condition)。原生大数据计算服务 MaxCompute(MaxCompute)的RAM代码(RamCode)为 odps,支持的授权粒度为 ...

消息队列 Kafka 版的数据迁移至MaxCompute

本文介绍如何使用DataWorks数据同步功能,将 消息队列 Kafka 版 集群上的数据迁移至阿里云大数据计算服务MaxCompute,方便您对离线数据进行分析加工。前提条件 在开始本教程前,确保您在同一地域中已完成以下操作:消息队列 Kafka 版 ...

产品优势

原生数据湖分析DLA(Data Lake Analytics)是新一代大数据解决方案,采取计算与存储完全分离的架构,支持数据消息实时归档建仓。DLA提供弹性的SparkPresto,满足在线交互式查询、流处理、批处理、机器学习等诉求,也是传统Hadoop...

相关的云服务

DataWorks作为阿里一站式大数据开发治理平台,通常会与计算引擎产品联合使用,此外使用DataWorks进行数据集成时通常联合进行数据传输的数据源产品一起使用。本文为您介绍典型场景下,使用DataWorks时通常会使用到的其他产品。计算...

云计算资源类型

通过了解质量评估支持的云计算资源类型,并在系统设置模块添加质量评估需要使用的云计算资源类型对应资源,以备在运行质量检测计划时使用。本文介绍质量评估模块支持的云计算资源类型。质量规则 支持的云计算资源类型:MaxCompute Hive ...

应用场景

大数据场景 云数据库HBase支持海量全量数据的低成本存储、快速批量导入和实时访问,具备高效的增量及全量数据通道,可轻松Spark、MaxCompute等大数据平台集成,完成数据规模离线分析。优势如下:低成本:高压缩比,数据冷热分离,...

引擎简介

Lindorm宽表引擎是面向海量半结构化、结构化数据设计的分布式存储,适用于元数据、订单、账单、画像、社交、feed流、日志等场景,兼容HBase、Phoenix(SQL)、Cassandra等开源标准接口,支持单表百万亿行规模、千万级并发、毫秒级响应、跨...

产品概述

什么是全密态数据库 全密态数据库是数据存储实验室阿里云数据库团队合作的自研产品,以技术为基石,最小化人员、平台管理等不可控因素造成的潜在数据安全隐患,可以有效杜绝云数据库服务(或应用服务等数据拥有者以外的任何人)接触...

产品概述

什么是全密态数据库 全密态数据库是数据存储实验室阿里云数据库团队合作的自研产品,以技术为基石,最小化人员、平台管理等不可控因素造成的潜在数据安全隐患,可以有效杜绝云数据库服务(或应用服务等数据拥有者以外的任何人)接触...

产品概述

什么是全密态数据库 全密态数据库是 达摩院数据存储实验室 阿里云数据库团队合作的自研产品,以技术为基石,最小化人员、平台管理等不可控因素造成的潜在数据安全隐患,可以有效杜绝云数据库服务(或应用服务等数据拥有者以外的任何...

引擎类型

通信协议级兼容HDFS,可使用开源HDFS客户端直接访问,功能100%兼容HDFS标准,无缝接入所有HDFS开源生态与云计算生态。基于HDFS深度定制开发,具备低成本、EB级数据存储、分钟级存储弹性扩容、带宽水平弹性扩展等能力,适合构建基于HDFS的...

原生能力

DBaaS PolarDB PaaS是阿里云面向线下/混合云数据库市场,推出的轻量级DBaaS(PolarDB as a Service)软件,实现公有一致的用户操作体验,一站式解决数据库全生命周期管理自动化运维。提供企业级功能、稳定可靠、部署灵活;并为用户提供...

新零售:杭州数云信息技术有限公司

PolarDB 采用存储和计算分离的架构,提供分钟级的配置升降级、秒级的故障恢复、全局数据一致性和免费的数据备份容灾服务,既融合了商业数据库稳定可靠、高性能、可扩展的特征,又具有开源云数据库简单开放、自我迭代的优势。本文介绍杭州...

整体架构

AnalyticDB MySQL版 融合了分布式、弹性计算与云计算的优势,对规模性、易用性、可靠性和安全性等方面进行了规模的改进,充分满足不同场景实时数据仓库的需求。支持更规模的并发访问、更快读写能力以及更智能的混合查询负载管理等,...

PolarDB-X历史

去IOE"的目的绝不仅仅是摆脱几个传统IT厂商的产品,而是在互联网+、云计算快速兴起后,企业用户迫切需要能够保证其业务发展和创新的更加开放、灵活、高效的IT基础架构。概括地说,"去IOE"推动了用横向扩展取代纵向扩展,用开源软件代替...

阿里MaxCompute数据

本文介绍 云数据库 SelectDB 版 阿里MaxCompute数据源进行对接使用的流程,帮助您对阿里MaxCompute数据源进行联邦分析。概述 原生大数据计算服务(MaxCompute)是一种快速、完全托管的TB/PB级数据仓库解决方案。MaxCompute向用户提供...

存储类型

原生多模数据库 Lindorm依赖于LindormDFS原生存储系统,实现了数据存储与计算分离。存储容量独立计费,支持不停机在线扩容。Lindorm实例的存储容量在同实例内的多个引擎之间共享。存储类型说明 原生多模数据库Lindorm支持的存储类型...

实时消费Kafka数据

当您需要将Kafka数据写入 原生数据仓库AnalyticDB PostgreSQL版,且不希望使用其他数据集成工具时,可以通过实时数据消费功能直接消费Kafka数据,减少实时处理组件依赖,提升写入吞吐。Apache Kafka是一个容错、低延迟、分布式的发布-...

技术架构

PolarFS作为一款PolarDB深度协同的存储基础设施,其最核心的竞争力不仅体现在性能和扩展性方面,更深层次的则是在面临有许多挑战性的PolarDB客户业务需求和规模化的公有研发运维过程中而长期积累形成的一系列高可靠、高可用、与数据库...

使用流程

原生数据湖分析DLA(Data Lake Analytics)是无服务器(Serverless)化的上交互式查询分析服务,支持通过Presto和Spark引擎分析多种数据源中的数据。快速入门旨在介绍如何开通DLA、构建数据湖、调用Presto和Spark引擎进行数据分析...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用