大数据与云计算专业的职业面向-大数据与云计算专业的职业面向文档介绍内容-移动阿里云

MaxFrame概述

MaxFrame是由阿里云自研的分布式计算框架，支持Python编程接口、兼容Pandas接口且自动进行分布式计算，同时可直接使用MaxCompute计算资源及数据接口，与MaxCompute Notebook、镜像管理等功能共同构成了MaxCompute完整的Python开发生态。...

什么是物联网边缘计算

提供的路由路径如下：设备至IoT Hub 设备至函数计算设备至流数据分析函数计算至函数计算函数计算至IoT Hub 流数据分析至IoT Hub 流数据分析至函数计算 IoT Hub至函数计算断网续传边缘计算节点在断网或弱网情况下提供数据恢复能力。...

基于Flink的资讯场景实时数仓

实时计算实时计算（Alibaba Cloud Realtime Compute）是阿里云提供的基于Apache Flink构建的企业级大数据计算平台。在PB级别的数据集上可以支持亚秒级别的处理延时，赋能用户标准实时数据处理流程和行业解决方案；支持Datastream API作业...

常见术语

云原生数据湖分析（简称DLA）是新一代大数据解决方案，采取计算与存储完全分离的架构，支持数据库（RDS\PolarDB）与消息实时归档建仓，提供弹性的Spark与Presto，满足在线交互式查询、流处理、批处理、机器学习等诉求，也是传统Hadoop方案...

功能特性

Serverless Presto概述 DLA Serverless Spark DLA Serverless Spark基于云原生架构，提供面向数据湖场景的数据分析和计算。开通DLA服务后，您只需简单的配置，就可以提交Spark作业；无需关心Spark集群部署。Serverless Spark概述

什么是云原生数据湖分析

云原生数据湖分析（简称DLA）是新一代大数据解决方案，采取计算与存储完全分离的架构，支持数据库（RDS\PolarDB\NoSQL）与消息实时归档建仓，提供弹性的Spark与Presto，满足在线交互式查询、流处理、批处理、机器学习等诉求，也是传统...

应用场景

数据分析业务 云数据库 Memcache 版搭配大数据计算服务 MaxCompute。实现对大数据的分布式分析处理，适用于商业分析、挖掘等大数据处理场景。通过数据集成服务可自助实现数据在云数据库 Memcache 版与 MaxCompute 间的同步，简化数据操作...

客户案例

MaxCompute已被广泛应用于各大领域处理云上大数据，帮助众多企业解决了海量数据分析问题，同时降低企业运维成本，企业人员可更专注于业务开发。本文为您介绍MaxCompute的精选客户案例。MaxCompute的全量客户案例信息，请参见行业客户案例...

什么是云原生多模数据库Lindorm

流引擎云原生多模数据库 Lindorm 流引擎是面向流式数据处理的引擎，提供了流式数据的存储和轻计算功能，帮助您轻松实现流式数据存储至云原生多模数据库 Lindorm，构建基于流式数据的处理和应用。向量引擎云原生多模数据库 Lindorm ...

什么是数据资源平台

支持面向多种云计算资源中的表及字段进行预览和表数据自动探查，提供表级别、字段级别探查结果图表化展示。数据标准：提供逻辑表标准、字段标准（数据元、指标、维度、数据字典等）管理能力。帮助用户通过设计标准数据元素，定义关键业务...

选型配置说明

HDFS、YARN、Hive、Spark、Presto、Impala、JindoData、DeltaLake、Hudi、Iceberg、OpenLDAP、Knox、Kyuubi等 Dataflow 实时数据流场景，其中核心组件Flink是阿里云提供的基于Apache Flink和E-MapReduce Hadoop构建的企业级大数据计算平台...

政务云迁移实践

云化咨询服务：阿里云迁移团队结合企业的战略目标，为企业三五年甚至更久的云化规划提供战略咨询服务，以专业的云专家助力企业在云计算时代进一步创新发展。例如为IT系统运行在阿里云的客户，提供云计算与新技术应用规划、架构、容器及微...

自媒体：易撰

PolarDB-X 专注解决海量数据存储、超高并发吞吐、大表瓶颈以及复杂计算效率等数据库瓶颈问题，历经各届天猫双十一及阿里云各行业客户业务的考验，助力企业加速完成业务数字化转型。本文介绍易撰如何通过 PolarDB-X 应对业务挑战。所属行业...

企业版产品系列

计算与存储分离采用计算与存储分离的架构，满足公共云计算环境下根据业务发展弹性扩展集群的刚性需求。数据库的计算节点仅存储元数据，而将数据文件、Redo Log等存储在共享分布式存储（PolarStore）的数据库存储节点中。各计算节点之间仅...

操作流程

数据服务API：数据API是一种由云计算资源中的数据通过参数配置生成API的API类型，生成API后可以方便后续调用，减少资源操作成本。上线API 通过上线API操作才能使API被调用。服务调用流程（工作组内）及说明流程图流程说明流程说明 API...

基于混合负载的查询优化

混合计算引擎提供Interactive与Batch计算模式，同时提供低延迟实时分析能力与大数据的高吞吐批计算能力，分别满足交互式查询与复杂离线计算场景。Interactive模式：采用MPP计算架构，调度粒度为整个查询所有任务，计算过程中pipeline流式...

应用场景

Lindorm是阿里云自研的云原生多模型数据库，面向海量多模型数据的低成本存储分析，构建万物互联时代的数据底座。Lindorm支持宽表模型、时序模型，提供自研的宽表引擎、时序引擎和搜索引擎，兼容HBase、Phoenix、OpenTSDB、Solr等多种开源...

基本介绍

背景信息 云数据库HBase增强版是由云原生多模数据库Lindorm宽表引擎提供的、完全兼容HBase的云上托管数据库，从2011年开始云数据库HBase增强版正式承载阿里内部业务的海量数据实时存储需求，支撑服务了淘宝、支付宝、菜鸟、优酷、高德等...

什么是MaxCompute

产品优势 MaxCompute的主要优势如下：简单易用 面向数据仓库实现高性能存储、计算。预集成多种服务，标准SQL开发简单。内建完善的管理和安全能力。免运维，按量付费，不使用不产生计算费用。匹配业务发展的弹性扩展能力存储和计算独立扩展...

云原生大数据计算服务 MaxCompute

云原生大数据计算服务(MaxCompute)是一种快速、完全托管的TB/PB级数据仓库解决方案。MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型，能够更快速的解决用户海量数据计算问题，有效降低企业成本，并保障数据安全。

授权信息

本文为您介绍云原生大数据计算服务 MaxCompute（MaxCompute）为RAM权限策略定义的操作（Action）、资源（Resource）和条件（Condition）。云原生大数据计算服务 MaxCompute（MaxCompute）的RAM代码（RamCode）为 odps，支持的授权粒度为 ...

将云消息队列 Kafka 版的数据迁移至MaxCompute

本文介绍如何使用DataWorks数据同步功能，将云消息队列 Kafka 版集群上的数据迁移至阿里云大数据计算服务MaxCompute，方便您对离线数据进行分析加工。前提条件在开始本教程前，确保您在同一地域中已完成以下操作：云消息队列 Kafka 版 ...

产品优势

云原生数据湖分析DLA（Data Lake Analytics）是新一代大数据解决方案，采取计算与存储完全分离的架构，支持数据库与消息实时归档建仓。DLA提供弹性的Spark与Presto，满足在线交互式查询、流处理、批处理、机器学习等诉求，也是传统Hadoop...

云计算资源类型

通过了解质量评估支持的云计算资源类型，并在系统设置模块添加质量评估需要使用的云计算资源类型对应资源，以备在运行质量检测计划时使用。本文介绍质量评估模块支持的云计算资源类型。质量规则支持的云计算资源类型：MaxCompute Hive ...

应用场景

大数据场景 云数据库HBase支持海量全量数据的低成本存储、快速批量导入和实时访问，具备高效的增量及全量数据通道，可轻松与Spark、MaxCompute等大数据平台集成，完成数据的大规模离线分析。优势如下：低成本：高压缩比，数据冷热分离，...

引擎简介

Lindorm宽表引擎是面向海量半结构化、结构化数据设计的分布式存储，适用于元数据、订单、账单、画像、社交、feed流、日志等场景，兼容HBase、Phoenix（SQL）、Cassandra等开源标准接口，支持单表百万亿行规模、千万级并发、毫秒级响应、跨...

产品概述

什么是全密态数据库全密态数据库是数据库与存储实验室与阿里云数据库团队合作的自研产品，以技术为基石，最小化人员、平台管理等不可控因素造成的潜在数据安全隐患，可以有效杜绝云数据库服务（或应用服务等数据拥有者以外的任何人）接触...

产品概述

什么是全密态数据库全密态数据库是数据库与存储实验室与阿里云数据库团队合作的自研产品，以技术为基石，最小化人员、平台管理等不可控因素造成的潜在数据安全隐患，可以有效杜绝云数据库服务（或应用服务等数据拥有者以外的任何人）接触...

产品概述

什么是全密态数据库全密态数据库是达摩院数据库与存储实验室与阿里云数据库团队合作的自研产品，以技术为基石，最小化人员、平台管理等不可控因素造成的潜在数据安全隐患，可以有效杜绝云数据库服务（或应用服务等数据拥有者以外的任何...

引擎类型

通信协议级兼容HDFS，可使用开源HDFS客户端直接访问，功能100%兼容HDFS标准，无缝接入所有HDFS开源生态与云计算生态。基于HDFS深度定制开发，具备低成本、EB级数据存储、分钟级存储弹性扩容、带宽水平弹性扩展等能力，适合构建基于HDFS的...

云原生能力

DBaaS PolarDB PaaS是阿里云面向线下/混合云数据库市场，推出的轻量级DBaaS(PolarDB as a Service)软件，实现与公有云一致的用户操作体验，一站式解决数据库全生命周期管理与自动化运维。提供企业级功能、稳定可靠、部署灵活；并为用户提供...

新零售：杭州数云信息技术有限公司

PolarDB 采用存储和计算分离的架构，提供分钟级的配置升降级、秒级的故障恢复、全局数据一致性和免费的数据备份容灾服务，既融合了商业数据库稳定可靠、高性能、可扩展的特征，又具有开源云数据库简单开放、自我迭代的优势。本文介绍杭州...

整体架构

AnalyticDB MySQL版融合了分布式、弹性计算与云计算的优势，对规模性、易用性、可靠性和安全性等方面进行了大规模的改进，充分满足不同场景实时数据仓库的需求。支持更大规模的并发访问、更快读写能力以及更智能的混合查询负载管理等，...

PolarDB-X历史

去IOE"的目的绝不仅仅是摆脱几个传统IT厂商的产品，而是在互联网+、云计算快速兴起后，企业用户迫切需要能够保证其业务发展和创新的更加开放、灵活、高效的IT基础架构。概括地说，"去IOE"推动了用横向扩展取代纵向扩展，用开源软件代替...

阿里云MaxCompute数据源

本文介绍 云数据库 SelectDB 版与阿里云MaxCompute数据源进行对接使用的流程，帮助您对阿里云MaxCompute数据源进行联邦分析。概述云原生大数据计算服务(MaxCompute)是一种快速、完全托管的TB/PB级数据仓库解决方案。MaxCompute向用户提供...

存储类型

云原生多模数据库 Lindorm依赖于LindormDFS云原生存储系统，实现了数据存储与计算分离。存储容量独立计费，支持不停机在线扩容。Lindorm实例的存储容量在同实例内的多个引擎之间共享。存储类型说明云原生多模数据库Lindorm支持的存储类型...

实时消费Kafka数据

当您需要将Kafka数据写入云原生数据仓库AnalyticDB PostgreSQL版，且不希望使用其他数据集成工具时，可以通过实时数据消费功能直接消费Kafka数据，减少实时处理组件依赖，提升写入吞吐。Apache Kafka是一个容错、低延迟、分布式的发布-...

技术架构

PolarFS作为一款与PolarDB深度协同的存储基础设施，其最核心的竞争力不仅体现在性能和扩展性方面，更深层次的则是在面临有许多挑战性的PolarDB客户业务需求和规模化的公有云研发运维过程中而长期积累形成的一系列高可靠、高可用、与数据库...

使用流程

云原生数据湖分析DLA（Data Lake Analytics）是无服务器（Serverless）化的云上交互式查询分析服务，支持通过Presto和Spark引擎分析多种数据源中的数据。快速入门旨在介绍如何开通DLA、构建数据湖、调用Presto和Spark引擎进行数据分析与...