大数据应用要学什么

_相关内容

Spark

使用场景 离线ETL 离线ETL主要应用数据仓库,对规模的数据进行抽取(Extract)、转换(Transform)和加载(Load),其特点是数据,耗时较长,通常设置为定时任务执行。在线数据分析(OLAP)在线数据分析主要应用于BI(Business ...

数据查询

数据预览 支持不同云计算资源数据的快速预览,可为开发人员和数据应用人员提供全面直观的数据呈现。支持MaxCompute、RDS MySQL、PostgreSQL、AnalyticDB PostgreSQL、Hologres多种云计算资源进行物理表数据预览,可快速对各类数据资源下的...

创建及管理元数据采集任务

采集任务通过采集适配器连接到指定的数据源,将源数据库中的对象元数据信息采集至Dataphin,通过内置解析器进行解析后存储并进行统一呈现。本文为您介绍如何创建及管理元数据采集任务。前提条件 需先在 管理中心 数据源管理 应用系统 创建...

应用场景

数据分析业务 云数据库 Memcache 版搭配大数据计算服务 MaxCompute。实现对大数据的分布式分析处理,适用于商业分析、挖掘等大数据处理场景。通过数据集成服务可自助实现数据在云数据库 Memcache 版与 MaxCompute 间的同步,简化数据操作...

创建及管理元数据采集任务

采集任务通过采集适配器连接到指定的数据源,将源数据库中的对象元数据信息采集至Dataphin,通过内置解析器进行解析后存储并进行统一呈现。本文为您介绍如何创建及管理元数据采集任务。前提条件 需先在 管理中心 数据源管理 应用系统 创建...

数据安全最佳实践

针对数据安全,RDS MySQL自身提供了基础的安全保障,您还可以参见本文内容进行实例的创建和设置,进一步提高数据安全级别。实例容灾 多可用区 RDS每个地域都包含多个可用区。同一个地域中的可用区都被设计为相互之间网络延迟很小(3ms以内...

大数据安全治理的难点

流转 大数据系统通常是端到端的一整套数据开发和治理服务,不仅采集数据、加工数据,更数据提供给业务方使用。因此,其存在错综复杂的数据流转链路,包括但不限于即席查询链路、离线传输链路、实时传输链路、数据服务API链路、其他...

数据服务

常见数据应用问题 一般从需求提出到需求交付需要经历的过程为:需求提出 需求分析 产品设计开发文档 开发人员进行开发 功能测试 功能上线 需求交付,整个过程需要安排迭代、开发、测试,时间周期约为两周,开发的接口针对性强,大多只能...

功能简介

数据预览 支持不同云计算资源数据的快速预览,可为开发人员和数据应用人员提供全面直观的数据呈现。支持MaxCompute、RDS MySQL、PostgreSQL、AnalyticDB PostgreSQL、Hologres 多种云计算资源进行物理表数据预览,可快速对各类数据资源下的...

数据服务概述

常见数据应用问题 一般从需求提出到需求交付需要经历的过程为:需求提出 需求分析 产品设计开发文档 开发人员进行开发 功能测试 功能上线 需求交付,整个过程需要安排迭代、开发、测试,时间周期约为两周,开发的接口针对性强,大多只能...

典型使用场景

传统方案数据生产者需要双写数据库和消息队列,但是这样一方面增加了应用的复杂度,同时保证一致性,又会牺牲应用的可用性和效率,因为数据库和消息队列任务一个出问题都会影响应用系统。应用可以将消息队列的消息投递解耦,交由...

什么是Web应用防火墙

融合大数据分析与机器学习技术,持续迭代攻击识别模型,提升威胁识别的准确性与覆盖范围。更多产品信息,请参见 Web应用防火墙产品页面。如何使用WAF 更多信息,请参见 快速使用WAF 3.0。应用防护 RASP和Web应用防火墙的关系 应用防护RASP...

什么是DataV-Board

生态集成:与阿里云其他产品和服务无缝集成,构建完整的数据应用生态。常见问题 DataV-Board和DataV 什么关系?DataV-Board产品即原DataV产品。产品品牌升级之后,DataV成为主品牌名称。该产品系列包含DataV-Board(数据看板)、DataV-Note...

查看基础监控数据

应用:默认显示。应用维度的监控指标为实例平均值。实例:实例维度的监控指标为单实例数值。在 资源类型 栏,单击 实例。监控数据包括以下维度:CPU使用率 系统平均负载 内存使用量 网络流入流出速率 网络数据包 磁盘使用量 磁盘IOPS 磁盘...

新手指引

什么是轻量应用服务器 轻量应用服务器的产品优势 轻量应用服务器的应用场景 轻量应用服务器支持的镜像 轻量应用服务器的使用限制 轻量应用服务器与云服务器ECS对比 快速使用流程 轻量应用服务器的镜像分为基于Linux操作系统和Windows操作...

产品概述

阿里云流数据处理平台数据总线 DataHub 是流式数据(Streaming Data)的处理平台,提供流式数据的发布(Publish)、订阅(Subscribe)和分发功能,支持构建基于流式数据的分析和应用。产品概述 数据总线(DataHub)是阿里云提供的一款流式...

产品计费

OIDC入方向IdP的联邦认证(登录到 IDaaS)、手动绑定账户 支持 支持 OIDC入方向IdP的自动绑定、自动创建和自动更新信息,用于联动Azure AD(EntraID)、Okta、自建4A等身份登录 IDaaS或应用 不支持 支持 所有出方向IdP的登录、数据同步等...

应用列表

您可以通过应用名称模糊搜索,或通过选择标签和 仅查看有数据应用 选项筛选应用。应用列表 页面显示了所有应用的名称、技术栈、探针类型、提供服务请求数、提供服务错误数、提供服务响应时间与Trace质量分数。说明 请求类型包含了除user_...

常见问题

ACK应用安装Agent相关 为什么应用更换了集群或Namespace后监控数据异常?如何卸载arms-pilot和安装ack-onepilot 如何在VPC网络不通的情况下使用ack-onepilot 为什么ACK集群应用安装探针后没有监控数据?容器服务K8s集群中的应用安装探针...

管理数据

单击控制台左上角的 图标,选择 全部功能 Data+AI 数据应用 数据分析。说明 若您使用的是非极简模式的控制台,在顶部菜单栏中,选择 Data+AI 数据应用 数据分析。进入数据分析页面,单击 数据集 页签。单击 新建数据集,配置如下信息:配置...

仪表盘

说明 若您使用的是非极简模式的控制台,在顶部菜单栏中,选择 Data+AI 数据应用 数据分析。进入数据分析页面,单击 数据展示 页签。单击 新建仪表盘集合,配置 仪表盘集合名称 和 描述(可选)信息。单击 确认。即可完成仪表盘集合的创建,...

数仓分层

基于阿里巴巴OneData方法论最佳实践,在阿里巴巴的数据体系中,建议将数据仓库分为三层:数据引入层(ODS,Operational Data Store)、数据公共层(CDM,Common Dimensions Model)和数据应用层(ADS,Application Data Store)。...

数仓分层

在阿里巴巴的数据体系中,我们建议将数据仓库分为三层,自下而上为:数据引入层(ODS,Operation Data Store)、数据公共层(CDM,Common Data Model)和数据应用层(ADS,Application Data Service)。数据仓库的分层和各层级用途如下图所...

技术架构选型

最终目标是支撑商家增长、行业增量分析与精细化运营等多类数据应用场景。数据采集层 数据采集层采用DataWorks数据集成 作为统一的数据入口,用于接入三类核心数据源:业务系统数据库(如商品中心、交易中心、品牌库)。埋点数据。日志数据...

常见问题概述

ACK应用安装Agent相关 为什么应用更换了集群或Namespace后监控数据异常?如何安装ack-onepilot和卸载arms-pilot 如何在VPC网络不通的情况下使用ack-onepilot 为什么ACK集群应用安装探针后没有监控数据?容器服务K8s集群中的应用安装探针...

应用场景

通过结合其他云产品,云数据库RDS可以适用于更多典型的应用场景。自建库搭配RDS实现异地容灾 RDS搭配异构数据库实现数据多样化存储 RDS结合开放搜索服务实现复杂搜索 开启读写分离扩展RDS处理能力 RDS搭配大数据计算服务实现规模数据计算

数仓分层

在阿里巴巴的数据体系中,我们建议将数据仓库分为三层,自下而上为:数据引入层(ODS,Operation Data Store)、数据公共层(CDM,Common Data Model)和数据应用层(ADS,Application Data Service)。数据仓库的分层和各层级用途如下图所...

快速入门

C++应用 通过OpenTelemetry上报C++应用数据 通过Jaeger上报C++应用数据 Ruby应用 通过OpenTelemetry上报Ruby应用数据 Swift应用 通过OpenTelemetry上报Swift应用数据 Android应用 通过OpenTelemetry上报Android应用数据 Rust应用 通过...

区域热力层(v4.x版本)

数据源面板 地理边界geojson数据接口:通过配置地理边界geojson数据接口,可将提取到的区域GeoJSON边界数据应用到DataV中,配置方法如下。数据提取。使用GeoJSON行政区划边界提取小工具 DataV.GeoAtlas,最低可以提取区县级边界数据,提取...

接入指南

通过SkyWalking上报Go应用数据 通过Zipkin上报Go应用数据 Python应用 通过OpenTelemetry上报Python应用数据 通过SkyWalking上报Python应用数据 通过Jaeger上报Python应用数据 Node.js应用 通过OpenTelemetry上报Node.js应用数据 通过...

添加宜搭数据

宜搭是阿里巴巴自研的低代码应用构建平台,您可以通过可视化拖拽的方式,快速完成数据应用的搭建。本文为您介绍在DataV中添加和使用宜搭数据源的方法,以及相关参数配置说明。前提条件 已通过钉钉登录 宜搭控制台 创建一个宜搭应用数据表单...

什么是EMR on ECS

EMR on ECS是指在ECS上运行EMR,它将EMR的大数据处理能力与ECS的弹性灵活优势相结合,使得您能够更加便捷地配置和管理EMR集群,同时支持多种开源和自研大数据组件,适用于复杂的大数据处理和分析场景。产品架构 EMR主要由四部分组成,分别...

什么是Web应用防火墙

Web应用防火墙(Web Application Firewall,简称WAF)为您的网站或App业务提供一站式安全防护。WAF可以有效识别Web业务流量的恶意特征,在对流量清洗和过滤后,将正常、安全的流量返回给服务器,避免网站服务器被恶意入侵导致性能异常等...

功能特性

通过OpenTelemetry上报Go应用数据 通过Jaeger上报Go应用数据 通过Zipkin上报Go应用数据 通过SkyWalking上报Go应用数据 接入Python应用 支持通过OpenTelemetry、Skywalking、Jaeger上报Python应用性能数据。通过OpenTelemetry上报Python应用...

添加宜搭数据

宜搭是阿里巴巴自研的低代码应用构建平台,您可以通过可视化拖拽的方式,快速完成数据应用的搭建。本文为您介绍在DataV中添加和使用宜搭数据源的方法,以及相关参数配置说明。前提条件 已使用钉钉账号登录 宜搭控制台,并成功创建了一个 宜...

什么是DataWorks

DataWorks是一站式智能大数据开发治理平台,适配阿里云MaxCompute、E-MapReduce、Hologres、Flink、AnalyticDB、StarRocks、PAI 等数十种大数据和AI计算服务,为数据仓库、数据湖、湖仓一体、Data+AI解决方案提供全链路智能化的数据集成、...

数据分析

本文介绍DMS数据分析的基本概念、设计理念和主要应用场景。背景信息 DMS数据分析提供典型的数据集、仪表盘和大屏模型,在仪表盘或大屏中提供丰富的可视化图表和组件来展示数据。您可以将数据库中的表或单条SQL查询结果作为数据集,在仪表盘...

什么是EMR Notebook

EMR Notebook是一个Serverless化的交互式数据分析和探索平台,满足大数据和AI融合下的数据处理需求,为数据工程师、数据分析师和数据科学家提供了可视化的应用程序开发环境。通过EMR Notebook可以完成对SQL、Python、Markdown等多种语言...

功能特性

DataWorks 提供一站式大数据开发与治理平台,涵盖数据集成、开发、建模、分析、质量、服务、地图及开放能力,支持全链路数据处理与企业级数据中台建设。本文为您介绍DataWorks的核心功能特性。数据集成:全领域数据汇聚 DataWorks的数据...

功能特性

本文为您介绍 DataV-Note(智能分析)的功能特性,包括 模型驱动的智能分析、多元化的分析方法、多用户协同分析、一键生成分析报告/应用等。模型驱动的智能分析 DataV-Note拥有独特的数据分析智能体,能够帮助您自动规划数据分析任务,...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用