大数据与软件工程

_相关内容

数据分析整体趋势

大数据与数据库一体化:早期大数据技术以牺牲一定程度一致性为基础提供分布式能力,解决了传统单机数据库的扩展性不足问题,在MapReduce基础上提供了标准SQL接口,架构上也逐步采用了部分MPP数据库技术;另一方面,分布式数据库也快速发展...

应用场景

实时数据通道 接入多种异构数据并投递到下游多种大数据系统 通过数据总线,您可以实时接入APP、WEB、IoT和数据库等产生的异构数据,统一管理,并投递到下游的分析、归档等系统,构建清晰的数据流,让您更好的释放数据的价值。收益 系统解耦...

快速体验

DataWorks为您提供智能建模、数据清洗、周期调度运维、数据治理等一站式大数据开发管理能力,本文以一个零售电商行业的数仓搭建实验为例,为您介绍DataWorks在数仓搭建过程中的技术选型、技术流程以及流程实现,帮助您深入了解阿里云...

什么是数据湖构建

DLF多个阿里云大数据计算引擎无缝对接,打破数据孤岛,帮助用户快速实现云原生数据湖及OpenLake解决方案的构建管理。该平台能够实现元数据的统一、湖表格式的统一以及数据存储的统一,显著简化客户在数据湖构建和管理过程中的运维工作...

简介

系统兼容开源GeoMesa、GeoServer等生态,内置了高效的时空索引算法、空间拓扑几何算法、遥感影像处理算法等,结合云数据库HBase强大的分布式存储能力以及Spark分析平台能力,广泛应用于空间、时空、遥感大数据存储、查询、分析与数据挖掘...

数据

数据库备份场景下,有4个概念:数据库磁盘空间、数据文件空间、备份数据量、存储数据量。数据量 说明 数据库磁盘空间 由数据库的数据文件空间、数据库的日志文件空间、操作系统文件空间和空闲空间组成。说明 RDS中为:购买时选择的存储...

产品生态

DM(达梦)数据源 Milvus数据源 TiDB数据源 DRDS(PolarDB-X 1.0)数据源 MongoDB数据源 TSDB数据源 Elasticsearch数据源 MySQL数据源 Vertica数据源 FTP数据源 OpenSearch数据源 TOS数据源 GBase8a数据源 Oracle数据源 HBase数据源 Graph ...

大数据AI公共数据集分析

本教程通过DataWorks,联合云原生大数据计算服务MaxCompute,使用大数据AI公共数据集(淘宝、飞猪、阿里音乐、Github、TPC等公共数据),指导您如何快速进行大数据分析,快速熟悉DataWorks的操作界面最基础的数据分析能力。DataWorks的更...

轮播页面

数据源 单击 配置数据源,可在 设置数据源 面板中修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果,详情请参见 配置资产数据数据过滤器 数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击 添加过滤器...

功能特性

DataWorks 提供一站式大数据开发治理平台,涵盖数据集成、开发、建模、分析、质量、服务、地图及开放能力,支持全链路数据处理企业级数据中台建设。本文为您介绍DataWorks的核心功能特性。数据集成:全领域数据汇聚 DataWorks的数据...

节点开发

2104 SERVERLESS_STARROCKS 模型 模型节点 内置强大的数据处理分析挖掘引擎,支持根据您的自然语言指令,智能完成数据清洗挖掘。2200 LLM_NODE Flink Flink SQL Streaming 支持使用标准SQL语句定义实时任务处理逻辑。它具有易用性...

时序数据库

大数据分析预测需求:随着数据分析技术的发展,企业和研究机构越来越重视对历史时间序列数据的分析,以进行预测性维护、市场趋势预测、气候模型预测等工作。这要求数据库不仅能够高效存储规模时间序列数据,还要支持复杂的时间序列分析...

什么是DataWorks

适配阿里云MaxCompute、E-MapReduce、Hologres、Flink、AnalyticDB、StarRocks、PAI 等数十种大数据和AI计算服务,为数据仓库、数据湖、湖仓一体、Data+AI解决方案提供全链路智能化的数据集成、大数据AI一体化开发、数据分析主动式数据...

什么是EMR on ECS

EMR on ECS是指在ECS上运行EMR,它将EMR的大数据处理能力ECS的弹性灵活优势相结合,使得您能够更加便捷地配置和管理EMR集群,同时支持多种开源和自研大数据组件,适用于复杂的大数据处理和分析场景。产品架构 EMR主要由四部分组成,分别...

大数据开发治理平台 DataWorks

大数据开发治理平台 DataWorks基于MaxCompute/EMR/Hologres等大数据计算引擎,为客户提供专业高效、安全可靠的一站式大数据开发治理平台,自带阿里巴巴数据中台与数据治理最佳实践,赋能各行业数字化转型。每天阿里巴巴集团内部有数万名...

支持的数据库类型功能

数据灾备(原DBS)关系型数据库 阿里云数据库 ECS上的自建数据库、线下数据库、其他云数据库 NoSQL数据库 MongoDB Redis 逻辑备份支持的数据库 MySQL MariaDB PolarDB:PolarDB PostgreSQL版、PolarDB MySQL版、PolarDB PostgreSQL版(兼容...

欧派家居

2015年,欧派全面启动“欧派制造2025”战略,融合互联网、大数据与人工智能制造,通过数字化打通销售、研发、生产制造、物流运输等全套环节,打造以MTDS终端设计营销服务管理系统、WCC智能拆单系统、MSCS生产调度控制系统、APS+XMES柔性...

术语表

安全 MaxCompute提供多租户数据安全体系,主要包括用户认证、项目的用户授权管理、跨项目的资源分享以及项目的数据保护。更多MaxCompute安全操作信息,请参见 权限概述。C Console 即MaxCompute客户端,是运行在Window或Linux下的工具,...

大数据专家服务

大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户构建和持续优化的...

什么是MaxFrame

规模数据分析处理:当数据量庞大、处理逻辑复杂时,MaxFrame借助MaxCompute海量数据和计算资源的分布式能力,显著提高数据分析、处理及数据挖掘的开发效率。Data+AI开发:对于整个分布式数据开发和模型开发过程依赖于第三方或自定义...

什么是云原生数据仓库AnalyticDB MySQL版

类型 数据源 关系型数据库 云数据库RDS MySQL 云数据库RDS SQL Server 云原生数据库PolarDB MySQL版 云原生数据库PolarDB分布式版(简称“PolarDB-X”)自建MySQL数据库 自建Oracle数据库 非关系型数据库 云数据库MongoDB 云原生多模数据库...

如何对JSON类型进行高效分析

PolarDB 列存索引(In Memory Column Index,IMCI)功能推出了完备的虚拟列列式JSON功能等,可以快速处理大数据和多种数据类型(包括结构化数据与半结构化数据等),并提供高效的数据分析、查询流计算能力,适用于数据分析、数据仓库...

基本概念

数据资产:数据资源平台中存在大量的数据表、标签、API等各类数据资产,数据管理者通过数据汇聚、数据治理、数据分析后,需要对整个平台数据进行统一管控,了解平台的核心数据资产,提供对应的数据资产管理规范。统一服务 应用:是调用API...

PostgreSQL数据

由于主备数据同步存在一定的时间差,特别是在某些特定情况,例如网络延迟等问题,导致备库同步恢复的数据与主库有较差别,从备库同步的数据不是一份当前时间的完整镜像。一致性约束。PostgreSQL在数据存储划分中属于RDBMS系统,对外可以...

基于Delta Table构建近实时增全量一体化链路架构

数据库整库 实时同步写入-DataWorks数据集成 当前数据库系统与大数据处理引擎都有各自擅长的数据处理场景,面对一些复杂的业务需求,往往需要同时运用OLTP(联机事务处理)、OLAP(联机分析处理)及离线分析引擎来对数据进行全面且深入的...

DM(达梦)数据

DM(达梦)数据源作为数据中枢,为您提供读取和写入DM数据库的双向通道,能够快速解决海量数据的计算问题。本文为您介绍DataWorks的DM数据同步的能力支持情况。使用限制 离线同步支持读取视图表。DM Reader和DM Writer支持使用 Serverless...

基本概念

本文为您介绍DataWorks中,数据集成、数据建模、数据开发、数据分析、数据服务等模块开发过程中涉及的相关基本概念。通用概念 工作空间 工作空间 是DataWorks管理任务、成员,分配角色和权限的基本单元。工作空间管理员可以为工作空间加入...

通过备份计划列表创建备份

本文介绍如何创建和配置备份计划、备份数据库以及恢复数据库,帮助您快速了解和上手数据库备份管理操作。如需了解 数据灾备 是否支持备份恢复您的数据库,以及各类数据库备份恢复的具体粒度等,请参见 支持的数据库类型功能。如需了解...

跨云或自建MongoDB逻辑备份恢复

已选择的恢复时间点 选择需要恢复的时间,设置的时间必须在可恢复的时间范围内 恢复目标数据数据库所在位置 选择恢复目标数据库所在位置,支持类型如下:无公网IP:Port的自建数据库(通过数据库网关DG接入):可通过数据库网关备份自建...

云数据库MongoDB逻辑备份恢复

已选择的恢复时间点 选择需要恢复的时间,设置的时间必须在可恢复的时间范围内 恢复目标数据数据库所在位置 选择恢复目标数据库所在位置,支持类型如下:无公网IP:Port的自建数据库(通过数据库网关DG接入):可通过数据库网关备份自建...

跨云或自建PostgreSQL逻辑备份恢复

数据库所在位置 根据您所需备份的源数据库类型进行如下选择:无公网IP:Port的自建数据库(通过数据库网关DG接入):可通过数据库网关备份自建数据库,您需要提前为数据库实例配置数据库网关,并在此配置步骤选择目标 网关DG实例ID。...

RDS PostgreSQL逻辑备份及恢复

恢复目标数据数据库所在位置 根据您所需恢复的源数据库类型进行如下选择:无公网IP:Port的自建数据库(通过数据库网关DG接入):可通过数据库网关备份自建数据库,您需要提前为数据库实例配置数据库网关,并在此配置步骤选择目标 网关DG...

跨云或自建SQL Server逻辑备份恢复

恢复目标数据数据库所在位置 图中示例为将备份集恢复至提前新建的 RDS实例 实例中,同时还支持恢复至如下数据库实例所在位置:无公网IP:Port的自建数据库(通过数据库网关DG接入)有公网IP:Port的自建数据库 ECS上的自建数据库 RDS实例 ...

跨云或自建MariaDB逻辑备份恢复

数据库所在位置 无公网IP:Port的自建数据库(通过数据库网关DG接入):可通过数据库网关备份自建数据库,您需要提前为数据库实例配置数据库网关,并在此配置步骤选择目标 网关DG实例ID。有公网IP:Port的自建数据库:可通过公网IP备份自建数据...

跨云或自建Oracle逻辑备份恢复

数据库所在位置 需要备份的数据库所在位置,支持的选项:有公网IP:Port的自建数据库 ECS上的自建数据库 通过专线/VPN网关/智能网关接入的自建数据库 无公网IP:Port的自建数据库(通过数据库网关DG接入)数据库类型 默认为Oracle数据库。...

DataWorks模块使用指引

DataWorks 是阿里云提供的一站式大数据开发治理平台,旨在帮助用户解决从数据接入、处理、治理到服务化的全链路数据问题。它通过一系列高度协同的功能模块,将复杂的数据工程流程化、可视化,显著降低了大数据开发的门槛。本文将为您逐一...

大数据安全治理的难点

大数据体系的特点安全治理难点 由于大数据系统在“存储、用户、入口、流转、交付”等多方面的特点,想要回答好上述问题,存在诸多难点。存储 众所周知,大数据系统以数据类型多(结构化、非结构化、半结构化)、数据(动辄PB级别)...

产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...

减灾应急时空解决方案案例

公司主营OpenRIS灾害风险大数据平台提供了海量灾害数据的快速地图展示、统计查询、切割下载、上传数据定制化在线分析等功能,实现了灾害数据与模型一体化云服务。在数据与系统上云过程前,遇到了如下挑战:长期积累的时空数据类型多、数据...

SQL查询(旧版)

对象存储OSS:将查询结果以指定格式(如CSV、Parquet)导出至阿里云对象存储OSS(Object Storage Service)空间,适用于大数据量归档或其他云产品集成的场景。首次使用时,您需要为DataWorks进行授权,以允许其访问您的OSS资源。请在 ...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用