数据分析算法

_相关内容

基本概念

用户可以通过浏览多张卡片,寻找数据分析灵感;可将感兴趣的卡片进行保存、编辑、分享。作品 作品是由单张或者多张卡片构成的,用于讲述数据故事,根据故事需要创作数据简报、演示文稿等。创作作品无需编程,就可实现丰富的可视化风格切换...

创建数据脱敏场景

脱敏场景介绍 DataWorks提供的 数据开发/数据地图展示脱敏、数据分析展示脱敏、MaxCompute引擎层脱敏、Hologres引擎层脱敏 等动态脱敏,及 数据集成静态脱敏 等一级脱敏场景为固定场景,不支持执行新增、编辑、删除等操作。同时,DataWorks...

ActionTrail日志清洗

以操作DLA的账号为例,该账号下每天会产生几千个数据文件,一个月的文件数将达到几十万个,大量的数据文件对大数据分析非常不便,分析数据耗时,且需要足够大的集群资源才能进行大数据分析。前提条件 使用ActionTrail日志清洗之前,您需要...

网易有数BI连接MaxCompute

MaxCompute支持您将MaxCompute项目数据接入网易有数BI,帮助您轻松完成数据分析和数据可视化工作。本文为您介绍如何使用网易有数BI连接MaxCompute项目,并进行可视化数据分析。背景信息 网易有数BI是新一代敏捷数据可视化分析平台,是包含...

应用场景

但数据体系复杂、数据不统一,数据分析速度和数据准确一致性难保障,战略决策与数据化运营受阻。解决方案:数据融合:通过数据引入功能,将业务系统数据集成、融合一体,统一基础数据。数据建模:通过规范建模功能,结合业务发展需求,自顶...

Redis过期Key的逐出策略

Redis过期Key清理策略 清理过期Key的算法 数据逐出算法 使用Redis的注意事项 详细信息 Redis过期Key清理策略 为了防止一次性清理大量过期Key导致Redis服务受影响,Redis会在CPU空闲时清理过期Key。具体Redis逐出过期Key的策略如下所示:...

通过仪表板分析数据

本入门教程使用Quick BI专业版,通过Quick BI连接外部数据源,进行数据分析和报表搭建,为您展示如何快速上手Quick BI。入门概述 Quick BI 是一款专为云上用户和企业量身打造的新一代自助式智能BI服务平台,其简单易用的可视化操作和灵活...

应用场景

该方案优势如下:全托管免运维 弹性扩展能力 开放数据湖架构 一站式的数据开发平台 数据查询与分析场景 在传统数据平台下,数据仓库工程师和数据分析师通常面临两个不同的环境,甚至使用不同的引擎和语法,导致数据指标和算子行为存在差异...

算法说明

文本分析算法概述 在 日志模板发现 阶段,您可以使用 日志聚类算法 或者 模板发现算法 离线构建日志模板库。在 日志模板匹配 阶段,您可以使用 相似度聚类算法、哈希聚类算法 或者 相似度匹配算法 在线监控日志数据。文本分析中的算法采用...

维度建模概述

例如,在进行电商业务数据分析时,可用的维度及其属性有:订单维度(属性包括订单ID、订单创建时间、买家ID、卖家ID等)、用户维度(性别、出生日期等)、商品维度(包括商品ID、商品名称、商品上架时间)等,此时您就可以将这些维度和属性...

T+1多库合并建仓

上述方案可解决因数据量大而导致的用户体验问题,但在对分库分表数据进行大数据分析时,逻辑上的一个表被拆成了多张表,由于没有类似TDDL中间件来屏蔽物理表的拆分,进行数据分析时变得十分复杂。解决方案 T+1多库合并建仓是指通过DLA控制...

快速入门

通过各个组件 及服务 的结合,阿里云Elasticsearch可以应用于实时日志处理、全文搜索和数据分析等领域。更多产品相关信息,请参见 什么是阿里云Elasticsearch。产品使用 Elasticsearch Elasticsearch作为实时分布式搜索和分析引擎,可以...

基于SLS+OSS+DLA构建海量、低成本日志分析方案

方案介绍 对于数据分析人员、开发人员或者运维人员而言,日志数据对分析和诊断问题以及了解系统活动等有着非常重要的作用,日志都是其工作过程中必不可缺的数据来源。为了节约成本,通常情况下日志会被设定一定的保存时间,此类日志称之为...

应用场景

实时通道 通过数据总线,业务数据能够实时汇入大数据系统,缩短数据分析周期。2.实时数据清洗和分析 2.1 接入多种异构数据,实时清洗并归一化 通过数据总线和实时计算,您可以把多种数据源的异构数据实时清洗成统一的结构化数据,为进一步...

功能发布记录(2023年)

2023.06.01 所有地域 所有DataWorks用户 MySQL数据源 2023-04 功能名称 功能描述 发布时间 发布地域 使用客户 相关文档 数据分析结果直接保存为MaxCompute表 数据分析结果无需通过代码创建表,可以直接保存为MaxCompute表,进行后续查询或...

上海新能源汽车车辆基础数据

方案亮点:PB级新能源车辆基础数据、高性能采集入库、高效数据分析、低成本运营。客户感言 2019年开始上海市新能源汽车大数据平台从自建Hadoop集群迁移至阿里云Lindorm+DLA Spark产品,有效解决了我们平台存储和计算的横向动态扩容瓶颈,...

功能发布记录(2024年)

2024.2.6 所有地域 所有DataWorks用户 系统配置 2024-01 功能名称 功能描述 发布时间 发布地域 使用客户 相关文档 数据开发与数据分析的查询结果支持脱敏展示 数据保护伞支持对E-MapReduce表数据进行分类分级、敏感数据识别、数据脱敏展示...

规格及选型

案例四:自动驾驶企业 用户为自动驾驶领域企业,需要基于车采数据进行地理位置和时序的采集数据分析,要求对JSON格式的友好兼容和时空数据的分析能力,构建业务看板并支持特征工程。建议:使用 AnalyticDB PostgreSQL版 存储弹性模式,实例...

友盟数据分析

U-DOP数据开放平台是友盟+为开发者提供的数据开放和私域数据融合的平台,通过一键订阅分析模板、拖拽式自助分析报表来快速完成数据分析工作。U-DOP数据开放平台不仅仅为您提供了U-App的统计明细数据,同时包含了多主题的分析模板和可订阅的...

数据传输与迁移概述

类型 典型场景 数仓管理员对数据进行预览 DataWorks-数据分析、数据管理、数据开发调度(数据通道)。Kettle。商业智能,制作报表,看板 Quick BI。Superset。离线数据批量数据读取(外部表-湖仓一体)场景特征:主要用于数据联邦查询分析...

StarRocks概述

集群规模可以灵活伸缩,支持10 PB级别的数据分析。支持MPP框架,并行加速计算。支持多副本,具有弹性容错能力。说明 本文部分内容来源于开源StarRocks的 什么是StarRocks。StarRocks特性 StarRocks的架构设计融合了MPP数据库,以及分布式...

FineBI连接MaxCompute

MaxCompute支持您将MaxCompute项目数据接入FineBI,帮助企业的业务人员和数据分析师开展以问题为导向的探索式分析工作。本文为您介绍如何通过MaxCompute JDBC驱动,连接FineBI和MaxCompute项目,并进行可视化数据分析。背景信息 FineBI是帆...

产品更新动态

创建数据集 探查数据集 管理数据集 数据卡片生成 数据卡片智能一键生成,提供多样化的可视化表现方式,帮助您快速获得数据分析灵感、保存数据见解。生成的卡片支持图表快速更换、聚合方式调整、预览编辑和一键保存,帮助您快速构建专属的...

分析实例简介

构建实时数仓成本太高,公司留给数据分析的预算有限,只能默默忍受越来越长的卡顿时间,殊不知在无限的忍受中公司错过了很多机会。为解决上述问题,您可以在RDS MySQL控制台上创建一个分析实例。分析实例的复杂分析性能约为RDS MySQL实例的...

概述

汇总表 您可以结合业务数据分析和数仓分层,将一些明细的事实数据和维度数据先进行汇总分析,创建汇总表,后续数据分析时直接取用汇总表中的数据即可,无需再取用明细表和维度表中的数据。逆向建模 逆向建模主要用于将其他建模工具生成的...

2020年

结合数据分析的丰富的Web-Excel分析功能,数据分析师可以通过MaxCompute数据分析一站式快速进行数据查询、结果二次分析、分享。MaxCompute查询加速功能主要支持按量计费资源,若项目使用包年包月资源,暂时无法满足查询加速要求。2020-12-...

基础分析

注意:关联性分析是以全部重复来电数据为分析对象,通过对大量数据分析找出高频的关联标签。重复来电是以某个客户为分析对象,找出他每通电话的标签,进而分析两通电话之间的关系。通话量趋势 通话量的趋势是分析全部通话的随时间的变化...

应用场景

多源联合分析 该场景需要解决云上企业构建数据仓库时配置数据同步链路繁杂的问题,以及分库分表所带来的数据分析复杂性问题,让用户可以更专注于业务逻辑。该场景可实现:支持多数据源接入 支持数据库(RDS、PolarDB-X(原DRDS)、PolarDB...

湖仓一体

为您提供简单、快速的数据分析体验。概述 云数据库SelectDB 提供多源数据目录功能(Multi-Catalog或Catalog),支持对接数据湖、数据库等外部数据源,进行简单快速地数据分析。Multi-Catalog功能在原有元数据层级之上新增一层Catalog,构成...

如何对JSON类型进行高效分析

本文介绍了PolarDB IMCI为应对海量结构化与半结构化数据分析场景,通过整合列式JSON、虚拟列、秒级加减列、表列数扩展及列存索引等系列功能而构建出的扩展流计算方案,以及该方案的应用案例。背景 随着应用场景多样化与快速迭代,业务系统...

实时数据消费概述

为您提供了一个强大的工具,用于结合流处理和批处理的数据分析。更多信息,请参见 实时数据源集成。使用场景 构建实时分析报表及其他实时分析应用。结合增量实时物化视图构建流批一体的实时数仓。在采用SQL方式写入数据(UPSERT或UPDATE)...

概述

系统按照您设定的数据同步时间自动、无缝的帮您把数据源中的数据同步到目标数据仓库OSS中,同时在数据仓库和DLA中创建与数据源表相同的表结构,基于目标数据仓库进行数据分析,不影响数据源端的线上业务运行。方案优势 T+1全量同步一键建仓...

Lindorm实时入湖建仓分析

在 SQL执行 页面,系统已经选中了目标库,您可以直接输入SQL语句进行数据分析。Lindorm与DLA的字段类型转换表 目前支持的字段类型转换如下。Lindorm字段类型 DLA字段类型 long、usigned_long、short、unsigned_short、int、unsigned_...

验证分析型查询请求能力

概念介绍 OLAP(Online Analytical Processing)是一种面向分析的、多维数据分析技术。它适用于处理大规模、多维的数据集,能够帮助用户进行数据分析、数据挖掘、业务决策等。并行执行 OceanBase 数据库的并行执行指的是在分布式架构下进行...

需求分析

MySQL用户信息数据结构(ods_user_info_d)字段名称 字段说明 uid 用户名 gender 性别 age_range 年龄分段 zodiac 星座 步骤二:分析产出目标用户画像数据结构 根据原始数据分析可获得的有效数据,并基于业务需求确认最终数据表结构。...

需求分析

MySQL用户信息数据结构(ods_user_info_d)字段名称 字段说明 uid 用户名 gender 性别 age_range 年龄分段 zodiac 星座 步骤二:分析产出目标用户画像数据结构 根据原始数据分析可获得的有效数据,并基于业务需求确认最终数据表结构。...

未来规划

数据处理与分析:海量数据分析在线化(实时在线交互式分析)。如何对海量数据进行在线分析和计算,支持实时在线交互式分析,需要做并行处理(DSP 模型、MPP 模型等等),对并行调度计算进行优化。系统能力提升:智能化+安全(使用方便可靠...

全景视角

数据使用视角:在数据分析、发布或使用数据服务等数据使用场景下,建议您使用数据使用视角,关注查看数据使用过程中,浏览、访问过的表列表、拥有权限的数据服务等方面的情况。详情请参见:数据使用视角。数据生产视角:在数据开发场景下,...

Quick引擎概述

Quick BI自研的计算内核Quick引擎,托管在阿里云上的SAAS服务实测数据十亿级数据在0.5秒以内完成聚合分析,另外由于依托阿里云,计算资源支持横向扩展,通过增加服务器还可以提供更强大的数据分析计算能力。为什么设计一个新的Quick引擎 ...

DataWorks On Hologres使用说明

开始使用:数据分析 DataWorks数据分析提供Hologres数据分析与服务共享能力。开始使用:数据治理 DataWorks提供 Hologres 元数据管理与数据治理能力。开始使用:数据服务 DataWorks提供数据服务能力,帮助您统一管理面向内外部的API服务。...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用