基于湖仓一体架构使用MaxCompute对OSS湖数据分析预测
基于湖仓一体架构<em>使用</em>MaxCompute对<em>OSS</em>湖数据分析预测
本篇最佳实践先创建EMR集群作为数据湖对象,Hive元数据存储在DLF,外表数据存储在OSS。然后使用阿里云数据仓库MaxCompute以创建外部项目的方式与存储在DLF的元数据库映射打通,实现元数据统一。最后通过一个毒蘑菇的训练和预测demo,演示云数仓MaxCompute如何对于存储在EMR数据湖的数据进行加工处理以达到业务预期。
基于湖仓一体架构使用MaxCompute对OSS湖数据分析预测实践 业务架构 场景描述 数据湖和数据仓库是当前大数据技术条件下构建分布式系 统的两种数据架构设计取向,数据湖偏向灵活性,数据仓 库侧重成本、性能、安全、治理等企业级特性。但是数据 湖和数据仓库的边界正在慢慢模糊,数据湖自身的治理能 力、数据仓库延伸到外部...
来自: 最佳实践 相关产品:对象存储 OSS,E-MapReduce,DataWorks,大数据计算服务 MaxCompute,API网关,数据湖构建,云速搭
Serverless 应用引擎SAE
Serverless 应用引擎 SAE(Serverless App Engine)是一款零代码改造、极简易用、自适应弹性的应用全托管平台。SAE 让您免运维 IaaS和 K8s,秒级完成从源代码/代码包/ Docker 镜像部署任何语言的在线应用(如 Web /微服务 /Job任务)到 SAE,并自动伸缩实例按使用量计费,开箱即用日志、监控、负载均衡等配套能力。
对标 Google CloudRun,提供 Web 应用上云的一站式快捷体验:包括免运维 IaaS、自动弹性伸缩、开箱即 Web 应用防火墙、CDN全球加速、OSS 持久化存储、日志管理、负载均衡、RDS数据库等能力,同时还提供闲置计费和缩容到 0 的能力,让流量零星/有突发峰值的Web应用使用成本更低。该解决方案适用于个人博客、论坛、企业官网...
来自: 云产品
对象存储 OSS
阿里云对象存储 OSS(Object Storage Service)是一款海量、安全、低成本、高可靠的云备份服务,提供最高可达 99.995 % 的服务可用性。多种存储类型供选择,全面优化存储成本。
A:OSS 有存储包(抵扣 OSS 文件或 ECS 快照的存储费用)、流量包(抵扣 OSS 使用过程中产生的流量费用)、高防基础包(抵扣预留高防实例资源所产生的费用)等查看详情Q:如何获取文件的 URL?A:文件上传至 OSS 后,您可能需要通过文件 URL 访问文件。本文介绍如何获取单个或多个文件(Object)的 URL。查看详情Q:如何...
来自: 云产品
自建ElasticSearch迁移阿里云
自建ElasticSearch迁移阿里云
场景描述 以ElasticSearch为例,演示搭建模拟业务系统、 VPN网关和IPSecVPN隧道,介绍如何通过快照 的方式,将ElasticSearch索引数据安全备份到 阿里云OSS存储空间,以及介绍如何将备份在 OSS的快照仓库恢复到阿里云ElasticSearch实 例,进一步达到ElasticSearch迁移上云的目的。 解决的问题 自建ElasticSearch的云上/跨云备份需求。 自建ElasticSearch迁移到阿里云 ElasticSearch服务实例。 产品列表 VPC,ECS,VPN网关,OSS,阿里云ElasticSearch,云速搭CADT
使用 OSS,您可以通过网络随时存储和调用包括文本、图 片、音频和视频等在内的各种非结构化数据文件。ElasticSearch Elasticsearch是一个高度可扩展的开源全文搜索和分析引擎。它允许您快速并 接近实时地存储、搜索和分析大量数据。它通常用作底层引擎/技术,为具有复 杂搜索功能和要求的应用程序提供支持。阿里云 Elastic...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,VPN网关,Elasticsearch,云速搭
Serverless图片分类和身份证过滤
Serverless图片分类和身份证过滤
场景描述 场景一:大型图库智能管理通过深度学习算法,自动识别图像中的常见的场景,客户可以基于函数计算对接智能媒体管理的图像识别功能,轻松实现图片的自动管理和分组,完成大型图像库的智能管理。 场景二:身份证图片过滤 通过扫描存储在OSSbucket中的图片,通 过智能媒体管理进行身份证识别,找到海量图片中的身份证图片,对敏感信息进行处理。 解决问题 1.通过无服务器计算实现图片处理自动化 2.OSS触发器的使用 3.使用函数计算调用阿里云的AIP或SDK 产品列表 函数计算 智能媒体管理IMM 对象存储OSS
步骤4 通过 OSS SDK拿到 IMM识别结果(这里使用 oss的 x-oss-process进行处理,也 可以调用 imm的 sdk进行处理,建议直接使用 OSS SDK,使用上更方便)。步骤5 对结果进行分类上传到 OSS。2.3.创建 OSS bucket 步骤1 在阿里云控制台(home.console.aliyun.com),点击产品与服务,输入 OSS搜索产 品,进入 OSS控制台。文档...
来自: 最佳实践 | 相关产品:对象存储 OSS,函数计算,智能媒体管理
数据湖-在线学习场景数据分析
数据湖-在线学习场景数据分析
场景描述 本场景以在线教育中一个答题闯关类的应用为 例,使用WebServer来模拟演示这类日志数据 的分析处理。通过Nginx和Pythonflask搭建 WebServer,模拟应用中的关键页面,比如登 录、课程内容等,之后构造若干用户使用的模拟 日志数据,投递到数据湖进行分析后获取应用 PV、UV、课程内容访问排行、平均得分等等。 解决问题 基于数据湖(EMR+OSS)搭建大数据平台。 EMR和OSS使用和配置。 数据统一存储到OSS。 产品列表 E-MapReduce 对象存储OSS 云服务器ECS 访问控制RAM 专有网络VPC
2.EMR和OSS使用和配置。3.数据统一存储到OSS。产品列表  E-MapReduce  对象存储OSS  云服务器ECS  访问控制RAM  专有网络VPC云服务器ECS(产品名称)文档模板(手册名称)/阿里云 企业上云实践 数据湖-在线学习场景数据分析 最佳实践 文档版本:20200331 文档版本:20150122(发布日期)2数据湖-在线学习场景数据...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,访问控制,E-MapReduce
企业上云数据安全
企业上云数据安全
场景描述 企业是否选择上公共云,或者哪些系统或数据上 公共云,对数据安全的关心是重要因素之一。本 最佳实践重点在于介绍狭义的数据加密存储安 全范畴,即首先使用SDDP产品进行敏感数据发 现和分级分类,然后对高级别敏感数据进行按 需、不同类型的全链路加密存储。 解决问题 1.帮助客户发现敏感数据 2.对敏感数据进行分类、分级 3.对不同级别的数据如何选择加密方式 4.具体如何进行加密 产品列表 敏感数据识别SDDP 密钥管理服务KMS 云数据库RDS 对象存储OSS
OSS使用 KMS自建密钥的功能(BYOK),目前处于公测阶段,如需使用,需要找客户经 理或工单方式开通白名单。文档版本:20210809 1 企业上云数据安全 前置条件 演示环境说明 资源规划 本实践中需要开通的阿里云产品或服务以及相关规格的描述见下表。说明:凡是涉及到阿里云资源的开通,统一将地域设置为华东 1(杭州)。产品...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,密钥管理服务,敏感数据保护,云速搭CADT
EHPC工业仿真
EHPC工业仿真
场景描述 本实践适用于使用弹性高性能计算EHPC+ 对象存储OSS运行仿真软件进行模型仿真 的场景中,这里运行的是LAMMPS这款开 源的仿真软件,数据通过OSS上传。 解决问题 1.使用EHPC运行工业仿真软件 2.使用OSS存储数据和代码 3.可视化计算结果 产品列表 弹性高性能计算E-HPC 对象存储OSS
使用 OSS存储数据和代码 3.可视化计算结果 产品列表 弹性高性能计算 E-HPC 对象存储 OSS 文件存储 NAS 云速搭 CADT 最佳实践频道 阿里云最佳实践技术分享群 如二维码过期,请搜索群号:31852400 云服务器 ECS(产品名称)文档模板(手册名称)/文档版本信息 阿里云 EHPC工业仿真 最佳实践 发布日期:20210813 文档版本:...
来自: 最佳实践 | 相关产品:云服务器ECS,对象存储 OSS,弹性高性能计算E-HPC
企业用户多账号合并之存储迁移集中
企业用户多账号合并之存储迁移集中
场景描述 本文介绍使用在线迁移服务,将分布在各个云 账号中的对象存储、文件存储数据集中到一个 账号的对象存储或文件存储下。 解决问题 1.安全治理需求,统一的账户体系、身份、权 限及资源管理。 2.业务系统相互访问,数据统一需求。 3.系统架构及资源成本优化需求,多账号下的 带宽、流量、存储包等资源整合优化。 4.企业或部门合并时云账号的合并。 产品列表 RAM OSS NAS 在线迁移
使用数据迁移服务迁移 OSS数据 重要提示 在线迁移服务进行数据迁移时会占用源数据地址和目的数据地址的网络带宽资 源,为避免数据迁移执行过程中的带宽占用影响其他业务对使用 OSS 的使用,建议在业务闲时执行迁移任务,并可以对迁移任务设置限速。为保证数据不被错误地覆盖,建议选择新建的空 bucket 作为目的数据地址。因...
来自: 最佳实践 | 相关产品:对象存储 OSS,文件存储NAS,访问控制,云速搭
批量计算BCS
阿里云批量计算(BatchCompute)是一种适用于大规模并行批处理作业的分布式云服务。支持海量作业并发规模,系统自动完成资源管理,作业调度和数据加载,并按实际使用量计费。可广泛应用于电影动画渲染、生物数据分析、多媒体转码、金融保险分析、科学计算等领域。
无论使用OSS还是NAS,通过简单的配置指定数据源就可以启动分布式缓存功能。缓存加速能力随着集群规模线性扩展,解决大规模渲染场景下素材加载慢的痛点.用户可以通过集群模式搭建混合云渲染环境,也可以通过作业模式实现自动的资源管理和作业调度。批量计算还提供了方便易用的命令行工具和渲染管理系统,大大减少云渲染系统...
来自: 云产品
闪电立方
阿里云闪电立方能够为用户提供安全、高效、便捷的数据传输服务。有数据在线迁移和离线迁移(闪电立方)两种方式,可解决大规模数据传输效率、安全问题等难题。
推荐使用在线迁移服务,将第三方云服务商的数据轻松迁移至阿里云对象存储 OSS,配合使用OSS的镜像回源功能实现不中断业务的数据热迁移.用户数据存储在本地服务器的文件系统中,本地机房能够通过搭建专有网络VPC使用专线等连接方式实现云上VPC与本地机房的网络互通,利用在线迁移服务将本地数据迁移至阿里云NAS中.使用在线...
来自: 云产品
本地数据中心基于SMB/NFS协议访问对象存储最佳实践
本地数据中心基于SMB/NFS协议访问对象存储最佳实践
1. 云存储扩容和迁移 集成智能缓存算法,自动识别冷热数据,将热数据保留在本地缓存,保证数据访问体验,无感知的将海量云存储数据接入本地数据中心,拓展存储空间。同时在云端 保留全量数据(冷+热)保证数据的一致性 2.云容灾 随着云计算的普及,越来越多的用户把自己的业务放到了云上。但是随着业务的发展,如何提高业务的可靠性和连续性,跨云容灾是一个比较热门的话题。借助云存 储网关对虚拟化的全面支持,可以轻松应对各种第三方云厂商对接阿里云的数据容灾。 3. 多地数据共享和分发 通过多个异地部署的文件网关实例,对接同一个阿里云OSS Bucket,可以实现快速的异地文件共享和分发,非常适合多个分支机构之间互相同步和共享数据。 4. 适配传统应用 有很多用户在云上的业务是新老业务的结合,老业务是从数据中心迁移过来的使用的是标准的存储协议,例如: NFS/SMB/iSCSI。新的应用往往采用比较新的技 术,支持对象访问的协议。如何沟通两种业务之间的数据是一个比较麻烦的事情,云存储网关正好起到一个桥梁的作用,可以便捷的沟通新旧业务,进行数据交换。 5. 替代 ossfs 和 ossftp ossfs 和 ossftp 都是基于文件协议的开源工具,用户可以通过它们直接上传文件到OSS。但是这两个开源文件都不建议在生产环境使用(POSIX 兼容度低),同时挂 载在用户的客户端需要额外的配置和缓存资源,对于多个客户端的情况安装配置繁琐。通过文件网关的服务可以完美替代 ossfs 和 ossftp。通过创建文件网关,用 户只需要执行简单的挂载(NFS)和映射(Windows SMB)就可以像使用本地文件系统一样使用 OSS。
通过创建文件网关, 户只需要执行简单的挂载(NFS)和映射(Windows SMB)就可以像使用本地文 件系统一样使用 OSS。文档版本:20210525 3 本地数据中心基于 SMB/NFS协议访问对象存储 云存储网关配置 1.云存储网关配置 1.1.开通云存储网关 步骤1 访问云存储网关控制台(https://sgwnew.console.aliyun.com/),开通云存储...
来自: 最佳实践 | 相关产品:对象存储 OSS,云存储网关
自建Hadoop迁移到阿里云EMR
自建Hadoop迁移到阿里云EMR
场景描述 场景1:自建Hadoop集群数据(HDFS)迁移到 阿里云EMR集群的HDFS文件系统; 场景2:自建Hadoop集群数据(HDFS)迁移到 计算存储分离架构的阿里云EMR集群,以OSS 和JindoFS作为EMR集群的后端存储。 解决的问题 客户自建Hadoop迁移到阿里云EMR集群的 技术方案; 基于IPSecVPN隧道构建安全和低成本数据 传输链路 产品列表 E-MapReduce,VPC,ECS,OSS,VPN网关。
付费模式:按使用流量 带宽:100 Mbps 文档版本:20210714 5 自建Hadoop数据迁移到阿里云 EMR 自建 Hadoop集群环境搭建 说明:(1)在您业务商用过程中,建议选用弹性公网 IP和共享带宽包、共享流量包的组合降低公网流量使 成本;(2)在环境搭建过程中分配公网 IP地址仅 用于 SSH登录和必要的软件包下载,在环境搭建完 ...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,VPN网关,E-MapReduce,云速搭
自建Hive数据仓库跨版本迁移到阿里云Databricks数据洞察
自建Hive数据仓库跨版本迁移到阿里云Databricks数据洞察
场景描述 客户在IDC或者公有云环境自建Hadoop集群构建数据仓库和分析系统,购买阿里云Databricks数据洞察集群之后,涉及到数仓数据和元数据的迁移以及Hive版本的订正更新。 方案优势 1. 全托管Spark集群免运维,节省人力成本。 2. Databricks数据洞察与阿里云其他产品(OSS、RDS、MaxCompute、EMR)进行深度整合,支持以这些产品为数据源的输入和输出。 3. 使用Databricks Runtime商业版引擎相比开源Spark性能有3-5倍的提升。 解决问题 1. Hive数仓数据迁移OSS方案。 2. Hive元数据库迁移阿里云RDS方案。 3. Hive跨版本迁移到Databricks数据洞察使用Delta表查询以提高查询效率。
使用 oss对象存储方案,计算存储分离节省客户存储成本,并为以后数据湖和多 计算框架做铺垫。推荐客户将数据格式存储为 Parquet,性能会有非常大优化。Databricks 数据洞察与阿里云其它产品(Kafka、Redis、MongoDB、Elasticseach、RDS和 MaxCompute等)进行了深度整合,支持以这些产品作为 Spark计算引擎的输入源或者输出...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,文件存储HDFS,spark
密钥管理服务KMS
阿里云密钥管理服务KMS使用国家密码管理局检测认证的硬件加密机,提供安全合规的密钥托管和云数据加密服务,助您全面升级云数据安全防护能力。产品为蚂蚁金服提供安全合规的密钥管理服务,保障全球金融交易安全。
您可以使用OSS客户端加密SDK,用于在上传之前完成对大量数据的加密操作。也可以自行调用KMS实现信封加密.NoSQL高并发读写加密后的数据.按照空间或者时间化分,在一定范围内(如:每个表或每5秒钟)使用相同的数据密钥加密,将数据密文在NoSQL中存储.云数据库 Redis 版.时间序列数据库 TSDB.表格存储 Tablestore.账密、证书...
来自: 云产品
内容安全
阿里云内容安全基于深度学习技术,提供图片、视频、语音、文字、网页等多媒体的内容风险智能识别和审核服务,帮助用户发现色情、暴恐、政治敏感等风险内容,大幅度降低人工审核成本。
内容安全产品提供图片、视频、语音、文字等多媒体内容风险检测的能力,帮助用户发现色情、暴力、惊悚、敏感、禁限、辱骂等风险内容或元素,可以大幅度降低人工审核成本,提升内容质量,改善平台秩序和用户体验....了解如何快速使用OSS内容检测.1.0 版本 API.了解内容安全1.0 版本 API的使用.21A_文档与工具.
来自: 云产品
基于SLS实现统一告警最佳实践
基于SLS实现统一告警最佳实践
告警对于企业的开发运维,安全运维,业务运维有着至关重要的作用。然而很多企业在告警运维方面存在着重复建设、监控质量差、告警风暴、触达不人性化、无法闭环等问题。 针对企业在告警管理方面存在的痛点问题,SLS告警提供了一站式云上告警管理方案,具有弹性易用、稳定可靠、功能持续升级、成本更低、噪音更少等优势。企业可以将现有的监控方案系统无缝接入到SLS告警平台,实现在SLS上一站式管理告警。
使用 OSS模拟日志 步骤1 登录 SLS控制台,选择 CADT创建好的 SLS实例:sls-bp235,进入详情页。文档版本:20211021 39 基于 SLS实现统一告警最佳实践 配置自定义告警 步骤2 打开创建好的日志库实例 logstore-bp235,展开数据接入,单击模拟接入。步骤3 在弹出框的快速数据接入中,选择 OSS访问日志,单击“模拟”,进入...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,弹性公网IP,日志服务(SLS),云速搭CADT
高性能计算存储解决方案
基于阿里云强大的存储产品能力,助力AI、基因、自动驾驶、天文和能源等行业打造高性能计算平台。
直播行业竞争日趋白热化,为实现差异化体验,该企业在内容审核和内容增强等业务中引入AI能力,借助阿里云计算和存储能力搭建AI训练平台,且结合使用OSS、NAS和CPFS,其中CPFS用作训练一级存储,为AI平台提供高性能存储,NAS和OSS作为二级存储存结果数据,整体上实现了分布式训练、数据分层存储和资源弹性伸缩,提升推理和...
来自: 解决方案
EHPC药物筛选
EHPC药物筛选
场景描述 本方案适用于使用弹性高性能计算 EHPC和文件存储NAS来搭建基础环 境,运行药物筛选应用AutodockVina 的场景中,这里采用批处理方式来提交 作业,并可以可视化计算结果。 方案架构 1.计算之前,将数据通过互联网/闪电立方/高速通道上传到阿里云OSS 2.计算时,将数据从OSS拉取到文件共享存储NAS上 3.计算时,在EHPC集群上进行,计算节点从NAS上读写数据 • 容量型NAS:低成本,大容量 • 性能型NAS:适合高IOPS应用,作为临时目录 • CPFS:适合超大规模,并行度极高的作业 4.计算节点: • 如果对计算时间不敏感,希望低成本运算,可选ECS实例 • 如果时效性要求高,建议采用SCC超级计算集群 5.可视化 • 如果可视化部分计算量不大,可以采用EHPC自带的可视化服务 解决问题 1.使用EHPC运行药物筛选应用 2.使用nas存储计算数据 3.使用OSS保存计算结果 • 通过分子对接(moleculardocking)模拟计算进行药物筛选,是模拟小分子配体和生物大分子受体的 相互作用,预测配体和受体的结合模式和亲和力。 • 通常,有很多已有的配体库,如商业化的Specs、Enamine和ChemDiv化合物库。提供大量配体,模 拟计算就是计算这些配体和给定受体的相互作用。 • 每次模拟计算通常处理一个配体和一个受体,不同配体之间没有依赖,因此可以同时大规模并行处 理。 本解决方案同样适用于有批量、高并发处理需求的其它生物、医药等场景。 产品列表 弹性高性能计算E-HPC 文件存储NAS 对象存储OSS
使用 OSS保存计算结果 产品列表 弹性高性能计算 E-HPC 文件存储 NAS 对象存储 OSS 云速搭 CADT 最佳实践频道 阿里云最佳实践技术分享群 如二维码过期,请搜索群号:31852400 云服务器 ECS(产品名称)文档模板(手册名称)/文档版本信息 阿里云 企业上云实践 EHPC药物筛选最佳实践 文档版本:20210811 II 企业上云实践 EHPC...
来自: 最佳实践 | 相关产品:云服务器ECS,对象存储 OSS,文件存储NAS,弹性高性能计算E-HPC
网盘与相册服务
网盘与相册服务基于阿里云高可用存储及高安全水位的能力,帮助客户解决办公数据的搜索、管理、共享、审计等文件管理难题,同时也可为企业办公新形态升级提供打包服务。
将已存储在阿里云OSS中的数据托管给相册与网盘服务PDS管理,PDS提供基于Drive、目录、文件的管理视图,提供给最终用户使用,并保留使用OSS原有接口的访问,完成数据在应用和用户间的联动以及和合作伙伴间的数据传递.将OSS中的数据通过简单配置,提供给最终用户(自建用户或钉钉、支付宝、淘宝等用户)受控使用.将应用(如...
来自: 云产品
< 1 2 3 4 ... 12 >
共有12页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用