图的数据结构_图的数据结构相关产品

依托大模型与云计算的协同发展，阿里云帮助企业和开发者以最快速度实现生成式和判别式的创新应用，拥抱 AI 时代

提供原图 ◦ 基准图：提供一张真人图，作为生成模特图的基础。或者提供一张商品原图，作为生成商品主图的基础。◦ 背景图：如果有想要让大模型参考的背景图，也可以提供。2.提供提示词例如，提供描述图像背景环境和模特全身形象的提示词。3.设置参数可以按需设置图片的长宽比或大小、图片风格、图片数量、随机性等参数。...

来自：解决方案

基于OSS Object FC实现非结构化文件实时处理最佳实践

基于OSS Object FC实现非<em>结构</em>化文件实时处理最佳实践

现在绝大多数客户都有很多非结构化的数据存在OSS中，以图片，视频，音频居多。举一个图片处理的场景，现在各种终端种类繁多，不同的终端对图片的格式、分辨率要求也不同，所以一张图片往往会有很多张衍生图，那如果所有的衍生图都存在OSS中，那存储的成本会增加，所以就可以通过OSS Object FC的方案，在不同的终端请求时，对OSS中的原图基于终端的要求做实时处理，然后响应返回，这样OSS中只需要存储原图即可。音视频也有类似的场景。

应用场景现在绝大多数客户都有很多非结构化的数据存在OSS中，以图片，视频，音频居多。举一个产品列表图片处理的场景，现在各种终端种类繁多，不同专有网络VPC  的终端对图片的格式、分辨率要求也不同，所以  阿里云函数计算(FC)一张图片往往会有很多张衍生图，那如果所有的  阿里云对象存储（OSS）衍生图都存在...

来自：最佳实践 | 相关产品：对象存储 OSS,函数计算

基于函数计算FC实现物联网音视频处理

在物联网场景中，智能设备会产生大量的非结构化数据，并且采集量和频率都很高。比如各类摄像头（家用摄像头、车载摄像头、工业监控摄像头等）采集的数据。企业需要对这些非结构化数据做快速的分析和处理，然后应用到下游业务中，所以需要一套高并发、低成本、自动化的方案。该最佳实践就适用于这类场景。

应用场景在物联网场景中，智能设备会产生大量的非结构化数据，并且采集量和频率都很高。比如各类摄像头（家用摄像头、车载摄像头、工业监控摄像头等）采集的数据。企业需要对这些非结构化数据做快速的分析和处理，然后应用到下游业务中，所以需要一套高并发、低成本、自动化的方案。该最佳实践就适用于这类场景。解决...

来自：最佳实践 | 相关产品：对象存储 OSS,函数计算

MSE网关使用JWT进行认证鉴权

MSE网关中调用外部的认证鉴权服务，通过JWT的方式进行全局认证鉴权。对网关有认证鉴权安全需求的场景，对于敏感的服务路由（可通过黑白名单方式配置）在网关层进行认证鉴权。

MSE云原生网关致力于提供给云上用户体系化的安全解决方案，其中 JWT认证能力是在 Json Web Token这种结构化令牌的基础上实现了一套基于用户体系对用户的 API（服务）进行授权访问的机制，满足用户个性化安全设置的需求。本最佳实践方案就是介绍如何在 MSE网关中集成 JWT进行全局认证鉴权的配置。方案示意图如下所示：...

来自：最佳实践 | 相关产品：负载均衡 SLB,Serverless 应用引擎,微服务引擎

基于DataWorks的大数据一站式开发及数据治理

概述基于Dataworks做大数据一站式开发，包含数据实时采集到kafka通过实时计算对数据进行ETL写入HDFS，使用Hive进行数据分析。通过Dataworks进行数据治理，数据地图查看数据信息和血缘关系，数据质量监控异常和报警。适用场景  日志采集、处理及分析  日志使用Flink实时写入HDFS  日志数据实时ETL  日志HIVE分析  基于dataworks一站式开发  数据治理方案优势  大数据一站式开发，完善的数据治理能力。  性能优越：高吞吐，高扩展性。  安全稳定：Exactly-Once，故障自动恢复，资源隔离。  简单易用：SQL语言，在线开发，全面支持UDX。  功能强大：支持SQL进行实时及离线数据清洗、数据分析、数据同步、异构数据源计算等Data Lake相关功能，以及各种流式及静态数据源关联查询。

日志采集、处理及分析日志使用 Flink实时写入 HDFS 日志数据实时 ETL 日志 HIVE分析基于 DataWorks一站式开发数据治理技术架构本实践方案基于如下图所示的技术架构和主要流程编写操作步骤：文档版本：20201020 1 基于 Dataworks的大数据一站式开发及数据治理最佳实践概述方案优势大数据一站式开发，完善的数据治理...

来自：最佳实践 | 相关产品：块存储,云服务器ECS,E-MapReduce,DataWorks,实时计算,云速搭

Oracle RAC 12C云上部署

Oracle RAC架构迁移上云，提供高并发，高吞吐，高安全等特性，适用于金融，电力，电信，制造业等传统客户的核心交易系统。

基于ESSD存储NVMe协议提供的多实例共享能力的双机集群OracleRAC架构，为用户提供统一数据服务的同时提供故障切换与恢复能力（FailOver集群功能），避免单点故障，减少停机时间，确保系统全年7*24小时稳定运行。2.在集群环境运行中的所有实例通过共享的数据库运行事物，RAC架构相对上层应用架构完全透明，整体数据负载...

来自：最佳实践 | 相关产品：块存储,专有网络 VPC,云服务器ECS,弹性公网IP,云企业网

企业级云灾备与数据管理

本方案以备份 ECS 文件为例，介绍如何部署一个简单的云灾备环境，以满足常见的数据保护需求。

查看详情云原生企业级数据湖基于对象存储 OSS 构建的数据湖，可对接多种数据输入方式，存储任何规模的结构化、半结构化、非结构化数据，打破数据湖孤岛。无缝对接多种数据分析产品，对存储在对象存储 OSS 中的数据直接进行大数据分析，洞察业务价值。同时，数据湖提供多种存储类型的冷热分层转换能力，通过数据全生命周期...

来自：解决方案

向量检索 Milvus 版

阿里云向量检索 Milvus 版是阿里云提供的 Serverless Milvus 全托管服务，100% 兼容开源 Milvus，提供高性能、可扩展、大规模 AI 向量数据库相似性检索服务。

结合 AI 推理、训练等工程平台和 Embedding 模型的能力，Milvus 可高效索引和检索不同类型的数据，如：图片、视频、声纹、办公文档和一些半结构化文档，支持快速精准地跨媒体类型进行信息检索，并提供强大的扩展性和灵活的接口.图向量相似度查询.关键帧相似度查询.音频向量相似度查询.开源大数据平台 E-MapReduce.人工智能...

| 产品优势 | 产品功能 | 应用场景

来自：云产品

游戏数据运营融合分析

场景描述 1.游戏行业有结构化和非结构化数据融合分析需求的客户。 2.游戏行业有数据实时分析需求的客户，无法接受T+1延迟。 3.对数据成本有一定诉求的客户，希望物尽其用尽量优化成本。 4.其他行业有类似需求的客户。方案优势/解决问题 1.秒级实时分析：依托ADB计算密集型实例，秒级监控DAU等数据，为广告投放效果提供有力的在线决策支撑。 2.高效数据融合分析：打通结构化和非结构化数据，支撑产品体验分析；广告买量投放效果实时（分钟级）分析，渠道的评估更准确。 3.低成本：DLA融合冷数据分析+ADB存储密集型温数据分析+ADB计算密集型热数据分析，在满足各种分析场景需求的同时，有效地降低的客户的总体使用成本。 4.学习成本低：DLA和ADB兼容标准SQL语法，无需额外学习其他技术。产品列表 专有网络VPC、负载均衡SLB、NAT网关、弹性公网IP 云服务器ECS、日志服务SLS、对象存储OSS 数据库RDSMySQL、数据传输服务DTS、数据管理DMS 分析型数据库MySQL版ADS 数据湖分析DLA、QuickBI

分区格式这一步的配置非常重要，默认是：%Y%m%d%H%M，表示会在 OSS Bucket这个目录下创建年、月、日、时、分共 5级目录投放数据，但是在本场景中，需要对 OSS上面的数据进行分析，也就是说需要大量的读取 OSS的数据，从分析的性能角度出发，需要在 OSS的目录结构上进行针对性的优化，建议可以配置为：y=Y/m=m/d=d/...

来自：最佳实践 | 相关产品：云数据库RDS MySQL 版,对象存储 OSS,云原生数据仓库AnalyticDB My,数据湖分析,Quick BI

RAPIDS加速图像搜索

场景描述本方案适用于使用RAPIDS加速平台 +GPU云服务器来对图像搜索任务进行加速的场景。相比CPU，利用GPU+ RAPIDS在图像搜索场景下可以取得非常明显的加速效果。解决问题 1.搭建RAPIDS加速图像搜索环境 2.使用容器服务Kubernetes版部署图像搜索环境 3.使用NAS存储计算数据产品列表容器服务Kubernetes版 GPU云服务器文件存储NAS

本文案例提供了download_and_extract(data_dir)方法供您下载和解压 STL-10数据集。RAPIDS镜像中已经将数据集下载到./data目录，您可以执行 download_and_extract()方法直接解压数据集。步骤2 读取图片。从数据集解压出的数据为二进制格式，执行read_all_images(path_to_data)方法加载数据并转换为 NHWC（batch,height,...

来自：最佳实践 | 相关产品：云服务器ECS,文件存储NAS,容器服务 ACK

企业构建统一CMDB数据源

典型场景 l 企业/ISV构建多云CMDB平台，对接数十款产品的API，拉取、清洗、格式化、存储配置数据是复杂且高成本的工作。 l 企业日常的资源管理，需依赖资源配置历史、资源关系数据进行故障溯源和影响评估。解决方案 l 企业管理账号设置Config配置数据投递，将所有账号的资源配置快照和历史归集到统一地址留存。 l 使用OSS做长期归档，使用SLS做实时分析和监听。获取全量资源数据并及时感知云上资源的变更。 l 将数据集成到自有CMDB平台客户价值 l 基于配置审计简单便捷的持续收集云上资源配置数据，在自建CMDB过程中节省大量人力和时间成本。 l 跨账号统一收集数据，实现中心化的资源配置管理。 l 实现资源配置数据的持续收集和监听，及时感知云上资源的增删改，洞察异常变更。

获取ECS网络信息本章节，我们以ECS资源的网络配置数据为例，使用 python脚本模拟将资源配置数据导入企业自有系统。用到了配置审计的 API，在使用前需要导入阿里云 SDK 核心库:aliyun-python-sdk-core：在多账号情况下，列出主账号下指定账号组的所有资源数据：在多账号情况下，查询指定资源的详细数据注意：上述两个...

来自：最佳实践 | 相关产品：云服务器ECS,云数据库RDS MySQL 版,对象存储 OSS,日志服务（SLS）,配置审计

湖仓一体架构EMR元数据迁移DLF

通过EMR+DLF数据湖方案，可以为企业提供数据湖内的统一的元数据管理，统一的权限管理，支持多源数据入湖以及一站式数据探索的能力。本方案支持已有EMR集群元数据库使用RDS或内置MySQL数据库迁移DLF，通过统一的元数据管理，多种数据源入湖，搭建高效的数据湖解决方案。

本方案支数据一致性校验持已有 EMR集群元数据库使用 RDS或内置 MySQL 数据库迁移 DLF，通过统一的元数据管理，多种数据源入湖，搭建高效的数据湖解决方案。最佳实践频道阿里云最佳实践分享群产品列表 VPC、EMR、EIP、DLF、RDS、CADT 云服务器 ECS（产品名称）文档模板（手册名称）/文档版本信息阿里云湖仓一体架构 ...

来自：最佳实践 | 相关产品：E-MapReduce,数据湖构建

基于湖仓一体架构使用MaxCompute对OSS湖数据分析预测

基于湖仓一体架构使用MaxCompute对OSS湖<em>数据</em>分析预测

本篇最佳实践先创建EMR集群作为数据湖对象，Hive元数据存储在DLF，外表数据存储在OSS。然后使用阿里云数据仓库MaxCompute以创建外部项目的方式与存储在DLF的元数据库映射打通，实现元数据统一。最后通过一个毒蘑菇的训练和预测demo，演示云数仓MaxCompute如何对于存储在EMR数据湖的数据进行加工处理以达到业务预期。

最后通过一个毒蘑菇的训练和预测demo，演示云数仓 MaxCompute如何对于存储在EMR数据湖的数据进行加工处理以达到业务预期。相关命令可以下载后浏览：gitclonehttps:/best-practice:Abcd123456@codeup.aliyun.com/best-practice/bp/199.git 使用场景针对分析师如何利用MaxComputeIn-databaseML 能力，通过湖仓一体架构对...

来自：最佳实践 | 相关产品：对象存储 OSS,E-MapReduce,DataWorks,大数据计算服务 MaxCompute,API网关,数据湖构建,云速搭

数据资源平台

阿里云数据资源平台是构建数据智能的全流程平台，提供数据汇聚、数据加工与治理、数据分析、资产管理和统一服务等功能，帮助金融、政府及企业客户实现数据资源管理，潜在规律挖掘，业务决策优化。

提供完善的无代码化数据接入配置、数据模板配置、数据同步任务运行监控等功能，有效保障数据接入的稳定性和可控性，满足各类平台、数据源及应用系统间的数据汇聚需求.面向对大批量实时数据或高并发离线数据接入有着高要求的业务场景，为上层业务应用持续、稳定、高效汇聚高质量数据.流批一体数据同步保证数据一致性，分布式...

来自：云产品

数据传输服务DTS

阿里云数据传输服务集数据迁移、订阅及实时同步功能于一体，能够解决公共云、混合云场景下，远距离、毫秒级异步数据传输难题，支持关系型数据库、NoSQL、大数据(OLAP)等数据源，其底层基础设施采用阿里双11异地多活架构，为数千下游应用提供实时数据流，已在线上稳定运行7年之久。

可以将源端数据库数据实时同步到数据仓库，构建实时分析数仓，也可以根据调度策略的配置，定期地将源库中的结构和存量数据迁移至目标库中，构建更加灵活的数据仓库（例如构建T+1的周期性数仓）.实时同步功能支持将并发粒度缩小到事务级别，能够并发同步同张表的更新数据，提升同步性能；支持多并发压缩传输，降低传输链路对...

来自：云产品

大数据近实时数据投递MaxCompute

本文介绍离线大数据场景使MaxCompute构建云上近实时数仓，打通云下数据上云链路，解决数据复杂类型支持和动态分区问题，满足高级数据处理需求的最佳实践。 l混合云环境下，现有业务系统零改造，打通数据上云链路。 l使用UDF实现复杂数据类型转换和数据动态分区。 l使用DataWorks配置周期调度业务流程，数据自动入仓。 l借助MaxCompute优化计算引擎，实现降本增效。产品列表云服务器ECS 专有网络VPC 访问控制RAM 数据总线DataHub E-MapReduceEMR DataWorks 大数据计算服务MaxCompute

本例中根据投递到 Kafka的数据结构编写的 UDTF核心代码如下：MAP List 文档版本：20240419 37 大数据近实时数据投递 MaxCompute Struct 可通过调整 data_for_p 的时间转换格式实现动态分区，本实例中按天分区。完整示例代码库通过以下命令下载。文档版本：20240419 38 大数据近实时数据投递 MaxCompute git clone ...

来自：最佳实践 | 相关产品：块存储,专有网络 VPC,云服务器ECS,访问控制,E-MapReduce,DataWorks,大数据计算服务 MaxCompute,数据总线,云速搭CADT

自建Hive数据仓库跨版本迁移到阿里云Databricks数据洞察

自建Hive<em>数据</em>仓库跨版本迁移到阿里云Databricks<em>数据</em>洞察

场景描述客户在IDC或者公有云环境自建Hadoop集群构建数据仓库和分析系统，购买阿里云Databricks数据洞察集群之后，涉及到数仓数据和元数据的迁移以及Hive版本的订正更新。方案优势 1. 全托管Spark集群免运维，节省人力成本。 2. Databricks数据洞察与阿里云其他产品（OSS、RDS、MaxCompute、EMR）进行深度整合，支持以这些产品为数据源的输入和输出。 3. 使用Databricks Runtime商业版引擎相比开源Spark性能有3-5倍的提升。解决问题 1. Hive数仓数据迁移OSS方案。 2. Hive元数据库迁移阿里云RDS方案。 3. Hive跨版本迁移到Databricks数据洞察使用Delta表查询以提高查询效率。

将订正后的转储文件导入到 RDS for MySQL实例中中，我们在 Databricks数据洞察集群的 Hive元数据库中导入了客户 Hive元数据库的转储文件，创建了一系列 的数据表并插入了数据。在本实践方案中，Hive版本从客户 IDC的 1.2.2变更为阿里云 Databrickes数据洞察集群的 2.3.5，但是 Databricks 数据洞察集群 Hive 元数据库中的...

来自：最佳实践 | 相关产品：专有网络 VPC,云服务器ECS,对象存储 OSS,文件存储HDFS,spark

Spark on ECI大数据分析

场景描述方案优势 1.计算引擎弹性扩缩容，兼顾资源弹性与计算资源成本优化。 2.计算与存储分离架构，结合阿里云原生云存储产品，海量数据湖优势。 3.Kubernetes原生的调度性能优势，提升在大规模分析作业时的分析性能优势分。 4.集群资源隔离和按需分配。解决问题 1.计算资源弹性能力不足，计算资源成本管控能力欠缺. 2.集群资源调度能力和隔离能力不足。 3.计算与存储无法分离，大数据量分析时出现数据存储资源瓶颈。 4.Spark submit方式提交分析作业参数支持有限等缺点。产品列表容器服务Kubernetes版(ACK) 弹性容器实例(ECI) 文件存储HDFS 对象存储OSS 专有网络VPC 容器镜像服务ACR

应用范围需要使用 Spark on Kubernetes解决方案的用户对 Spark大数据分析平台计算资源成本控制考虑的用户需要有灵活可扩展计算平台资源弹性及管控的用户名词解释文件存储 HDFS：阿里云文件存储 HDFS是面向阿里云 ECS实例及容器服务等计算资源的文件存储服务，允许用户像在 Hadoop分布式文件系统中管理和访问数据，...

来自：最佳实践 | 相关产品：专有网络 VPC,对象存储 OSS,容器服务 ACK,弹性容器实例 ECI,文件存储HDFS

基于Flink+ClickHouse构建实时游戏数据分析

在互联网、游戏行业中，常常需要对用户行为日志进行分析，通过数据挖掘，来更好地支持业务运营，比如用户轨迹，热力图，登录行为分析，实时业务大屏等。当业务数据量达到千亿规模时，常常导致分析不实时，平均响应时间长达10分钟，影响业务的正常运营和发展。本实践介绍如何快速收集海量用户行为数据，实现秒级响应的实时用户行为分析，并通过实时流计算Flink/Blink、云数据库ClickHouse等技术进行深入挖掘和分析，得到用户特征和画像，实现个性化系统推荐服务。通过云数据库ClickHouse替换原有Presto数仓，对比开源Presto性能提升20倍。利用云数据库ClickHouse极致分析性能，千亿级数据分析从10分钟缩短到30秒。云数据库ClickHouse批量写入效率高，支持业务高峰每小时230亿的用户数据写入。云数据库ClickHouse开箱即用，免运维，全球多Region部署，快速支持新游戏开服。 Flink+ClickHouse+QuickBI

关键技术选型 1.1.ClickHouse vs Presto 面对海量的数据，我们如何进行数据库的选项，这里对比了开源的两种常见分析性数据库。ClickHouse对数据采用有序存储的方式，其核心思想是充分利用了磁盘批量顺序读写的性能要远远高于随机读写的特征，并且结合 LSM tree的设计进一步进行优化，使得写性能达到最优（可达到 200MB/S...

来自：最佳实践 | 相关产品：云服务器ECS,弹性公网IP,实时计算,Quick BI,消息队列 Kafka 版,云数据库 ClickHouse

DTS数据同步集成MaxCompute数仓

场景描述本文Step by Step介绍了通过数据传输服务 DTS实现从云数据库RDS到MaxCompute的数据同步集成，并介绍如何使用DTS和 MaxCompute数仓联合实现数据ETL幂等和数据生命周期快速回溯。解决问题 1.实现大数据实时同步集成。 2.实现数据ETL幂等。 3.实现数据生命周期快速回溯。产品列表 MaxCompute 数据传输服务DTS DataWorks 云数据库RDS MySQL 版

数据抽取不幂等或容错率低，如凌晨 0:00启动的 ETL任务因为各种原因(数据库 HA切换、网络抖动或 MAXC写入失败等)失败后，再次抽取无法获取 0:00时的数据状态。2.针对不规范设计表，如没有 create_time/update_time的历史遗留表，传统 ETL需全量抽取。3.实时性差，抽取数据+重试任务往往需要 1-3小时。另外数据库的数据...

来自：最佳实践 | 相关产品：专有网络 VPC,云数据库RDS MySQL 版,数据传输,DataWorks,大数据计算服务 MaxCompute

图的数据结构_相关内容

新品推荐