胖子哥的大数据之路(9)-数据仓库金融行业数据逻辑模型FS-LDM

简介:

引言:

  大数据不是海市蜃楼,万丈高楼平地起只是意淫,大数据发展还要从点滴做起,基于大数据构建国家级、行业级数据中心的项目会越来越多,大数据只是技术,而非解决方案,同样面临数据组织模式,数据逻辑模式的问题。它山之石可以攻玉,本文就数据仓库领域数据逻辑模型建设最负盛名的FS-LDM进行介绍,旨在抛砖引玉,希望能够给大家以启迪。参与交流请加群:347018601

一、概述

(1)什么是LDM

  逻辑数据模型LDM是数据仓库的数据建设阶段为解决业务需求而定义的数据仓库模型解决方案,它是指导数据仓库进行数据存放、数据组织、以及如何支持应用的蓝图,定义需要追踪和管理的各种重要实体、属性、关系。

(2)为什么需要LDM

  操作型数据库和数据仓库都需要的数据组织模式;

  LDM是构建DW的第一步,是建立BI的基础框架,是提供价值数据分析的重要基础,为复杂的DW系统实施提供了规范和基础结构的蓝图;

  LDM促进业务部门和IT分析人员之间的有效沟通,形成对重要业务定义和术语的统一认识。具备跨部门、中性的特征,能够表达所有的业务;

(3)主流LDM有哪些

  Teradata FS-LDM(金融服务逻辑数据模型):是预先构建的LDM,利用它可以直接开始数据仓库模型设计,它是一个成熟的产品;

  IBM有BDWM(Banking Data Warehouse Model);

二、FS-LDM 金融11个主题模型

1.团体 PARTY
是指银行作为一个金融机构所服务的任意对象和感兴趣进行分析的各种对象。如个人、公司客户、潜在客 户、代理机构、合作伙伴、雇员、分行、部门等。一个团体可以同时是这当中许多种角色。借助团体主题的建立可以实现基于客户基本信息的分析,是实现以客户为 中心的各种分析应用的重要基础。


2.资产 ASSET
用于描述团体的资产,资产主题包含两大类的资产,客户资产和建行自有资产。一个资产可以被多个团体所拥有,一个团体可以与多个资产有关。资产可分为实物资 产、金融资产与无形资产。客户资产信息的来源很多情况下是在客户申请贷款时所提供的各种担保品信息、抵质押品信息等。本主题可以存放从业务系统能够取得到 的所有的客户资产或建行自有资产,可以房地产、存货、机动车辆、在其他金融机构的存款。


3.地域 LOCATION
地域信息存储了希望观察和分析的任何区域,既包括传统类型的地址信息(如区县、街道),又包括如电话、电子邮箱等电子地址信息。


4.产品 PRODUCT
产品(Product):指为拓展市场占有率,满足客户更广泛需求而制定的可营销的交易品种的集合,产品是金融机构向用户销售的或提供给客户所使用的服务。如果有必要,可以包括竞争对手所提供的产品


5.协议 AGREEMENT
是金融机构与团体之间针对某种特定产品或服务而签立的契约关系,它可以是多样化的,如帐户、客户和银行签订的合同等。当金融机构与客户之间针对某种产品或 服务的条款和条件达成协议时,一个协议(AGREEMENT)就会被开立,因此协议是客户和银行往来的重要载体。协议主题与很多应用有关,如:风险敞口的 计算、不同种类协议的评级、资产负债的缺口分析、客户和银行的往来情况(客户贡献、客户买的什么产品、何时购买的产品)等。


6.事件 EVENT
是一个范围很广义的概念,可以记录各种与银行相关的活动的详细情况。既可以与资金相关,也可以与资金无关;既可以有客户参与,也可以没有客户参与;既可以 与帐户相关,也可以与帐户无关;可以由客户发起,也可以由银行发起。总之它可以记录的范围非常广泛,可以记录各种与银行相关的活动的详细情况,包括交易数 据,比如存款、提款、付款、收取信用卡年费、计算利息和费用、投诉、查询产品、查询地址、查询余额、网上交易等。


7.营销活动 CAMPAIGN
营销活动是银行对客户开展的一系列的促销事件以及相应的策略和规划活动的组合,是为了获取、维护、增强金融机构与客户的关系而开展的,其目的可能是为推广某些产品,也可能是为了树立市场形象。


8.渠道 CHANNEL
渠道是银行与客户进行交互和接触的手段和方法,通过它客户与银行进行接触、购买产品、使用服务并交流信息。渠道一般包括ATM、分行柜台、电话、POS、呼叫中心、电视、广播、报纸、网络、信件等。

 

9.财务 FINANCE
主要包括银行的总帐信息,是描述科目组织、控制、内部核算等银行核心科目帐务以及预算管理有关的内容。该主题抽象地描述了银行内部帐务的组织模式,能够适应不同的科目组织体系。

 

10.申请 APPLICATION
申请是一个团体表达与银行建立关系的意图。在团体(或申请者)满足银行的接收标准前,这种意图并不足以建立关系。本主题记录一个团体向银行提交的申请信息以及申请的状态、团体和申请关系历史、申请和资产关系历史、银行对申请的评分等信息。


11.模型 MODEL
存储与模型细节相关的信息类,包括模型细节(模型名称、创建时间等等)、模型指标以及团体、渠道、产品的评分和细分。模型可以有多次运行;一个模型和另一个模型可以有多种关系;模型有多个结果值。

三、模型结构图(7.0版本)

四、工作规划

  大数据不是海市蜃楼,大数据时代带来的技术变革和数据存储技术对传统的数据仓库带来了挑战和机遇,构建大数据时代的数据仓库架构将从数据逻辑模型开始,基本的一个想法是参照传统模式下,做的最好的数据仓库体系,以结合行业应用的模式,进行数据逻辑模型的设计与重构。

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
18天前
|
分布式计算 运维 数据挖掘
MaxCompute是一个强大的云数据仓库服务
【4月更文挑战第1天】MaxCompute是一个强大的云数据仓库服务
21 1
|
18天前
|
存储 数据采集 分布式计算
构建MaxCompute数据仓库的流程
【4月更文挑战第1天】构建MaxCompute数据仓库的流程
22 2
|
24天前
|
机器学习/深度学习 分布式计算 监控
大模型开发:你如何使用大数据进行模型训练?
在大数据模型训练中,关键步骤包括数据准备(收集、清洗、特征工程、划分),硬件准备(分布式计算、并行训练),模型选择与配置,训练与优化,监控评估,以及模型的持久化与部署。过程中要关注数据隐私、安全及法规遵循,利用技术进步提升效率和性能。
32 2
|
1月前
|
分布式计算 大数据 Hadoop
数据仓库(13)大数据数仓经典最值得阅读书籍推荐
从事数仓工作,在工作学习过程也看了很多数据仓库方面的数据,此处整理了数仓中经典的,或者值得阅读的书籍,推荐给大家一下,希望能帮助到大家。建议收藏起来,后续有新的书籍清单会更新到这里。
157 2
数据仓库(13)大数据数仓经典最值得阅读书籍推荐
|
1月前
|
SQL 数据采集 存储
数据仓库(12)数据治理之数仓数据管理实践心得
这边文章聊聊自己对数据治理开发实践的一些思路,就是聊聊怎么开始去做数据治理这件事情。说起数据治理,有时候虽然看了很多文章,看了很多的介绍,了解数据治理的理论,但是实际上需要我们去搞的时候,就会踩很多的坑。这里记一下自己做数据治理的一些思路,做做笔记,也分享给需要的同学。 当然,想要做数据治理,想要学习了解,一下数据治理的范围,理论等,最好可以看看别人怎么做的,了解数据治理可以参考:[数据仓库(11)什么是大数据治理,数据治理的范围是哪些](https://zhuanlan.zhihu.com/p/467433967)。
230 0
|
1月前
|
存储 监控 大数据
数据仓库(11)什么是大数据治理,数据治理的范围是哪些
什么是数据治理,数据治理包含哪些方面?大数据时代的到来,给了我们很多的机遇,也有很多的挑战。最基础的调整也是大数据的计算和管理,数据治理是一个特别重要的大数据基础,他保证着数据能否被最好的应用,保证着数据的安全,治理等。那么数据治理到底能治什么,怎么治?
64 0
|
1月前
|
存储 大数据 数据管理
数据仓库(09)数仓缓慢变化维度数据的处理
数据仓库的重要特点之一是反映历史变化,所以如何处理维度的变化是维度设计的重要工作之一。缓慢变化维的提出是因为在现实世界中,维度的属性并不是静态的,它会随着时间的流逝发生缓慢的变化,与数据增长较为快速的事实表相比,维度变化相对缓慢。阴齿这个就叫做缓慢变化维。
210 2
数据仓库(09)数仓缓慢变化维度数据的处理
|
1月前
|
人工智能 DataWorks 数据可视化
心动基于阿里云DataWorks构建游戏行业通用大数据模型
心动游戏在阿里云上构建云原生大数据平台,基于DataWorks构建行业通用大数据模型,如玩家、产品、SDK、事件、发行等,满足各种不同的分析型应用的要求,如AI场景、风控场景、数据分析场景等。
334 1
|
3月前
|
存储 机器学习/深度学习 数据挖掘
数据仓库与数据湖:解析数据驱动的未来
在数字化时代,数据成为企业决策的核心资源。本文将深入探讨数据仓库和数据湖的概念、特点以及应用场景,分析其在实现数据驱动决策过程中的重要性和优势,并展望数据驱动的未来发展趋势。
49 5
|
3月前
|
SQL 分布式计算 Java
数仓学习---7、数据仓库设计、数据仓库环境准备、模拟数据生成
数仓学习---7、数据仓库设计、数据仓库环境准备
123 2

热门文章

最新文章