2017年数据架构师架构选型必读

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云原生数据库 PolarDB PostgreSQL 版,标准版 2核4GB 50GB
简介:
这是最好的时代,科学技术推陈出新,各种数据库不再一家独大,关系数据库、非关系数据库(NoSQL)、混合数据库(NewSQL)各领风骚。

 

这也是最坏的时代,琳琅满目的数据库名称和特性,让我们目不暇接。一个个去研究显然时间和精力有限,随大流选一个却又担心走到坑里去,沉没成本太大。

 

刚好这又冬去春来,适合大兴土木大搞建设的时候到了,这里就来跟大家捭阖下。

 

首先还是要有个基准的判断,这个业务系统,是选用关系型数据库呢,还是非关系型数据库?是偏OLTP类型呢还是更加偏OLAP类型?

 

如果是选择传统关系型数据库,通常就只建议在这四个数据库里选择了。

 

 

Oracle虽然一直在掉分,而且分数被MySQL拉得很近,但是大家需要注意的是,这个分值并非代表使用的公司的多少,也不代表使用的套数或者数据量的大小,而主要因素是“热度”,这东西跟股市有点差不多,供参考但不能依赖。

 

 

DBAplus Newsletter第二期中是这么解读的:“其实这么看上去第一集团还是Oracle / MySQL / SQLServer,PG在快速追赶中,目前离第一集团大概还有3~4倍左右的差距,但PG作为这几个老牌数据库中斜率比较大的,大概在2013年年底有一个跳变,看时间点应该是PG 9.3的发布,随后PG一直保持了非常稳健的向上发展趋势,这个表现非常符合最近几年PostgreSQL社区的快速发展,从9.0到去年的9.6,PG面向传统企业、互联网、金融、物联网、政企等行业发布了诸多特性,在SQL兼容性与时俱进,贴近最新发布的SQL标准,从社区发布的性能测试来看,单机TPS达到了180万的水准。PostgreSQL正在以自己的方式构建一个庞大的生态体系。这个数据也是比较符合直观感受的。”

 

那么,具体要怎么选择呢?如果你是个新鲜的互联网公司,而且也有钱找得起高工资的DBA有能力控制好开发质量,那么不用多说,选择开源数据库吧,MySQL或者PG。如果JSON类LBS业务用得非常多,用PG吧,否则可以用MySQL。

 

选用MySQL,一个重要的新组件暂时还不推荐上:MySQL 5.7.17 Group Replication。从官方的性能测试结果看,性能是优于Galera PXC的,接近异步同步。但是目前在运维方面的支持上不够好,比如备份和集群客户端支持上,离实际生产环境大规模应用还是有一段距离。

 

如果你其实也不知道开发团队会设计出些什么架构,写出些什么代码,对开源数据库的特点也基本没太多经验,那么选Oracle或者SQL Server吧。业务量很大,优选Oracle,否则SQL Server也是可以的。后者几乎是“免维护”的,至少不太请专职DBA。

 

当然,优先推荐的当然是Oracle,因为12cR2已经发布了。浦发银行2017年的新项目全部采用12cR2,当然肯定是要用集群,肯定是要用PDB,肯定是要用IMO,这些技术在吉林移动、浙江移动都在核心生产上跑了好长时间了。是的,R2新出的Sharding还在考量中,虽然看起来很美。

 

MongoDB现在用的也非常多,曾经一度热度超过了PG。目前看起来还是以互联网应用为主,社群今年会有许多线下沙龙,可以多参加了解。

 

国内数据库,我们相信是绝大多数人心中的痛。这个其实也没办法,婴儿学步总要有个时间。

 

Newsletter第二期有5家国产数据库发布了新的产品消息:

 

  • 蚂蚁金服的OceanBase 1.0可申请试用

  • TiDB将发布RC2

  • 达梦发布DM v7.1.5.145 

  • 巨杉数据库发布SequoiaDB 2.6社区版

  • 南大通用发布GBase UP

  • 原文发布时间为:2017-02-25

    本文来自云栖社区合作伙伴DBAplus

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
27天前
|
机器学习/深度学习 人工智能 并行计算
AI部署架构:A100、H100、A800、H800、H20的差异以及如何选型?开发、测试、生产环境如何进行AI大模型部署架构?
AI部署架构:A100、H100、A800、H800、H20的差异以及如何选型?开发、测试、生产环境如何进行AI大模型部署架构?
AI部署架构:A100、H100、A800、H800、H20的差异以及如何选型?开发、测试、生产环境如何进行AI大模型部署架构?
|
5天前
|
存储 运维 Serverless
千万级数据秒级响应!碧桂园基于 EMR Serverless StarRocks 升级存算分离架构实践
碧桂园服务通过引入 EMR Serverless StarRocks 存算分离架构,解决了海量数据处理中的资源利用率低、并发能力不足等问题,显著降低了硬件和运维成本。实时查询性能提升8倍,查询出错率减少30倍,集群数据 SLA 达99.99%。此次技术升级不仅优化了用户体验,还结合AI打造了“一看”和“—问”智能场景助力精准决策与风险预测。
116 69
|
27天前
|
机器学习/深度学习 传感器 自然语言处理
基于Transformer架构的时间序列数据去噪技术研究
本文介绍了一种基于Transformer架构的时间序列去噪模型。通过生成合成数据训练,模型在不同噪声条件下展现出强去噪能力。文章详细解析了Transformer的输入嵌入、位置编码、自注意力机制及前馈网络等关键组件,并分析实验结果与注意力权重分布。研究为特定任务的模型优化和专业去噪模型开发奠定了基础。
92 14
基于Transformer架构的时间序列数据去噪技术研究
|
8天前
|
存储 机器学习/深度学习 算法
阿里云X86/ARM/GPU/裸金属/超算等五大服务器架构技术特点、场景适配与选型策略
在我们选购阿里云服务器的时候,云服务器架构有X86计算、ARM计算、GPU/FPGA/ASIC、弹性裸金属服务器、高性能计算可选,有的用户并不清楚他们之间有何区别。本文将深入解析这些架构的特点、优势及适用场景,帮助用户更好地根据实际需求做出选择。
|
2月前
|
存储 数据采集 机器学习/深度学习
新闻聚合项目:多源异构数据的采集与存储架构
本文探讨了新闻聚合项目中数据采集的技术挑战与解决方案,指出单纯依赖抓取技术存在局限性。通过代理IP、Cookie和User-Agent的精细设置,可有效提高采集策略;但多源异构数据的清洗与存储同样关键,需结合智能化算法处理语义差异。正反方围绕技术手段的有效性和局限性展开讨论,最终强调综合运用代理技术与智能数据处理的重要性。未来,随着机器学习和自然语言处理的发展,新闻聚合将实现更高效的热点捕捉与信息传播。附带的代码示例展示了如何从多个中文新闻网站抓取数据并统计热点关键词。
新闻聚合项目:多源异构数据的采集与存储架构
|
6月前
|
消息中间件 存储 缓存
十万订单每秒热点数据架构优化实践深度解析
【11月更文挑战第20天】随着互联网技术的飞速发展,电子商务平台在高峰时段需要处理海量订单,这对系统的性能、稳定性和扩展性提出了极高的要求。尤其是在“双十一”、“618”等大型促销活动中,每秒需要处理数万甚至数十万笔订单,这对系统的热点数据处理能力构成了严峻挑战。本文将深入探讨如何优化架构以应对每秒十万订单级别的热点数据处理,从历史背景、功能点、业务场景、底层原理以及使用Java模拟示例等多个维度进行剖析。
114 8
|
6月前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
1527 7
|
6月前
|
数据采集 搜索推荐 数据管理
数据架构 CDP 是什么?
数据架构 CDP 是什么?
196 2
|
3月前
|
存储 数据采集 人工智能
AllData数据中台架构全览:数据时代的智慧中枢
杭州奥零数据科技有限公司成立于2023年,专注于数据中台业务,维护开源项目AllData并提供商业版解决方案。AllData提供数据集成、存储、开发、治理及BI展示等一站式服务,支持AI大模型应用,助力企业高效利用数据价值。

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等