大数据时代下,需要什么样的冷存储?

简介:
  智能互联网时代,数据正在以几何级的数量爆炸增长,如何存储并管理这些海量数据,是很多企业面临的一个难题。如果采用传统通用型服务器存储策略,这意味着要建设庞大的数据中心系统,导致存储成本极速攀升。

对于那些云服务提供商而言,大量不断增长的数据例如图片等都属于不经常访问,但却又无法删除的,即使客户很久不会访问这些信息,但依然不能随意删除,并且不允许停机归档,也无法实现洪峰数据控制。对于这些不常访问的“冷”数据,如果我们能把他们迁移到一个专为冷数据而设计的低成本存储层中,将能大幅降低费用。

哪些数据需要?

冷存储主要用于那些备份、灾难恢复、存档、社交媒体等应用领域。这些数据都有一个共通的特性,较低的访问频率,并且需要最大限度的降低其存储成本,同时要求随时可访问。例如用户在社交媒体上存储的大量图片信息,以及法律电子取证要求已存档的数据必须在特定的时间范围内可用。因此,这就要求云服务提供商以及企业必须确保数据的完整性,以及及时的访问权限。

备份对于企业而言至关重要,因为需要备份的数据通常是企业有效运营所需要的信息,如果这些信息无法在特定时间范围回复,将严重影响企业业务。

存档对于企业运营以及提高工作效率必不可少,通常,企业并不需要快速访问已经存档的数据。但检索已经存档的数据可能要花费大量的时间,并且随着企业业务的增长,数据量持续增加,同时这些数据要存储长达几十年甚至更长的时间,这会给存储带来极大的压力。

灾难恢复,热备用暂难恢复服务在云中提供了专业的备用基础设施和数据,这意味着在发生灾难时,可以立即切换到云中。通过冷存储服务,可以消除企业在灾难中数据保护的某些流程,降低成本和复杂性。同时,企业需要快速的重构数据文件,还原应用程序,以最快的速度恢复系统正常运行。

社交媒体,智能互联网时代,大量的社交数据产生,用户通常查看新发布的照片,而对于那些旧的数据,则鲜有人问之。对于照片、视频等这些非结构化数据通常会占用大量存储空间,并且增长速度远远超过其他类型的数据。如果将这些旧的数据迁移到冷存储中,可以大幅降低运营成本。同时提供社交媒体服务的企业必须保护这些数据的隐私安全。

我们需要什么样的冷存储?

对于大部分创业公司而言,通常在公司创立初期,很难将业务细分的非常明确,大部分都会选用通用服务器来做存储,但随着业务的不断扩张,就会考虑将很多计算型节点分离出来。对于那些重要的数据希望在运行的更快的SSD 或PCIE SSD上,而对那些历史数据、日志则希望不要太占用现有服务器存储资源。因此,业务需要进行分层。

如何进行分层?在要确保性能不能有大幅损失的同时降低存储费用,特别是对于那些图片存储,对于一些云服务提供商而言,这一点尤其重要。因为根据其业务类型,就要求及时客户很久没有访问这些数据,也不能随意删除。另外一点非常重要的则是,其业务没有明显的周期性,不像其他行业,如金融等,每天固定时间开市闭市,可以进行数据维护;也没有周期性的数据洪峰,无法做出数据洪峰控制。

如何满足上述需求?联想的冷存储产品不失为一个理想的选择。

联想4U60盘位、双节点的冷存储业务服务器SD600,每节点拥有2个2.5寸系统盘插槽,可以通过更换连接两节点间EXPB槽位的DB卡,实现服务器在HA (High Availability)、Zoning以及 Single Node (JBOD)三种模式下的工作方式。

通过采用联想SD600可以顺利的帮助企业将计算分析业务与数据存储业务分离,当存储服务器的硬件资源主要用于数据存储,数据块为大块数据时,相信SD600将是您最优的选择。因为对并发进程较少的业务来说,每个进程的性能更依赖于CPU的主频。不难看出,存储业务对cores间的进程切换需求很低,对单core的主频性能要求较高。那么经过优化过的Avago磁盘主控芯片,与高频E3 CPU的搭配,将会更好的为您提供数据存储业务。

可灵活选配的联想冷存储

联想SD600 在HA 模式下,当对数据的实时可用能力有较高要求时,可以通过增加一张HA DB card来实现两个节点间的高可用。同时,因为需要用到SAS接口的双通道,需要存储池内的60块盘都是SAS磁盘。当需要降低归档服务器、文件服务器、图片服务器等温冷数据服务器的成本时,可以选用Zoning和Single Node模式。Zoning模式即划分给每个节点30块磁盘做存储池,将SD600变为4U2N服务器使用。Single Node模式可以有效降低互联网公司的图片存储、日志归档、音视频存储业务的硬件建设成本。此外,该模式下一个节点将带起60块SATA硬盘。目前联想推广的最佳实践案例包含6T 7.2k 企业级硬盘/8T 5.9k 企业级云盘。

此外,联想SD600在可靠性和兼容性方面实现了最佳平衡,可以满足RHEL、SUSE、windows、Ubuntu各种业务需求。其采用双排9风扇交叉风向设计,具备了更好的散热效果,满足服务器45℃高温下连续工作的要求,更适合苛刻的数据中心环境。与E5通用服务器相比,联想SD600的TCO至少降低了10%,耗电量降低了8%。同时,仅从数据的存取角度来看,1颗高主频能超线程到8 Thread的E3-1231 v3在相同内存与网络环境的情况下,在客户实际的使用中发现,相比2颗E5-2609 v3数据传输速度会提高10-20%。

 
 
  作者:佚名
来源:51CTO
相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
1月前
|
存储 数据库 云计算
数据存储技术的发展与应用
数据存储技术的发展与应用
|
8月前
|
存储 监控 安全
80%以上是冷数据!昆腾的数据归档之道
中国的冷、温、热数据分别占比80%、15%和5%,冷数据是最多的。而对于冷数据来说,计算不是常态,主要是存储。中国算力中心的“存力”相对不足,中国数据存储产业大有可为。
111 0
80%以上是冷数据!昆腾的数据归档之道
|
存储 人工智能 运维
储留香:天庭需要怎样的数据存储系统
在中国神话故事中,高达九重的天庭之中神仙众多,二十八星宿、三十六天罡、七十二地煞等等,每位大仙也多是长生不死,少则几百、多则几万岁,要保障如此庞大的系统组织高效运转就需要一个良好的数据存储系统。
3269 0
储留香:天庭需要怎样的数据存储系统
|
SQL 存储 分布式数据库
HBaseOnOSS冷数据存储
本期直播资料下载以及往期直播资料下载大全
2105 0
|
存储 安全 大数据