推荐:一款分布式的对象存储服务

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,恶意文件检测 1000次 1年
对象存储 OSS,内容安全 1000次 1年
简介:

最近公司在准备内部数据上云,并且内部数据库每天的数据量很大,需要采用大数据存储的方案。

方案调研
每个程序技术在实现之前,需要进行开源产品的调研,适合自己产品的技术方案才是最好的。

需求
我们需要处理是图像信息,大小在1M左右。

供以后各个项目组用来拉取图像。

自定义了一个按照标准存储的一批图像,这批图像大小可能在几百兆或者小到几兆大小

技术选型
我们选取了两种技术方案

采用hdfs的集群存储的方案,将数据进行流读取,存储二进制文;将相关的文件内容进行整合成一个大文件存储到hdfs上。

另外一个技术方案采用的是minio,分布式存储方案。

今天要给大家介绍的是minio技术方案。

Minio
什么是Minio
minio 是一款开源的对象存储服务。可以兼容亚马逊的S3存储服务接口,非常适合存储大容量的非结构化数据。

这些非结构化数据包含 图片,视频,日志文件,备份数据和容器、虚拟机镜像。

对象文件大小可以从几kb到最大5T.

我们可以用来做什么
企业上我们可以利用其分布式的功能,内部搭建图片处理服务器,文件存储服务器,公司内部的文件存储服务器,这样就不用限制存储的大小,也不限制存储位置。

我们个人可以直接在家庭内部搭建个人的云盘服务,开心的保存家里面的数据文件,再也不担心数据丢失的问题了。

怎么安装
Minio 分布式对象存储,在官网提供了很多的技术选择方案。

image
根据图中有5种不同的方案,让我们进行选择,可以使用docker 单机部署,也可以采用Docker-compose进行部署伪分布式。 可以使用Docker Swarm 和 k8s 部署分布式架构的选型。

因为是测试阶段,所以采用的是伪分布式的构建方式。使用docker-compose 方式进行部署。

部署
docker-compose 部署方案,我们需要进行安装docker 与docker-compose ,这个在docker文档中都有,可以参考docker-compose官网。为了方便小伙伴进行学习,简单流程安装给大小说下。

安装docker

centos
yum install docker 
ubuntu 
apt-get install docker.io

安装docker-compose

sudo curl -L"https://github.com/docker/compose/releases/download/1.23.1/ocker-compose-$(uname -s)-$(uname -m)"-o /usr/local/bin/docker-compose
执行下权限操作
sudo chmod +x /usr/local/bin/docker-compose

检验下版本是否是正确的
docker-compose --version
docker-compose version 1.23.1, build 1719ceb

以上步骤操作成功后,我们就可以安装minio 来进行实战演练了。

下载docker-compose.yaml文件

version: '2'
# starts 4 docker containers running minio server instances. Each
# minio server's web interface will be accessible on the host at port
# 9001 through 9004.
services:
 minio1:
  image: minio/minio:RELEASE.2018-12-19T23-46-24Z
  volumes:   
- data1:/data  
  ports:
-
 "9001:9000"
  environment:
   MINIO_ACCESS_KEY: minio
   MINIO_SECRET_KEY: minio123

  command: server http://minio1/data http://minio2/datahttp://minio3/data http://minio4/data 
 minio2:
  image: minio/minio:RELEASE.2018-12-19T23-46-24Z
  volumes:
  - data2:/data
  ports:   - "9002:9000"
  environment:
   MINIO_ACCESS_KEY: minio
   MINIO_SECRET_KEY: minio123

  command: server http://minio1/data http://minio2/data http://minio3/data http://minio4/data 
 minio3:
  image: minio/minio:RELEASE.2018-12-19T23-46-24Z

  volumes:   - data3:/data
  ports:   - "9003:9000"
  environment:
   MINIO_ACCESS_KEY: minio
   MINIO_SECRET_KEY: minio123
  command:
 server http://minio1/data http://minio2/data http://minio3/datahttp://minio4/data 
 minio4:  image:
 minio/minio:RELEASE.2018-12-19T23-46-24Z
  volumes:   - data4:/data  ports:   - "9004:9000"
  environment:
   MINIO_ACCESS_KEY: minio
   MINIO_SECRET_KEY: minio123

  command:
 server http:
//minio1/data http://minio2/data http://minio3/data http://minio4/data 
## By default this config uses default local driver,
## For custom volumes replace with volume driver configuration.

volumes:  data1:
  data2:
  data3:
  data4:

在上面我们需要注意两点。

volumes 全局:如果我们不进行配置的话,使用的是默认的路径文件。

在这里向找到相关的存储的文件内容我们可以使用docker inspect 镜像id 来查看。

不配置全局:我们每个镜像id配置一个路径那么我们需要改下文件配置文件

version: '2'

# starts 4 docker containers running minio server instances. Each

# minio server's web interface will be accessible on the host at port

# 9001 through 9004.

services:
 minio1:
  image: minio/minio:RELEASE.2018-12-19T23-46-24Z
  volumes:   - /media/data1:/data:z  
  ports:   - "9001:9000"  environment:
   MINIO_ACCESS_KEY:minio
   MINIO_SECRET_KEY: minio123
  command: server http://minio1/data http://minio2/data http://minio3/data http://minio4/data 
 minio2:
  image: minio/minio:RELEASE.2018-12-19T23-46-24Z
  volumes:   - /meida/data2:/data:z  ports:-"9002:9000"
  environment: 
  MINIO_ACCESS_KEY: minio
   MINIO_SECRET_KEY: minio123

  command: server http:
//minio1/data http://minio2/data http://minio3/data http://minio4/data 
 minio3:
  image: minio/minio:RELEASE.2018-12-19T23-46-24Z
  volumes:   -/media/data3:/data:z
  ports:   - "9003:9000"
  environment:  
 MINIO_ACCESS_KEY: minio
   MINIO_SECRET_KEY: minio123

  command:
 server http://minio1/data http://minio2/data http://minio3/datahttp://minio4/data 

 minio4:
  image: minio/minio:RELEASE.2018-12-19T23-46-24Z
  volumes:   - /media/data4:/data:z
  ports:   -"9004:9000"
  environment:

   MINIO_ACCESS_KEY: minio
   MINIO_SECRET_KEY: minio123

  command: server http://minio1/data http://minio2/datahttp://minio3/data http://minio4/data 

在这个文件中,我们主要做了两项修改:

/media/data1:/data ,我们将data里面的数据映射到media/data1本地目录下。

在:/data 后面增加:z ,这个是为了解决权限问题所增加的。

权限问题是这样的,在我们后面加上:
z 
就是我们就可以启动成功了
 
ERROR 
Unable
 to initialize posix backend: 
Unable
 to write to the backend.
minio3_1_2ce510efd213 |
       > 
Please 
ensure 
Minio
 binary has write permissions 
for
 the backend

启动

首先拉取镜像
docker-compose pull
镜像启动
docker-compose up
如果没有出现错误,那么我们程序就启动成功了  

浏览器查看

ip:9001

访问,第一次登陆我们需要填写
ACCESS_KEY 
与
SECRET_KEY 
。这个两个内容的值在我们配置文件中已存在,直接查看配置文件内容然后填写

浏览器页面展示:
image
image
出现以上界面就代表我们安装成功了

使用

进入界面后我们需要先点击右下角的加号,然后创建文件目录,我们的图像是存储在文件目录下的。
image
结束

这样我们的一个分布式系统就搭建完成了,怎么样是不是很简单?嘿嘿。

总结
分布式文件系统存储,是我们搭建开始的第一步,后面性能问题,存储压力都是我们需要面临的。做好准备工作才能更好的服务我们的产品。

原文发布时间为:2018-12-20
本文作者: 琪琪
本文来自云栖社区合作伙伴“ LuckQI”,了解相关信息可以关注“LuckQI”微信公众号

相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
相关文章
|
7天前
|
监控 负载均衡 Cloud Native
ZooKeeper分布式协调服务详解:面试经验与必备知识点解析
【4月更文挑战第9天】本文深入剖析ZooKeeper分布式协调服务原理,涵盖核心概念如Server、Client、ZNode、ACL、Watcher,以及ZAB协议在一致性、会话管理、Leader选举中的作用。讨论ZooKeeper数据模型、操作、会话管理、集群部署与管理、性能调优和监控。同时,文章探讨了ZooKeeper在分布式锁、队列、服务注册与发现等场景的应用,并在面试方面分析了与其它服务的区别、实战挑战及解决方案。附带Java客户端实现分布式锁的代码示例,助力提升面试表现。
28 2
|
2月前
|
监控 负载均衡 Dubbo
|
21天前
|
消息中间件 算法 Java
【亿级数据专题】「分布式服务框架」 盘点本年度我们探索服务的保障容量的三大关键方案实现
【亿级数据专题】「分布式服务框架」 盘点本年度我们探索服务的保障容量的三大关键方案实现
181 0
|
3月前
|
Dubbo Java 应用服务中间件
Spring Boot Dubbo 构建分布式服务
Spring Boot Dubbo 构建分布式服务
47 0
|
3月前
|
消息中间件 算法 Java
【亿级数据专题】「分布式消息引擎」 盘点本年度我们探索服务的保障容量的三大关键方案实现
尽管经过了上一篇文章 《【亿级数据专题】「分布式消息引擎」 盘点本年度我们探索服务的低延迟可用性机制方案实现》有了低延迟的优化保障,消息引擎仍需精心规划其容量。为了提供无与伦比的流畅体验,消息引擎必须实施有效的容量管理策略。
52 2
【亿级数据专题】「分布式消息引擎」 盘点本年度我们探索服务的保障容量的三大关键方案实现
|
2月前
|
消息中间件 存储 负载均衡
【亿级数据专题】「分布式消息引擎」 盘点本年度我们探索服务的HA高可用解决方案
昔之善战者,先为不可胜,以待敌之可胜。不可胜在己,可胜在敌。故善战者,能为不可胜,不能使敌之必可胜。故曰:胜可知,而不可为。
77 2
【亿级数据专题】「分布式消息引擎」 盘点本年度我们探索服务的HA高可用解决方案
|
2月前
|
存储 Oracle 关系型数据库
分布式事物【Seata实现、下载启动Seata服务、搭建聚合父工程构建】(四)-全面详解(学习总结---从入门到深化)
分布式事物【Seata实现、下载启动Seata服务、搭建聚合父工程构建】(四)-全面详解(学习总结---从入门到深化)
45 0
|
3月前
|
消息中间件 存储 Java
【亿级数据专题】「分布式消息引擎」 盘点本年度我们探索服务的低延迟可用性机制方案实现
在充满挑战的2023年度,我们不可避免地面对了一系列棘手的问题,例如响应速度缓慢、系统陷入雪崩状态、用户遭受不佳的体验以及交易量的下滑。这些问题的出现,严重影响了我们的业务运行和用户满意度,为了应对这些问题,我们所在团队进行了大量的研究和实践,提出了低延迟高可用的解决方案,并在分布式存储领域广泛应用。
43 2
【亿级数据专题】「分布式消息引擎」 盘点本年度我们探索服务的低延迟可用性机制方案实现
|
3天前
|
安全 Java 网络安全
对象存储oss使用问题之使用oss上服务器后显示服务异常如何解决
《对象存储OSS操作报错合集》精选了用户在使用阿里云对象存储服务(OSS)过程中出现的各种常见及疑难报错情况,包括但不限于权限问题、上传下载异常、Bucket配置错误、网络连接问题、跨域资源共享(CORS)设定错误、数据一致性问题以及API调用失败等场景。为用户降低故障排查时间,确保OSS服务的稳定运行与高效利用。
10 0
|
1月前
|
消息中间件 SpringCloudAlibaba Java
【Springcloud Alibaba微服务分布式架构 | Spring Cloud】之学习笔记(八)Config服务配置+bus消息总线+stream消息驱动+Sleuth链路追踪
【Springcloud Alibaba微服务分布式架构 | Spring Cloud】之学习笔记(八)Config服务配置+bus消息总线+stream消息驱动+Sleuth链路追踪
778 0