用Python开发主机批量管理工具

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介:

    通过前面对Paramiko模块的学习与使用,以及Python中多线程与多进程的了解,依此,就可以开发简易的主机批量管理工具了。

    显然批量管理主机时,程序如果能并发执行功能是最好的,因为这样可以最大程度地利用CPU的性能,因此这就需要使用Python多线程或者多进程,基于学习的需要,这里主要使用多进程来进行开发,当然,这会存在一定问题,后面会说。

    主要内容如下:

1
2
3
4
5
6
7
1 .主机批量管理工具功能
2 .设计框架
3 .实现:数据库信息与程序源代码
4 .实战演示
5 .程序的不足
6 .在写程序过程中的经验教训
7 .往后的改进思路


1.主机批量管理工具功能

    这里的主机主要是指Linux服务器,需要的功能如下:

(1)批量命令执行

    能够通过该程序对管理列表中的主机批量执行管理员输入的命令。

(2)批量文件分发

    对于多台服务器主机需要同一文件时,可以通过该程序远程批量分发指定的文件。

(3)支持自定义端口

    实现(1)(2)的功能都依赖于Paramiko模块,而Paramiko模块是基于SSH来完成的,虽然大多数Linux服务器的SSH端口号都默认使用22,但出于安全的考虑,也有修改默认端口号的情况,比如将SSH远程端口号修改为52113等。

(4)自定义用户

    这里的自定义用户主要是指该程序的用户,把该程序理解为一个批量管理系统,要使用该系统就必然要有该系统的账号与用户名,而每个账号与用户名根据权限的需要,都应该有自己可以管理的主机列表,比如普通运维人员只能管理部分服务器主机,而运维总监则应该可以管理更多的主机,并且他们的管理权限也应该是不一样的,因此,他们分别对应的管理系统的账号的权限就不一样了。

(5)日志记录功能

    运维人员登陆该系统后,对远程服务器主机进行了什么操作、时间、成功与否等信息都要以日志形式记录下来。


2.设计框架

    基于上面几个功能的需要,设计的思路如下:

wKioL1Yfa6SxmBECAAFbZPi37UQ185.jpg


3.实现:数据库信息与程序源代码

    根据需求与设计框架,做如下的工作:

(1)数据库信息

1)管理系统登陆信息数据库

    这里存放的是该系统可以登陆的用户名密码等信息,只有在这里存在的用户名才能进行登陆,如下:

    

创建了manager_system数据库:

1
2
3
4
5
6
7
8
9
mysql> show databases;
+--------------------+
| Database           |
+--------------------+
| information_schema |
| manager_system     |
| mysql              |
+--------------------+
3  rows  in  set  ( 0.03  sec)

    

在manager_system数据库中创建了两种类型不同的表:

1
2
3
4
5
6
7
8
9
10
mysql>  use  manager_system
mysql> show tables;
+--------------------------+
| Tables_in_manager_system |
+--------------------------+
| manager1_server          |
| manager2_server          |
| users                    |
+--------------------------+
3  rows  in  set  ( 0.00  sec)

    表users用来存放用户信息,表manager1_server等就是用来存放用户对应的可以管理的主机列表,下面会讲。 


表users就是用来存放系统用户信息的:

1
2
3
4
5
6
7
8
9
10
mysql> describe users;
+-----------+------------------+------+-----+---------+----------------+
| Field     | Type             |  Null  | Key | Default | Extra          |
+-----------+------------------+------+-----+---------+----------------+
| id        |  int ( 10 ) unsigned | NO   | PRI | NULL    | auto_increment |
| username  | char( 20 )         | NO   |     | NULL    |                |
| password  | char( 20 )         | NO   |     | NULL    |                |
| real_name | char( 20 )         | NO   |     | NULL    |                |
+-----------+------------------+------+-----+---------+----------------+
4  rows  in  set  ( 0.01  sec)

    

表users中存放了两个用户信息:

1
2
3
4
5
6
7
8
mysql> select * from users;
+----+----------+----------+-----------+
| id | username | password | real_name |
+----+----------+----------+-----------+
|   1  | manager1 |  123456    | zhangsan  |
|   2  | manager2 |  123456    | lisi      |
+----+----------+----------+-----------+
2  rows  in  set  ( 0.00  sec)

    也就是说,只能用户manager1和manager2才能登陆该系统,其他用户除非向管理员申请注册,否则是无法登陆该系统的。


2)管理系统用户主机列表数据库

    其实还是使用了manager_system的数据库,只是在该数据库中创建了基于用户的不同表,如下:


两种类型不同的表:

1
2
3
4
5
6
7
8
9
10
mysql>  use  manager_system
mysql> show tables;
+--------------------------+
| Tables_in_manager_system |
+--------------------------+
| manager1_server          |
| manager2_server          |
| users                    |
+--------------------------+
3  rows  in  set  ( 0.00  sec)


表[name]_server就是用来存放用户对应的主机列表:

1
2
3
4
5
6
7
8
9
10
11
12
mysql> describe manager1_server;
+-------------+------------------+------+-----+---------+----------------+
| Field       | Type             |  Null  | Key | Default | Extra          |
+-------------+------------------+------+-----+---------+----------------+
| id          |  int ( 10 ) unsigned | NO   | PRI | NULL    | auto_increment |
| ip          | char( 20 )         | NO   |     | NULL    |                |
| username    | char( 20 )         | NO   |     | NULL    |                |
| password    | char( 20 )         | NO   |     | NULL    |                |
| port        |  int ( 11 )          | NO   |     | NULL    |                |
| server_type | char( 20 )         | NO   |     | NULL    |                |
+-------------+------------------+------+-----+---------+----------------+
6  rows  in  set  ( 0.00  sec)


表中存放了用户可以管理的主机相关信息:

1
2
3
4
5
6
7
8
mysql> select * from manager1_server;
+----+---------------+-----------+----------+-------+-------------+
| id | ip            | username  | password | port  | server_type |
+----+---------------+-----------+----------+-------+-------------+
|   1  192.168 . 1.124  | oldboy    |  123456    |     22  | DNS Server  |
|   2  192.168 . 1.134  | yonghaoye |  123456    52113  | DHCP Server |
+----+---------------+-----------+----------+-------+-------------+
2  rows  in  set  ( 0.00  sec)

    其中这里的ip就是远程主机的IP地址了,server_type就是服务器类型,username和password是远程主机ssh登陆的用户密码,这也说明,只要管理系统用户进入了管理系统,在对远程主机进行管理时,就不需要输入远程主机的用户名和密码了,除了方便外,这也有一定的安全性。

    需要说明的是这里的port端口号,可以看到这里有台主机的port为22,而另一台则为52113,就是前面所说的自定义端口号了,因此,这需要管理员在添加主机时手动指定。


(2)程序源代码

    有了上面的基本数据准备后,再看一下该程序的源代码,其中部分注释会给出,但是基于前面的介绍,代码应该也是比较容易理解的:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
import  MySQLdb,os,paramiko,sys,time
from multiprocessing  import  Process,Pool
 
#数据库连接类
class  Connect_mysql:
     conn = MySQLdb.connect(host =  'localhost' , user =  'root' ,passwd =  '123456' , db =  'manager_system' , port =  3306 )
     cur = conn.cursor()
     def __init__(self,username,password= 'NULL' ):
         self.username = username
         self.password = password
     #contect to the login table    
     def login_check(self):    #连接管理系统账号信息数据库并验证用户名密码信息
         try :
             self.cur.execute( "select * from users where username = '%s' and password = '%s'"  % (self.username,self.password))
             qur_result = self.cur.fetchall()  # return  the tuple
             
             if  qur_result == (): #database  do  not have  this  user
                 return  0        
             else :
                 return  1             #database has  this  user
             self.cur.close()
             self.conn.close()
 
         except MySQLdb.Error,e:
             print  '\033[31;1mMysql Error Msg:%s\033[0m'  % e
     #contect to the server table
     def return_server(self):    #连接用户主机列表数据库并返回表信息
         self.cur.execute( "select * from %s_server"  %  self.username)
         qur_result = self.cur.fetchall()
         return  qur_result
 
def ssh_run(host_info,cmd,sysname):    #批量远程命令执行程序
     ip,username,password,port= host_info[ 1 ],host_info[ 2 ],host_info[ 3 ],host_info[ 4 ]
     date = time.strftime( '%Y_%m_%d' )
     date_detial = time.strftime( '%Y_%m_%d %H:%M:%S' )    
     f = file( './log/%s_%s_record.log'  % (sysname,date), 'a+' )    #操作日志记录,记录程序所有目录的/log目录里
     try :
         s.connect(ip, int (port),username,password,timeout= 5 )
         stdin,stdout,stderr = s.exec_command(cmd)
 
         cmd_result = stdout.read(),stderr.read()
 
         print  '\033[32;1m-------------%s--------------\033[0m'  % ip
         for  line  in  cmd_result:
             print line,
         print  '\033[32;1m-----------------------------\033[0m'
     except:
         log =  "Time:%s | Type:%s | Detial:%s | Server:%s | Result:%s\n"  % (date_detial, 'cmd batch' ,cmd,ip, 'failed' )
         f.write(log)
         f.close()
         print  '\033[31;1mSomething is wrong of %s\033[0m'  % ip
     else :
         log =  "Time:%s | Type:%s | Detial:%s | Server:%s | Result:%s\n"  % (date_detial, 'cmd batch' ,cmd,ip, 'success' )
         f.write(log)
         f.close()
         return  1
 
def distribute_file(host_info,file_name,sysname):    #批量文件分发函数
     ip,username,password,port = host_info[ 1 ],host_info[ 2 ],host_info[ 3 ], int (host_info[ 4 ])
     date = time.strftime( '%Y_%m_%d' )
     date_detial = time.strftime( '%Y_%m_%d %H:%M:%S' )
     f = file( './log/%s_%s_record.log'  % (sysname,date), 'a+' )    #日志记录
     try :
         t = paramiko.Transport((ip,port))
         t.connect(username=username,password=password)
         sftp = paramiko.SFTPClient.from_transport(t)
         sftp.put(file_name, '/tmp/%s'  % file_name)
         t.close()
     except:
         log =  "Time:%s | Type:%s | Detial:%s | Server:%s | Result:%s\n"  % (date_detial, 'distribute file' ,file_name,ip, 'failed' )
         f.write(log)
         f.close()
         print  '\033[31;1mSomething is wrong of %s\033[0m'  % ip
     else :
         log =  "Time:%s | Type:%s | Detial:%s | Server:%s | Result:%s\n"  % (date_detial, 'distribute file' ,file_name,ip, 'success' )
         f.write(log)
         f.close()
         print  "\033[32;1mDistribute '%s' to %s Successfully!\033[0m"  % (file_name,ip)
 
os.system( 'clear' )
print  '\033[32;1mWelcome to the Manager System!\033[0m'
 
while  True:    #程序主程序
     username = raw_input( 'Username:' ).strip()
     password = raw_input( 'Password:' ).strip()
     if  len(username) <=  3  or len(password) <  6 :
         print  '\033[31;1mInvalid username or password!\033[0m'
         continue
     #Begin to login
     p = Connect_mysql(username,password)
     mark = p.login_check()
     if  mark ==  0 :        #login failed
         print  '\033[31;1mUsername or password wrong!Please try again!\033[0m'
     elif mark ==  1 :      #login success
         print  '\033[32;1mLogin Success!\033[0m'
         print  'The server list are as follow:'
         #seek  for  the server list managed by the system user
         p = Connect_mysql(username)
         server_list = p.return_server()
         for  server  in  server_list:
             print  '%s:%s'  % (server[ 5 ],server[ 1 ])
         while  True:
             print  '' 'What  do  you want to  do ?    #程序主菜单
1 .Execute the command batch.
2 .Distribute file(s) batch.
3 .Exit. '' '
             choice = raw_input( '\033[32;1mYour choice:\033[0m' ).strip()
             if  '1'  <= choice <=  '4' :pass
             else : continue
 
             #Execute the command batch.
             if  choice ==  '1' :    #批量执行命令程序块
                 s = paramiko.SSHClient()    #调用Paramiko模块
                 s.load_system_host_keys()
                 s.set_missing_host_key_policy(paramiko.AutoAddPolicy())
 
                 p = Pool(processes= 3 )    #设定进程池数据
 
                 result_list = []
                 while  True:
                     cmd = raw_input( '\033[32;0mEnter the command(or quit to quit):\033[0m' )
                     if  cmd ==  'quit' : break
                     for  in  server_list:
                         result_list.append(p.apply_async(ssh_run,[h,cmd,username])) #the usename  is  system name
             #调用相关功能函数,并执行多进程并发
                     for  res  in  result_list:
                         res. get ()
                 s.close()
 
             #Distribute file(s) batch.
             elif choice ==  '2' :    #批量分发文件程序块
                 s = paramiko.SSHClient()    #调用Paramiko模块
                 s.load_system_host_keys()
                 s.set_missing_host_key_policy(paramiko.AutoAddPolicy())
 
                 p = Pool(processes= 3 )
 
                 result_list = []  #save the suanfa that come from the apply_async
                 while  True:
                     file_name = raw_input( 'The file you want to distribute(or quit to quit):' ).strip()
                     start = time.time()
                     if  file_name ==  'quit' : break
                     file_chcek = os.path.isfile(file_name)
                     log_list = []
                     if  file_chcek == False:
                         print  '\033[31;1mThe file does not exist or it is a directory!\033[0m'
                         continue
                     for  in  server_list:
                         result_list.append(p.apply_async(distribute_file,[h,file_name,username]))   #the list save the suanfa
                     for  res  in  result_list:
                         res. get ()   #run the suanfa
                     end = time.time()
                     print  '\033[31;1mCost time:%ss\033[0m'  % str(end - start)
                 s.close()
 
             #Exit the system
             elif choice ==  '3' :    #退出系统
                 sys.exit( '\033[32;1mWelcome to use our system!\033[0m' )

    程序的代码量不多,主要功能也有注释,只要的paramiko模拟的SSH命令执行与SFTP文件分发、Python多进程以及进程池的使用有所了解,还是比较容易理解的。


4.实战演示

    基于几个主要功能:批量命令执行、文件分发、日志记录,下面来做个演示:

(1)登陆系统

wKiom1Yfc-Sii0GxAARPEGGrpFs475.jpg

(2)批量执行命令

wKiom1YfdIbAm-3lAAQ2eJ7xjhs060.jpg


(3)批量分发文件

wKioL1YfdVigCpPHAAMOTwyNdPo417.jpg


(4)退出系统

wKiom1YfdYmiXwXlAAFt2u8hBGk738.jpg


(5)用户操作日志查看

查看日志文件列表:

wKiom1YfdivBZgWQAAE_WBjtjsM572.jpg    

    可以看到,操作日志是基于不同用户的(这里会有manager2的日志文件是我后来用manager2登陆后执行操作产生的,上面没有给出manager2的操作过程),并且是按天生成的,只要用户登陆并执行相关操作,日志文件是自动生成的。


查看详细日志内容:

wKiom1YfdtfygGy0AALGVWwXkSo569.jpg    

    可以查看该用户在具体时间所做的具体操作,以及成功与否等更细节的信息。


5.程序的不足

(1)细节上的问题

    由于未投入生产使用,所以会存在一些意想不到的Bug,主要是在连接远程主机时可能引发的各种异常。

(2)使用了多进程

    虽然使用了进程池了限制同一时间内并发的进程数,但仍然不可避免会出现文件资源抢占的情况,只是这里因为并发的进程只有两个,所以影响并不会很大,基于该程序比较小型,因此往后也可继续使用多进程,当然,使用多线程效果会更好,这里只是出于学习的需要而使用多进程。

(3)程序代码简洁程序

    程序的代码简洁程度可以进一步优化,比如两个功能:批量执行命令和分发文件,其实里面就有很多重复的代码,本来是考虑用类的方法来重写的,但是对面向对象编程又不够熟悉,所以就没有使用了。

    当然,这其实只是非常小的的一个程序,不过倒是可以作为以后开发特定功能的监控系统时的某一模块来使用,不管怎么说,框架在这里的话应该还是正确的,由于时间和实际需要情况的考虑,在这里并没有做太多的界面优化,因为以后是考虑做成Web界面的。当然,就从学习Python的角度来考虑,这个程序还是可以练练手,各种小的积累才能沉淀出优秀的大型开源软件。


6.在写程序过程中的经验教训

    一开始函数有参数file作为我传入的文件字,但是函数中又使用了file来打开文件,所以执行程序时一直显示TypeError: 'str' object is not callable的错误,后来无意将file改变open发现又正常了,于是才很意识到这个错误。如果一开始就有这个意识,后面也不会浪费这么多时间,所以这一点要尤其注意了。


7.往后的改进思路

(1)在以后学习了Django的相关知识后,可以考虑将其写成是基于Web界面的管理系统。

(2)加强测试,尽可能找出程序中低级的Bug。

(3)改用多线程来写程序,并注意文件资源的抢占问题。

(4)将功能重复的代码用函数方式或面向对象编程方式来重写。




本文转自 xpleaf 51CTO博客,原文链接:http://blog.51cto.com/xpleaf/1703304,如需转载请自行联系原作者

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
9天前
|
算法 测试技术 开发者
性能优化与代码审查:提升Python开发效率
【4月更文挑战第9天】本文强调了Python开发中性能优化和代码审查的重要性。性能优化包括选择合适数据结构、使用生成器和避免全局变量,而代码审查涉及遵循编码规范、使用静态代码分析工具和编写单元测试。这些实践能提升代码效率和可维护性,促进团队协作。
|
1月前
|
存储 开发工具 git
Python中的版本控制和代码协作工具
在Python项目中,版本控制和代码协作是非常重要的。最常用的版本控制工具是Git,而代码协作则通常通过Git配合代码托管平台(如GitHub、GitLab等)来实现。以下是一个基本的流程,说明如何使用Git进行版本控制以及如何通过GitHub进行代码协作。
|
3天前
|
前端开发 数据挖掘 API
使用Python中的Flask框架进行Web应用开发
【4月更文挑战第15天】在Python的Web开发领域,Flask是一个备受欢迎的轻量级Web框架。它简洁、灵活且易于扩展,使得开发者能够快速地构建出高质量的Web应用。本文将深入探讨Flask框架的核心特性、使用方法以及在实际开发中的应用。
|
6天前
|
测试技术 开发者 Python
Python中的装饰器:优雅而强大的函数修饰工具
在Python编程中,装饰器是一种强大的工具,用于修改函数或方法的行为。本文将深入探讨Python中装饰器的概念、用法和实际应用,以及如何利用装饰器实现代码的优雅和高效。
|
8天前
|
JavaScript 前端开发 Docker
全栈开发实战:结合Python、Vue和Docker进行部署
【4月更文挑战第10天】本文介绍了如何使用Python、Vue.js和Docker进行全栈开发和部署。Python搭配Flask创建后端API,Vue.js构建前端界面,Docker负责应用的容器化部署。通过编写Dockerfile,将Python应用构建成Docker镜像并运行,前端部分使用Vue CLI创建项目并与后端交互。最后,通过Nginx和另一个Dockerfile部署前端应用。这种组合提升了开发效率,保证了应用的可维护性和扩展性,适合不同规模的企业使用。
|
15天前
|
前端开发 测试技术 数据库
【python】为什么使用python Django开发网站这么火?
【python】为什么使用python Django开发网站这么火?
|
24天前
|
数据采集 搜索推荐 数据挖掘
使用Python制作一个批量查询搜索排名的SEO免费工具
最近工作中需要用上 Google SEO(搜索引擎优化),有了解过的朋友们应该都知道SEO必不可少的工作之一就是查询关键词的搜索排名。关键词少的时候可以一个一个去查没什么问题,但是到了后期,一个网站都有几百上千的关键词,你再去一个一个查,至少要花费数小时的时间。 虽然市面上有很多SEO免费或者收费工具,但免费的基本都不能批量查,网上免费的最多也就只能10个10个查询,而且查询速度很慢。收费的工具如Ahrefs、SEMrush等以月为单位收费最低也都要上百美刀/月,当然如果觉得价格合适也可以进行购买,毕竟这些工具的很多功能都很实用。今天我给大家分享的这个排名搜索工具基于python实现,当然肯定
37 0
|
24天前
|
XML Shell Linux
性能工具之 JMeter 使用 Python 脚本快速执行
性能工具之 JMeter 使用 Python 脚本快速执行
40 1
性能工具之 JMeter 使用 Python 脚本快速执行
|
24天前
|
数据可视化 数据挖掘 Python
Python中的数据可视化工具Matplotlib简介与实践
在本文中,我们将介绍Python中常用的数据可视化工具Matplotlib,包括其基本概念、常用功能以及实际应用。通过学习Matplotlib,读者可以更好地理解和运用数据可视化技术,提升数据分析与展示的能力。
|
28天前
|
Web App开发 前端开发 JavaScript
Python Selenium是一个强大的自动化测试工具
Python Selenium是一个强大的自动化测试工具

热门文章

最新文章