MySQL——binlog

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介:

一、binlog简介:


1、什么是binlog:

   binlog日志用于记录所有更新了数据或者已经潜在更新了数据(例如,没有匹配任何行的一个DELETE)的所有语句。语句以“事件”的形式保存,它描述数据更改。


2、binlog的记录格式:

Mysql binlog日志有三种格式,分别为:Statement ,MiXED ,和ROW;

  (在MySQL5.7.7版本之后,把binlog_format的默认值修改成了ROW。master将修改表的event写入binlog中,并且master将binlog信息发送到slave,slave重放binlog中event。基于ROW格式复制是最安全的复制,slave需要的行锁更少;但是也有一些缺点,那就是基于ROW格式的复制,binlog会记录更多的数据。并且无法在slave上看到从master上获取的语句,因为都是event。但是在ROW格式下,可以开启binlog_rows_query_log_events参数,这会让binlog在记录events同时,也记录原始的sql语句,以方便后续的查询;)


①:Statement:每一条会修改数据的sql都会记录在binlog中。


优点:不需要记录每一行的变化,减少了binlog日志量,节约了IO,提高性能。(相比row能节约多少性能与日志量,这个取决于应用的SQL情况,正常同一条记录修改或者插入row格式所产生的日志量还小于Statement产生的日志量,但是考虑到如果带条件的update操作,以及整表删除,alter表等操作,ROW格式会产生大量日志,因此在考虑是否使用ROW格式日志时应该跟据应用的实际情况,其所产生的日志量会增加多少,以及带来的IO性能问题。)


缺点:由于记录的只是执行语句,为了这些语句能在slave上正确运行,因此还必须记录每条语句在执行的时候的一些相关信息,以保证所有语句能在slave得到和在master端执行时候相同 的结果。另外mysql 的复制,像一些特定函数功能,slave可与master上要保持一致会有很多相关问题(如sleep()函数, last_insert_id(),以及user-defined functions(udf)会出现问题).


使用以下函数的语句也无法被复制:

* LOAD_FILE()

* UUID()

* USER()

* FOUND_ROWS()

* SYSDATE() (除非启动时启用了 --sysdate-is-now 选项)


------同时在INSERT ...SELECT 会产生比 RBR 更多的行级锁


②:Row: 不记录sql语句上下文相关信息,仅保存哪条记录被修改。


优点: binlog中可以不记录执行的sql语句的上下文相关的信息,仅需要记录那一条记录被修改成什么了。所以row level的日志内容会非常清楚的记录下每一行数据修改的细节。而且不会出现某些特定情况下的存储过程,或function,以及trigger的调用和触发无法被正确复制的问题


缺点: 所有的执行的语句当记录到日志中的时候,都将以每行记录的修改来记录,这样可能会产生大量的日志内容,比如一条update语句,修改多条记录,则binlog中每一条修改都会有记录,这样造成binlog日志量会很大,特别是当执行alter table之类的语句的时候,由于表结构修改,每条记录都发生改变,那么该表每一条记录都会记录到日志中。


③:Mixedlevel: 是以上两种level的混合使用,

  一般的语句修改使用statment格式保存binlog,如一些函数,statement无法完成主从复制的操作,则采用row格式保存binlog,MySQL会根据执行的每一条具体的sql语句来区分对待记录的日志形式,也就是在Statement和Row之间选择一种.新版本的MySQL中队row level模式也被做了优化,并不是所有的修改都会以row level来记录,像遇到表结构变更的时候就会以statement模式来记录。至于update或者delete等修改数据的语句,还是会记录所有行的变更。



二、Binlog基本配制与格式设定


1、基本配制


Mysql BInlog日志格式可以通过mysql的my.cnf文件的属性binlog_format指定。如以下:

1
2
3
4
binlog_format = ROW             ---binlog日志格式
log_bin = /mysql/mysql-bin .log        ---binlog日志名
expire_logs_days = 7            ---binlog过期清理时间
max_binlog_size 100m            ---binlog每个日志文件大小

2.Binlog日志格式选择


Mysql默认是使用Statement日志格式,推荐使用ROW.


  由于一些特殊使用,可以考虑使用ROWED,如自己通过binlog日志来同步数据的修改,这样会节省很多相关操作。对于binlog数据处理会变得非常轻松,相对mixed,解析也会很轻松(当然前提是增加的日志量所带来的IO开销在容忍的范围内即可)。


3.mysqlbinlog格式选择


mysql对于日志格式的选定原则:如果是采用 INSERT,UPDATE,DELETE 等直接操作表的情况,则日志格式根据 binlog_format 的设定而记录,如果是采用 GRANT,REVOKE,SET PASSWORD 等管理语句来做的话,那么无论如何 都采用 SBR 模式记录。



三、binlog的相关参数:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
--log_bin:
设置此参数表示启用binlog功能,并指定路径名称
 
--log_bin_index
设置此参数是指定二进制索引文件的路径与名称
 
--binlog_do_db
此参数表示只记录指定数据库的二进制日志
 
--binlog_ignore_db
此参数表示不记录指定的数据库的二进制日志
 
--max_binlog_cache_size
此参数表示binlog使用的内存最大的尺寸
 
--binlog_cache_size
此参数表示binlog使用的内存大小,可以通过状态变量binlog_cache_use和binlog_cache_disk_use来帮助测试。
     binlog_cache_use:使用二进制日志缓存的事务数量
     binlog_cache_disk_use:使用二进制日志缓存但超过binlog_cache_size值并使用临时文件来保存事务中的语句的事务数量
 
--max_binlog_size
Binlog最大值,最大和默认值是1GB,该设置并不能严格控制Binlog的大小,尤其是Binlog比较靠近最大值而又遇到一个比较大事务时,为了保证事务的完整性,不可能做切换日志的动作,只能将该事务的所有SQL都记录进当前日志,直到事务结束
 
--sync_binlog
这个参数直接影响mysql的性能和完整性
 
--sync_binlog=0:
当事务提交后,Mysql仅仅是将binlog_cache中的数据写入Binlog文件,但不执行fsync之类的磁盘        同步指令通知文件系统将缓存刷新到磁盘,而让Filesystem自行决定什么时候来做同步,这个是性能最好的。
 
--sync_binlog=n,在进行n次事务提交以后,Mysql将执行一次fsync之类的磁盘同步指令,同志文件系统将Binlog文件缓存刷新到磁盘。
注意:Mysql中默认的设置是sync_binlog=0,即不作任何强制性的磁盘刷新指令,这时性能是最好的,但风险也是最大的。一旦系统绷Crash,在文件系统缓存中的所有Binlog信息都会丢失


四、binlog的删除:

  binlog的删除可以手工删除或自动删除


1、自动删除binlog

1
2
3
4
通过binlog参数(expire_logs_days )来实现mysql自动删除binlog
mysql> show binary logs;
mysql> show variables like  'expire_logs_days' ;
mysql>  set  global expire_logs_days=3;


2、手工删除binlog

1
2
3
4
5
6
7
8
9
mysql> reset master;       ----删除master的binlog
mysql> reset slave;        ----删除slave的中继日志
mysql> purge master logs before  '2017-03-30 17:20:00' ;   -----删除指定日期以前的日志索引中binlog日志文件
mysql> purge master logs to  'binlog.000002' ;     ----删除指定日志文件的日志索引中binlog日志文件或者直接用操作系统命令直接删除
mysql>  set  sql_log_bin=1 /0 ;    ----如果用户有super权限,可以启用或禁用当前会话的binlog记录
mysql> show master logs;     ---查看master的binlog日志 
mysql> show binary logs;     ---查看master的binlog日志
mysql> show master status;   ---用于提供master二进制日志文件的状态信息
mysql> show slave hosts;     ---显示当前注册的slave的列表。不以--report-host=slave_name选项为开头的slave不会显示在本列表中


3、binglog的查看

通过mysqlbinlog命令可以查看binlog的内容

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
[root@localhost ~] # mysqlbinlog  /home/mysql/binlog/binlog.000003  | more
/*!40019 SET @@session.max_insert_delayed_threads=0*/;
/*!50003 SET @OLD_COMPLETION_TYPE=@@COMPLETION_TYPE,COMPLETION_TYPE=0*/;
DELIMITER /*!*/;
# at 4
#120330 16:51:46 server id 1  end_log_pos 98    Start: binlog v 4, server v 5.0.45-log created 120330 1
6:51:46
# Warning: this binlog was not closed properly. Most probably mysqld crashed writing it.
# at 196
#120330 17:54:15 server id 1  end_log_pos 294   Query   thread_id=3     exec_time=2     error_code=0
SET TIMESTAMP=1333101255/*!*/;
insert into tt7  select  * from tt7/*!*/;
# at 294
#120330 17:54:46 server id 1  end_log_pos 388   Query   thread_id=3     exec_time=28    error_code=0
SET TIMESTAMP=1333101286/*!*/;
alter table tt7 engine=innodb/*!*/;


3.1、解析binlog格式


--位置

位于文件中的位置,“at 196”说明“事件”的起点,是以第196字节开始;“end_log_pos 294”说明以第294字节结束


--时间戳

事件发生的时间戳:“120330 17:54:46”


--事件执行时间

事件执行花费的时间:"exec_time=28"


--错误码

错误码为:“error_code=0”


--服务器的标识

服务器的标识id:“server id 1”



注意:

1、binlog事件中的时间戳是从语句那里继承过来的,一条语句产生多个事件,那这些事件的时间戳都是一样的,而且都是和第一个事件一致的;

2、有时候我们会在binlog中发现执行语句和提交时间不一致的情况,是因为有些事务是自动提交的,在这个事务中只有一条语句执行了一定的时间;


innodb中rowid对binlog的影响:

1、在galera cluster上面最好不要让一个事务更新太多的数据,可以适当控制在1万行以内,都是么有问题的,因为galera cluster的验证和提交都是串行    的,一个事务太大,会导致集群其他事务都等待这个事务完成造成集群假死现象;

2、在innodb中如果没有指定主键,就会创建一个rowid,但是MySQL的binlog是server层,而innodb中的rowid是存储引擎的东西,server层根本感知不到      rowid的存在;

3、rowid是innodb自己定义的一个列,只有在表中没有定义主键的时候,系统才会给这个表加上这一列,但这一列只是为了存储,构成一个聚簇索引,但不    会暴露给逻辑层,并且上层也用不到它,所以直接忽略它即可;

4、在MySQL数据库的使用中,一定要定义主键,如果没有主键,并且是row模式的复制,就必然会造成这样的问题,而不像其他数据库一样,如果没有主键,    还可以使用rowid来操作表;

5、在galera cluster中,更要定义主键。如果没有定义,必然会造成故障,这不是galera cluster的问题,只是它会把这个问题放大而已;














本文转自一个笨小孩51CTO博客,原文链接http://blog.51cto.com/fengfeng688/1951160: ,如需转载请自行联系原作者




相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
10天前
|
存储 安全 关系型数据库
Mysql 的binlog日志的优缺点
MySQL的binlog(二进制日志)是一个记录数据库更改的日志文件,它包含了所有对数据库执行的更改操作,如INSERT、UPDATE和DELETE等。binlog的主要目的是复制和恢复。以下是binlog日志的优缺点: ### 优点: 1. **数据恢复**:当数据库出现意外故障或数据丢失时,可以利用binlog进行点恢复(point-in-time recovery),将数据恢复到某一特定时间点。 2. **主从复制**:binlog是实现MySQL主从复制功能的核心组件。主服务器将binlog中的事件发送到从服务器,从服务器再重放这些事件,从而实现数据的同步。 3. **审计**:b
|
19天前
|
SQL 关系型数据库 MySQL
mysql的binlog恢复数据
mysql的binlog恢复数据
19 0
|
2月前
|
存储 SQL 安全
浅谈MySQL Binlog
浅谈MySQL Binlog
43 0
|
2月前
|
SQL 存储 关系型数据库
解析MySQL Binlog:从零开始的入门指南【binlog入门指南】
解析MySQL Binlog:从零开始的入门指南【binlog入门指南】
873 0
|
2月前
|
监控 关系型数据库 MySQL
MySQL Binlog实战:在生产环境中的应用与最佳实践【实战应用】
MySQL Binlog实战:在生产环境中的应用与最佳实践【实战应用】
35 0
|
2月前
|
SQL 监控 关系型数据库
MySQL Binlog深度解析:进阶应用与实战技巧【进阶应用】
MySQL Binlog深度解析:进阶应用与实战技巧【进阶应用】
42 0
|
2月前
|
存储 SQL 关系型数据库
Mysql专栏 - mysql、innodb存储引擎、binlog的工作流程
Mysql专栏 - mysql、innodb存储引擎、binlog的工作流程
73 0
|
4月前
|
缓存 关系型数据库 MySQL
MySQL Binlog--事务日志和BINLOG落盘参数对磁盘IO的影响
MySQL Binlog--事务日志和BINLOG落盘参数对磁盘IO的影响
44 0
|
3月前
|
关系型数据库 MySQL 数据库
Mysql数据库redo log及binlog的写入
Mysql数据库redo log及binlog的写入
|
5月前
|
关系型数据库 MySQL Shell
如何用shell脚本获取mysql的binlog日志
如何用shell脚本获取mysql的binlog日志
62 1