《DNS与BIND（第5版）》——4.8 运行一个slave名称服务器-阿里云开发者社区

本节书摘来自异步社区《DNS与BIND（第5版）》一书中的第4章，第4.8节,作者：【美】Joseph Davies 更多章节内容可以访问云栖社区“异步社区”公众号查看。

4.8 运行一个slave名称服务器

为增强健壮性，需要再建立一个名称服务器。可以（并且最终可能会）为区域建立两个以上的权威名称服务器。当然两个名称服务器是最低要求了。如果只有一个名称服务器而它又宕机了，那么就没有人可以查询域名了。第二个名称服务器可以分担第一个名称服务器的负载，或在第一个名称服务器宕机时承担全部工作。可以再建立一个primary名称服务器，但本书不推荐这样做。本书推荐再建立一个slave名称服务器。如果决定耗费额外的精力去运行多个primary名称服务器，也可以随时将slave名称服务器改成primary名称服务器。

服务器是如何知道它是某个区域的primary还是slave呢？named.conf文件会告诉名称服务器它是某个区域的primary名称服务器还是slave名称服务器。NS记录并不会告知哪个服务器是区域的primary以及哪些服务器是区域的slave；它们只会告知这些服务器是谁。（总的来说，DNS并不在乎名称服务器是primary还是slave；对于实际的名称解析而言，slave服务器与primary服务器并无区别。）

那么primary名称服务器和slave名称服务器之间到底有何区别呢？最关键的区别在于服务器从哪里获取数据的。primary名称服务器是从区域数据文件中读取数据的。而slave名称服务器则是通过网络从其他名称服务器那里加载数据的。这个过程被称作区域传输（zone transfer）。

slave名称服务器不仅可以通过primary名称服务器加载区域数据，还能通过其他的slave名称服务器加载区域数据。

slave名称服务器的最大好处在于：对于一个区域只需维护一份区域数据文件，也就是primary名称服务器上的那份文件。不用担心这些名称服务器之间的文件同步问题；slave名称服务器会做好这些事情。需要注意的是，slave名称服务器的再同步（resynchronize）并不是实时的：它会以轮询（poll）的方式来查看区域数据是否是最新的。决定轮询间隔时间的是SOA记录中的一个还没有解释过的数字。（BIND 8和BIND 9支持一种加速区域数据分发的机制，本书在后面会讨论到。）

slave名称服务器并不需要从网络上获得所有的区域数据文件。像db.cache和db.127.0.0这两个系统必备的文件，在slave和primary上是一样的，因此只要在slave名称服务器上保存一份本地副本即可。这意味着slave名称服务器其实是0.0.127.in-addr的primary。当然也可以将它设置为0.0.127.in-addr的slave，但该区域的数据永远不会改变；它就像primary一样。

4.8.1 建立
为了建立slave名称服务器，需要在运行slave名称服务器的主机上为区域数据文件创建一个目录（例如，/var/named），并将文件/etc/named.conf、db.cache和db.127.0.0复制过去：

https://yqfile.alicdn.com/5dbb30131df2441548b3c9df98e5baca02ce73d4.png" >

必须修改slave名称服务器上的/etc/named.conf文件。将每个出现的master都改为slave（0.0.127.in-addr.arpa区域除外）。并且添加带有primary名称服务器IP地址的masters行。

如果原先的配置文件中有如下所示的行：

https://yqfile.alicdn.com/854616a6780e86a53aa85f5bf795c593e34a2042.png" >

那么修改过后会变成下面这个样子：

https://yqfile.alicdn.com/0c5512580084f8f0f93954f204556776ab5df991.png" >

这会告诉名称服务器，它是区域movie.edu的slave，并且应该追踪名称服务器192.249.249.3上所保存的该区域的版本。slave名称服务器会在本地文件bak.movie.edu上保留该区域的一个备份。

对于电影大学而言，在wormhole.movie.edu上建立了其slave名称服务器。回忆一下toystory.movie.edu（primary名称服务器）上的配置文件，看起来就像这样：

https://yqfile.alicdn.com/cebbe36991d45f6ab0cfc00501834b1954ac4a81.png" >

将/etc/named.conf、db.cache以及db.127.0.0复制到wormhole.movie.edu上，并像先前描述的那样来编辑配置文件。现在wormhole.movie.edu上的配置文件看起来就像这样：

912066433af1bf62207b9024267f315444348709

这将导致wormhole.movie.edu上的名称服务器通过网络，从位于192.249.249.3（toystory.movie.edu）上的名称服务器那里加载movie.edu、249.249.192.in-addr.arpa以及253.253.192.in-addr.arpa。它也会将这些文件备份到/var/named目录下。你可能会发现把这些区域数据文件的备份独立放到一个子目录中会更加方便。在给备份文件命名时加入了像bak这样唯一的前缀，因为在极少数情况下，可能必须得手工删除所有的备份文件。这样做还有一个好处，就是能够让人一眼就发现它们是区域数据文件的备份，这样就不会误编辑它们了。稍后会进一步介绍备份文件。

现在启动slave名称服务器。就像启动primary名称服务器时那样检查syslog文件中的错误消息。同primary名称服务器一样，启动slave名称服务器的命令也是：

eb70d4e233cf1a859a45f17c2cb12091b81a4719

与primary名称服务器不同的是，对于slave名称服务器而言，还得检查它是否创建了备份文件。在启动wormhole.movie.edu上的slave名称服务器之后不久，就应该会看到bak.movie.edu、bak.192.249.249以及bak.192.253.253出现在/var/named目录下。这就意味着slave名称服务器已经成功地从primary名称服务器上加载了这些区域，并保存了一份备份副本。

要完成slave名称服务器的建立工作，还得尝试查找一下原先在primary名称服务器启动后查找过的那些域名。这次必须在运行slave名称服务器的主机上运行nslookup程序，以保证所查询的是slave名称服务器。如果slave名称服务器运行正常，就在系统的启动文件中添加相应的行，以便slave名称服务器能够随着系统一同启动，并将hostname(1)设置成一个域名。

4.8.2 备份文件
slave名称服务器并未被要求保存区域数据的备份副本。如果有备份副本的话，则slave服务器就会在启动时读取它，并且随后再检查master服务器上是否有更新的副本，而不是一开始就从master服务器上加载一个新的副本。如果primary名称服务器有了较新的副本，那么slave名称服务器就会将其下载并保存在备份文件中。

为什么要保存一个备份副本呢？设想一下，在slave名称服务器启动时，primary名称服务器宕机了。则slave将无法进行区域传输，并且在master服务器恢复前，它也无法作为这个区域的名称服务器来提供服务。有了备份后，slave名称服务器就有了区域数据，尽管可能有些过时。由于slave不再需要master服务器始终处于运行状态，所以这种设置更加健壮。

如果不想要备份副本的话，就移除配置文件中的file行。然而，本书还是推荐将所有slave名称服务器都配置成保存备份副本。保存区域数据文件的备份只需花费很小的代价，可一旦遇到非常需要备份文件却没有的时候，就要付出沉重的代价了。

4.8.3 SOA值
还记得下面的SOA记录吗？

2283b08f89cfd55e0eae6bba3351b95f71a8d7aa

本书还没有解释括号中间的这些数值都是做什么用的。

区域中的所有数据都会用到序号（serial number）。这里选择“1”这个逻辑上的起点来作为起始序号。但是很多人发现使用日期作为序号会更有用，就像2005012301。这个日期的格式是YYYYMMDDNN，YYYY代表年份，MM代表月份，DD代表天，而NN则代表当日区域数据被修改的次数。这个字段只有在这种排序下才起作用，因为没有其他的排序能总是随着时间的改变而增加。无论选用何种格式，在更新了区域数据后，都不要忘记增加序号的值，这很重要。

当slave名称服务器联系其master服务器以获取区域数据时，会首先请求相关数据的序号。如果slave中该区域的序号比master服务器的小，就表示slave的区域数据过时了。在这种情况下，slave就会下载一份新的区域数据副本。如果slave名称服务器启动时没有可读取的备份文件，它总是会从其master服务器那儿加载区域数据。正如所猜想的那样，当修改primary上的区域数据文件时，必须增加序号值。关于如何更新区域数据文件的问题，本书将在第7章中予以介绍。

接下来的4个字段指定了四种时间间隔，默认单位是秒。

refresh（更新）

更新间隔时间（refresh interval）用来告知区域的slave名称服务器，间隔多长时间检查一次区域的数据是否有更新。需要注意的是，这个功能会对系统负载造成影响，slave名称服务器每隔一个更新间隔时间就对每个区域进行一次SOA查询。这里所选的数值是3小时，这属于相当快的频率了。大多数用户在等待他们的新工作站变得可用之前，可以容忍半个工作日的延迟，以便让区域数据扩散开来。如果站点提供的是24小时服务，那么应该考虑将这个值提高到8小时。如果区域数据并不经常改变，或者所有的slave名称服务器散布得很远（就像root名称服务器那样），那么可以考虑将这个值设置得更长一些，比如24小时。

retry（重试）

如果slave名称服务器在更新间隔时间到来后无法访问其master名称服务器（主机可能宕机了），它就会开始每隔一个重试间隔时间（retry interval）就尝试重新连接一次。通常重试间隔时间会比更新间隔时间短，但这不是必须的。

expire（过期）

如果slave名称服务器在过期时间到来时仍无法联系到其master名称服务器，则slave就会使该区域失效。使一个区域失效意味着slave将不再回答对于该区域的查询，因为该区域的数据已经过于陈旧而不能使用了。本质上，这个字段的意义在于：在某个时刻，数据变得太陈旧了，与其提供陈旧的数据还不如不提供的好。通常过期时间会以周为单位，如果在访问更新源时频繁出现问题，可以将该时间设得长一些，例如1个月。过期时间总是远远长于更新间隔时间和重试间隔时间。如果过期时间比更新间隔时间小，那么slave名称服务器会在尝试加载新的数据前就使该区域失效。

negative caching TTL（否定缓存TTL）

TTL代表着生存时间（time to live）。这个值适用于所有来自该区域权威名称服务器的否定响应。

提示

在BIND 8.2之前的版本中，SOA记录中的最后一个字段既是区域的默认生存时间，也是该区域的否定缓存生存时间。
看过本书早期版本的读者可能会注意到，SOA记录的数字字段所使用的格式发生了改变。从前，BIND只允许以秒为单位来设定前面介绍的四个字段。（因此，所有那一代的管理员都知道一周有608 400秒。）现在，除了最老的BIND名称服务器（BIND ），其他的BIND名称服务器都允许使用秒以外的单位来设定这四个字段的数值，以及作为TTL控制语句的参数，就像本章前面所展示的那样。例如，可以指定用3h、180m，甚至是2h60m来指定3个小时的更新间隔时间。还可以用d代表天，用w代表周。

SOA记录的最佳设定值完全取决于站点的需要。一般来说，较长的时间可以降低名称服务器的负载，但是会增加变动的传播时间；较短的时间会增加名称服务器的负载，但是可以缩短变动的传播时间。本书中所使用的数值对于大多数站点都是合适的。RFC 1537建议顶级名称服务器采用如下数值：

034fce47bb2a600e8d3850556503ba562bd17a8c

有一个功能的实现应该要了解下。对于早期版本（之前的版本）的BIND，slave名称服务器在加载区域时会停止响应查询。因此，新版的BIND被修改为将加载区域的时间分散开来，以缩短不能响应查询的时间。所以，即使设置了一个很短的更新间隔时间，slave名称服务器也可能无法按照所要求的时间来进行检查。BIND会尝试加载一定数量的区域数据，然后等待15分钟以后，再加载下一批。

现在已经介绍了slave名称服务器是如何保持其数据是最新的，BIND 8和BIND 9还改变了区域数据的传播方式！轮询功能依然存在，但BIND 8和BIND 9还增加了当区域数据变动时发出通知的功能。如果primary名称服务器和slave名称服务器运行的都是BIND 8或者BIND 9，那么primary会在区域数据发生变动后15分钟内，通知slave加载新的区域数据。该通知会导致slave名称服务器缩短更新间隔时间，并试图立即加载区域数据。本书会在第10章中进一步介绍。

4.8.4 多个master服务器
还有其他方法能让slave名称服务器的配置变得更加健壮吗？答案是肯定的，可以最多指定10个master服务器的IP地址。在配置文件中，把这些地址添加到第一个IP地址之后，并用分号隔开：

d97fcd4a25b499b2f7f138c0533e6a3f2aa55e7d

在BIND 9.3及其后续版本中，可以为master服务器的IP地址列表指定一个名称，然后引用这个名称。这样就不用为每个区域重复列出这些IP地址了。下面是一个例子：

https://yqfile.alicdn.com/f983a6bd91a65fe6f1938a6a56e801779b1841aa.png" >

slave名称服务器会按照列表中IP地址的排列顺序，来依次查询每个master服务器，直到其得到答复。一直到BIND ，slave名称服务器都是选择第一个响应的、拥有较高序号的master名称服务器来进行区域传输。只有在前面的master名称服务器无响应时，slave才会尝试查询随后的master。然而，从BIND 8.2开始，slave名称服务器实际上会查询列出的每个master名称服务器，并选择拥有最高序号的master来进行区域传输。如果有多个master服务器都拥有最高的序号，那么slave名称服务器就会选择列在最前面的那个来进行区域传输。

这个功能的初衷是，如果运行区域的primary名称服务器的主机是多宿主主机的话，那么就能够列出其所有的IP地址了。然而，因为无法判断所联系的名称服务器是primary还是slave，所以如果对设置有帮助的话，就可以列出该区域所有运行slave名称服务器的主机的IP地址。这样一来，如果第一个master名称服务器宕机或者不可达的话，slave名称服务器还能通过另一个master名称服务器传输区域数据。

《DNS与BIND（第5版）》——4.8 运行一个slave名称服务器

4.8 运行一个slave名称服务器

DNS软件服务

热门文章

最新文章

相关产品

相关课程

相关电子书

相关实验场景

推荐镜像