背景
今天通过kibana查看错误日志时发现有域名解析超时情况,不应该啊,明明已经启用了dnsmasq,并且服务调用量也不大,为啥会报错呢?继续观察发现服务只有这一台机器存在域名解析超时,其他机器都没问题。紧接着使用tcpdump抓包机器的dnsmasq也是工作正常没发现什么问题,对比下这台机器的的resolv.conf文件与正常机器的resov.conf
问题机器
|
|
正常机器
|
|
剖析
相比下问题机器resolv配置少了几个nameserver,直觉告诉我们问题就出在这里,那么为什么只有一个dnsserver会引发超时呢?先说说resolv.conf的dns的配置
|
|
由此我们明白了,正常机器会在轮训server1,server2,server3,等于最大可以查询3次。问题机器由于只配置了一个nameserver,所以只查询一次。
找到了问题我们增加域名解析重试次数即可,对于问题机器将attempts
调整为3后问题解决
小插曲
在修改/etc/resolv.conf
时报错无写权限,然后chmod 744 resolv.conf
报错chmod: changing permissions of /etc/resolv.conf': Operation not permitted
可当前我使用的已经是root用户,依旧没有修改权限,为什么?
网上查询资料后发现原来是文件权限有猫腻
|
|