Kubernetes故障篇:calico/node is not ready: BIRD is not ready

一、问题产生

1. k8s集群部署后发现calico的pod未通过健康检查,如下所示:

1
kubectl get pods -A -o wide

https://github.com/zznn-cloud/zznn-cloud-blog-images/raw/main/Qexo/24/10/image_2b399502c98fb452733a85c290d601ab.png

可以看到 k8s-mater节点未Ready,会导致主节点访问node显示拒接连接。即: curl 10.0.169.144 显示为拒绝连接

https://github.com/zznn-cloud/zznn-cloud-blog-images/raw/main/Qexo/24/10/image_7fa73e77464fec1d997cab51be0238e7.png

2. 通过命令kubectl describe pods calico-node-8lb6j -n kube-system,查看其中一个pod信息,如下所示:

1
kubectl describe pods calico-node-8lb6j -n kube-system

二、解决方法

解决方案:调整calicao网络插件的网卡发现机制,修改IP_AUTODETECTION_METHOD对应的value值。官方提供的yaml文件中,ip识别策略(IPDETECTMETHOD)没有配置,即默认为first-found,这会导致一个网络异常的ip作为nodeIP被注册,从而影响node-to-node mesh。我们可以修改成can-reach或者interface的策略,尝试连接某一个Ready的node的IP,以此选择出正确的IP。

操作如下:

2.1 查看本机网卡信息

https://github.com/zznn-cloud/zznn-cloud-blog-images/raw/main/Qexo/24/10/image_913079859149ed1f89a5f279143d64c7.png

2.2 修改 calico.yaml文件

1
2
3
# 修改calico的yaml文件,添加配置项
vim calico.yaml

1
2
3
4
5
6
7
8
9
10
11
12
13
# Cluster type to identify the deployment type
- name: IP_AUTODETECTION_METHOD #增加内容
value: "interface=ens*" 或者 value: "interface=ens33" #增加内容
# 下面内容是calico.yaml里默认的不修改
- name: CLUSTER_TYPE
value: "k8s,bgp"
# Auto-detect the BGP IP address.
- name: IP
value: "autodetect"
# Enable IPIP
- name: CALICO_IPV4POOL_IPIP
value: "Always"

2.3 重新在master节点上部署

1
kubectl apply -f calico.yaml

2.4 查看结果

1
kubectl get pods -n kube-system
1
curl 10.0.169.144

https://github.com/zznn-cloud/zznn-cloud-blog-images/raw/main/Qexo/24/10/image_5d67420b148ec11c154d7579f918d7e5.png

本文转载自:Kubernetes故障篇:calico/node is not ready: BIRD is not ready - CoderTL - 博客园 (cnblogs.com)