kubeadm 安装 Kubernetes 1.16.3 (CentOS7+IPVS+Calico)

2019-11-21 12:11:10 kubernetes kubeadm kubeadm install kubernetes kubernetes 1.16.3 calaco ipvs

文章目录

系统环境：

CentOS 版本：7.7
Docker 版本：18.09.9-3
Calico 版本：v3.10
Kubernetes 版本：1.16.3
Kubernetes Newwork 模式：IPVS
Kubernetes Dashboard 版本：dashboard:v2.0.0-beta6

服务器信息：

地址	主机名	内存&CPU	角色
192.168.2.11	k8s-master	2C & 2G	master
192.168.2.12	k8s-node-01	4c & 8G	node
192.168.2.13	k8s-node-02	4c & 8G	node

参考地址：

示例部分配置文件 Github 地址：https://github.com/my-dlq/blog-example/tree/master/kubernetes/kubernetes-deploy-1.16.3

注意事项：

系统内核版本 > 4.0

kubeadm 部署的 Kubernetes 系统组件的证书有效期是一年，在一年内执行任意一次更新集群命令就可与再次刷新证书为一年时间，如果想改成永久，可与网上查找修改 kubeadm 源码方法，手动编译，然后执行创建 kubernetes 集群操作。

一、更新系统软件（全部节点）

由于 Docker 对系统内核有一定的要求，所以我们最好使用 yum 来更新系统软件及其内核。

 1#备份本地 yum 源
 2$ mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo_bak 
 3
 4# 获取阿里 yum 源配置文件
 5$ wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo 
 6
 7#清理 yum
 8$ yum clean all
 9
10#更新软件版本并且更新现有软件
11$ yum -y update

二、基础环境设置（全部节点）

Kubernetes 需要一定的环境来保证正常运行，如各个节点时间同步，主机名称解析，关闭防火墙等等。

1、修改 Host

分布式系统环境中的多主机通信通常基于主机名称进行，这在 IP 地址存在变化的可能性时为主机提供了固定的访问人口，因此一般需要有专用的 DNS 服务负责解析各节点主机。考虑到此处部署的是测试集群，因此为了降低系复杂度，这里将基于 hosts 的文件进行主机名称解析。

1$ vim /etc/hosts

加入下面内容：

1192.168.2.11   k8s-master
2192.168.2.12   k8s-node-01
3192.168.2.13   k8s-node-02

2、修改 Hostname

kubernetes 中会以各个服务的 hostname 为其节点命名，所以需要进入不同的服务器修改 hostname 名称。

 1#修改 192.168.2.11 服务器，设置 hostname，然后将 hostname 写入 hosts
 2$ hostnamectl  set-hostname  k8s-master
 3$ echo "127.0.0.1   $(hostname)" >> /etc/hosts
 4
 5#修改 192.168.2.12 服务器，设置 hostname，然后将 hostname 写入 hosts
 6$ hostnamectl  set-hostname  k8s-node-01
 7$ echo "127.0.0.1   $(hostname)" >> /etc/hosts
 8
 9#修改 192.168.2.13 服务器，设置 hostname，然后将 hostname 写入 hosts
10$ hostnamectl  set-hostname  k8s-node-02
11$ echo "127.0.0.1   $(hostname)" >> /etc/hosts

3、主机时间同步

将各个服务器的时间同步，并设置开机启动同步时间服务。

1$ systemctl start chronyd.service && systemctl enable chronyd.service

4、关闭防火墙服务

关闭防火墙，并禁止开启启动。

1$ systemctl stop firewalld && systemctl disable firewalld

5、关闭并禁用SELinux

关闭SELinux，并编辑 /etc/sysconfig selinux 文件，以彻底禁用 SELinux

1$ setenforce 0
2$ sed -i 's/^SELINUX=enforcing$/SELINUX=disabled/' /etc/selinux/config

查看selinux状态

1$ getenforce

6、禁用 Swap 设备

关闭当前已启用的所有 Swap 设备：

1$ swapoff -a && sysctl -w vm.swappiness=0

编辑 fstab 配置文件，注释掉标识为 Swap 设备的所有行：

1$ vi /etc/fstab
2
3#/dev/mapper/centos-swap swap  swap  defaults  0 0

7、设置内核参数

配置内核参数：

1$ cat <<EOF > /etc/sysctl.d/k8s.conf
2
3net.ipv4.ip_forward = 1
4net.bridge.bridge-nf-call-ip6tables = 1
5net.bridge.bridge-nf-call-iptables = 1
6net.ipv4.tcp_keepalive_time = 600
7net.ipv4.tcp_keepalive_intvl = 30
8net.ipv4.tcp_keepalive_probes = 10
9EOF

使配置生效:

1#挂载 br_netfilter
2$ modprobe br_netfilter
3
4#使配置生效
5$ sysctl -p /etc/sysctl.d/k8s.conf
6
7#查看是否生成相关文件
8$ ls /proc/sys/net/bridge

8、配置 IPVS 模块

由于ipvs已经加入到了内核的主干，所以为kube-proxy开启ipvs的前提需要加载以下的内核模块：

ip_vs
ip_vs_rr
ip_vs_wrr
ip_vs_sh
nf_conntrack_ipv4

 1$ cat > /etc/sysconfig/modules/ipvs.modules <<EOF
 2
 3#!/bin/bash
 4modprobe -- ip_vs
 5modprobe -- ip_vs_rr
 6modprobe -- ip_vs_wrr
 7modprobe -- ip_vs_sh
 8modprobe -- nf_conntrack_ipv4
 9
10EOF

执行脚本并查看是否正常加载内核模块：

1#修改脚本权限
2$ chmod 755 /etc/sysconfig/modules/ipvs.modules 
3
4#执行脚本
5$ bash /etc/sysconfig/modules/ipvs.modules 
6
7#查看是否已经正确加载所需的内核模块
8$ lsmod | grep -e ip_vs -e nf_conntrack_ipv4

安装 ipset 和 ipvsadm

1$ yum install -y ipset ipvsadm

9、配置资源限制

1echo "* soft nofile 65536" >> /etc/security/limits.conf
2echo "* hard nofile 65536" >> /etc/security/limits.conf
3echo "* soft nproc 65536"  >> /etc/security/limits.conf
4echo "* hard nproc 65536"  >> /etc/security/limits.conf
5echo "* soft memlock  unlimited"  >> /etc/security/limits.conf
6echo "* hard memlock  unlimited"  >> /etc/security/limits.conf

10、安装依赖包以及相关工具

1$ yum install -y epel-release
2$ yum install -y yum-utils device-mapper-persistent-data lvm2 net-tools conntrack-tools wget vim ntpdate libseccomp libtool-ltdl

三、安装Docker（全部节点）

1、移除之前安装过的Docker

 1$ sudo yum -y remove docker \
 2                  docker-client \
 3                  docker-client-latest \
 4                  docker-common \
 5                  docker-latest \
 6                  docker-latest-logrotate \
 7                  docker-logrotate \
 8                  docker-selinux \
 9                  docker-engine-selinux \
10                  docker-ce-cli \
11                  docker-engine

查看还有没有存在的 Docker 组件，一定要确保删除干净：

1$ rpm -qa | grep docker

有则通过命令 yum -y remove XXX 来删除，比如：

1$ yum remove docker-ce-cli

2、更换 Docker 的 yum 源

由于官方下载速度比较慢，所以需要更改 Docker 安装的 yum 源，这里推荐用阿里镜像源：

1$ yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo

3、显示 docker 所有可安装版本：

 1$ yum list docker-ce --showduplicates | sort -r
 2
 3docker-ce.x86_64            3:19.03.0-3.el7                     docker-ce-stable
 4docker-ce.x86_64            3:18.09.9-3.el7                     docker-ce-stable
 5docker-ce.x86_64            3:18.09.8-3.el7                     docker-ce-stable
 6docker-ce.x86_64            3:18.09.7-3.el7                     docker-ce-stable
 7docker-ce.x86_64            3:18.09.6-3.el7                     docker-ce-stable
 8docker-ce.x86_64            3:18.09.5-3.el7                     docker-ce-stable
 9docker-ce.x86_64            3:18.09.4-3.el7                     docker-ce-stable
10docker-ce.x86_64            3:18.09.3-3.el7                     docker-ce-stable
11docker-ce.x86_64            3:18.09.2-3.el7                     docker-ce-stable
12docker-ce.x86_64            3:18.09.1-3.el7                     docker-ce-stable
13docker-ce.x86_64            3:18.09.0-3.el7                     docker-ce-stable
14docker-ce.x86_64            18.06.3.ce-3.el7                    docker-ce-stable
15docker-ce.x86_64            18.06.2.ce-3.el7                    docker-ce-stable
16docker-ce.x86_64            18.06.1.ce-3.el7                    docker-ce-stable
17docker-ce.x86_64            18.06.0.ce-3.el7                    docker-ce-stable
18docker-ce.x86_64            18.03.1.ce-1.el7.centos             docker-ce-stable
19docker-ce.x86_64            18.03.0.ce-1.el7.centos             docker-ce-stable
20docker-ce.x86_64            17.12.1.ce-1.el7.centos             docker-ce-stable
21docker-ce.x86_64            17.12.0.ce-1.el7.centos             docker-ce-stable
22docker-ce.x86_64            17.09.1.ce-1.el7.centos             docker-ce-stable
23docker-ce.x86_64            17.09.0.ce-1.el7.centos             docker-ce-stable
24docker-ce.x86_64            17.06.2.ce-1.el7.centos             docker-ce-stable
25docker-ce.x86_64            17.06.1.ce-1.el7.centos             docker-ce-stable
26docker-ce.x86_64            17.06.0.ce-1.el7.centos             docker-ce-stable
27docker-ce.x86_64            17.03.3.ce-1.el7                    docker-ce-stable
28docker-ce.x86_64            17.03.2.ce-1.el7.centos             docker-ce-stable
29docker-ce.x86_64            17.03.1.ce-1.el7.centos             docker-ce-stable
30docker-ce.x86_64            17.03.0.ce-1.el7.centos             docker-ce-stable

4、安装指定版本 docker

注意：安装前一定要提前查询将要安装的 Kubernetes 版本是否和 Docker 版本对应。

1$ yum install -y docker-ce-18.09.9-3.el7

设置镜像存储目录，找到大点的挂载的目录进行存储

1$ vi /lib/systemd/system/docker.service
2
3#找到这行，往后面加上存储目录，例如这里是 --graph /apps/docker
4ExecStart=/usr/bin/docker --graph /apps/docker

5、配置 Docker 参数和镜像加速器

Kubernetes 推荐的一些 Docker 配置参数，这里配置一下。还有就是由于国内访问 Docker 仓库速度很慢，所以国内几家云厂商推出镜像加速下载的代理加速器，这里也需要配置一下。

创建 Docker 配置文件的目录：

1$ mkdir -p /etc/docker

添加配置文件：

 1$ cat > /etc/docker/daemon.json << EOF
 2
 3{
 4  "exec-opts": ["native.cgroupdriver=systemd"],
 5  "registry-mirrors": [
 6  	  "https://dockerhub.azk8s.cn",
 7      "http://hub-mirror.c.163.com",
 8      "https://registry.docker-cn.com"
 9  ],
10  "storage-driver": "overlay2",
11  "storage-opts": [
12    "overlay2.override_kernel_check=true"
13  ],
14  "log-driver": "json-file",
15  "log-opts": {
16    "max-size": "100m",
17    "max-file":"5"
18  }
19}
20
21EOF

6、启动 docker 并设置 docker 开机启动

启动 Docker：

1$ systemctl start docker && systemctl enable docker

如果 Docker 已经启动，则需要重启 Docker：

1$ systemctl daemon-reload && systemctl restart docker

四、安装 kubelet、kubectl、kubeadm（全部节点）

1、配置可用的国内 yum 源

 1$ cat <<EOF > /etc/yum.repos.d/kubernetes.repo
 2
 3[kubernetes]
 4name=Kubernetes
 5baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64/
 6enabled=1
 7gpgcheck=0
 8repo_gpgcheck=0
 9gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg https://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg
10
11EOF

2、安装 kubelet、kubectl、kubeadm

kubelet: 在集群中的每个节点上用来启动 pod 和 container 等。
kubectl: 用来与集群通信的命令行工具。
kubeadm: 用来初始化集群的指令。

注意安装顺序，一定不要先安装 kubeadm，因为 kubeadm 会自动安装最新版本的 kubelet 与 kubectl，导致版本不一致问题。

1#安装 kubelet
2$ yum install -y kubelet-1.16.3-0
3
4#安装 kubectl
5$ yum install -y kubectl-1.16.3-0
6
7#安装 kubeadm
8$ yum install -y kubeadm-1.16.3-0

3、启动 kubelet 并配置开机启动

1$ systemctl start kubelet && systemctl enable kubelet

检查状态时会发现 kubelet 是 failed 状态，等初 master 节点初始化完成后即可显示正常。

五、重启服务器（全部节点）

为了防止发生某些未知错误，这里我们重启下服务器，方便进行后续操作

1$ reboot

六、kubeadm 安装 kubernetes（Master 节点）

创建 kubeadm 配置文件 kubeadm-config.yaml，然后需要配置一些参数：

配置 localAPIEndpoint.advertiseAddress 参数，调整为你的 Master 服务器地址。
配置 imageRepository 参数，调整 kubernetes 镜像下载地址为阿里云。
配置 networking.podSubnet 参数，调整为你要设置的网络范围。

kubeadm-config.yaml

 1$ cat > kubeadm-config.yaml << EOF
 2
 3apiVersion: kubeadm.k8s.io/v1beta2
 4kind: InitConfiguration
 5localAPIEndpoint:
 6  advertiseAddress: 192.168.2.11
 7  bindPort: 6443
 8nodeRegistration:
 9  taints:
10  - effect: PreferNoSchedule
11    key: node-role.kubernetes.io/master
12---
13apiVersion: kubeadm.k8s.io/v1beta2
14kind: ClusterConfiguration
15imageRepository: registry.aliyuncs.com/google_containers
16kubernetesVersion: v1.16.3
17networking:
18  podSubnet: 10.244.0.0/16
19  serviceSubnet: 10.96.0.0/12
20---
21apiVersion: kubeproxy.config.k8s.io/v1alpha1
22kind: KubeProxyConfiguration
23mode: ipvs
24
25EOF

kubeadm 初始化 kubernetes 集群：

1$ kubeadm init --config kubeadm-config.yaml

部署日志信息：

 1......
 2[addons] Applied essential addon: CoreDNS
 3[addons] Applied essential addon: kube-proxy
 4
 5Your Kubernetes control-plane has initialized successfully!
 6
 7To start using your cluster, you need to run the following as a regular user:
 8
 9  mkdir -p $HOME/.kube
10  sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
11  sudo chown $(id -u):$(id -g) $HOME/.kube/config
12
13You should now deploy a pod network to the cluster.
14Run "kubectl apply -f [podnetwork].yaml" with one of the options listed at:
15  https://kubernetes.io/docs/concepts/cluster-administration/addons/
16
17Then you can join any number of worker nodes by running the following on each as root:
18
19kubeadm join 192.168.2.11:6443 --token 4udy8a.f77ai0zun477kx0p \
20    --discovery-token-ca-cert-hash sha256:4645472f24b438e0ecf5964b6dcd64913f68e0f9f7458768cfb96a9ab16b4212

在此处看日志可以知道，可以通过下面命令，添加 kubernetes 相关环境变量：

1$ mkdir -p $HOME/.kube
2$ sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
3$ sudo chown $(id -u):$(id -g) $HOME/.kube/config

七、工作节点加入集群（Work Node 节点）

根据上面 Master 节点创建 Kubernetes 集群时的日志信息，可以知道在各个节点上执行下面命令来让工作节点加入主节点：

1$ kubeadm join 192.168.2.11:6443 --token 4udy8a.f77ai0zun477kx0p \
2    --discovery-token-ca-cert-hash sha256:4645472f24b438e0ecf5964b6dcd64913f68e0f9f7458768cfb96a9ab16b4212

如果上面 token 过期，则可以通过 kubeadm token create --print-join-command 命令重新获取加入集群的指令。

八、部署网络插件（Master 节点）

Kubernetes 中可以部署很多种网络插件，不过比较流行也推荐的有两种：

Flannel： Flannel 是基于 Overlay 网络模型的网络插件，能够方便部署，一般部署后只要不出问题，一般不需要管它。
Calico： 与 Flannel 不同，Calico 是一个三层的数据中心网络方案，使用 BGP 路由协议在主机之间路由数据包，可以灵活配置网络策略。

这两种网络根据环境任选其一即可，这里使用的是 Calico，可以按下面步骤部署：

1、部署 Calico 网络插件

下载 Calico 部署文件，并替换里面的网络范围为上面 kubeadm 中 networking.podSubnet 配置的值。

1#下载 calico 部署文件
2$ wget https://docs.projectcalico.org/v3.10/getting-started/kubernetes/installation/hosted/kubernetes-datastore/calico-networking/1.7/calico.yaml 
3
4#替换 calico 部署文件的 IP 为 kubeadm 中的 networking.podSubnet 参数 10.244.0.0。
5$ sed -i 's/192.168.0.0/10.244.0.0/g' calico.yaml
6
7#部署 Calico 插件
8$ kubectl apply -f calico.yaml

2、查看 Pod 是否成功启动

 1$ kubectl get pod -n kube-system
 2
 3NAME                                       READY   STATUS    RESTARTS   AGE
 4calico-kube-controllers-6b64bcd855-jn8pz   1/1     Running   0          2m40s
 5calico-node-5wssd                          1/1     Running   0          2m40s
 6calico-node-7tw94                          1/1     Running   0          2m40s
 7calico-node-xzfp4                          1/1     Running   0          2m40s
 8coredns-58cc8c89f4-hv4fn                   1/1     Running   0          21m
 9coredns-58cc8c89f4-k97x6                   1/1     Running   0          21m
10etcd-k8s-master                            1/1     Running   0          20m
11kube-apiserver-k8s-master                  1/1     Running   0          20m
12kube-controller-manager-k8s-master         1/1     Running   0          20m
13kube-proxy-9dlpz                           1/1     Running   0          14m
14kube-proxy-krd5n                           1/1     Running   0          14m
15kube-proxy-tntpr                           1/1     Running   0          21m
16kube-scheduler-k8s-master                  1/1     Running   0          20m

可以看到所以 Pod 都已经成功启动。

九、修正 kubelet 无法读取资源错误

CentOS 系统上安装 Kubernetes 后 kubelet 组件会一直报 failed to get cgroup stats for "/system.slice/docker.service" 错误，而引起该问题的原因是 kubelet 启动时，会执行节点资源统计，需要 systemd 中开启对应的选项，如下：

CPUAccounting：是否开启该 unit 的 CPU 使用统计，bool 类型，可配置 true 或者 false。
MemoryAccounting：是否开启该 unit 的 Memory 使用统计，bool 类型，可配置 true 或者 false。

如果不设置这两项，kubelet 是无法执行该统计命令，导致 kubelet 一致报错误上面错误信息。所以需要修改 systemd 里面的 kubelet 服务配置，操作如下：

编辑 /usr/lib/systemd/system/kubelet.service.d/10-kubeadm.conf 文件，并添加下面配置：

 1$ vi /usr/lib/systemd/system/kubelet.service.d/10-kubeadm.conf
 2
 3[Service]
 4CPUAccounting=true              ## 添加 CPUAccounting=true 选项，开启 systemd CPU 统计功能
 5MemoryAccounting=true           ## 添加 MemoryAccounting=true 选项，开启 systemd Memory 统计功能
 6Environment="KUBELET_KUBECONFIG_ARGS=--bootstrap-kubeconfig=/etc/kubernetes/bootstrap-kubelet.conf --kubeconfig=/etc/kubernetes/kubelet.conf"
 7Environment="KUBELET_CONFIG_ARGS=--config=/var/lib/kubelet/config.yaml"
 8EnvironmentFile=-/var/lib/kubelet/kubeadm-flags.env
 9EnvironmentFile=-/etc/sysconfig/kubelet
10ExecStart=
11ExecStart=/usr/bin/kubelet $KUBELET_KUBECONFIG_ARGS $KUBELET_CONFIG_ARGS $KUBELET_KUBEADM_ARGS $KUBELET_EXTRA_ARGS

十、配置 Kubectl 命令自动补全（Master 节点）

安装补全工具：

1$ yum install -y bash-completion

添加补全配置：

1$ source /usr/share/bash-completion/bash_completion
2$ source <(kubectl completion bash)
3$ echo "source <(kubectl completion bash)" >> ~/.bashrc

添加完成就可以通过输入 kubectl 后，按补全键（一般为 tab）会自动补全对应的命令。

十一、查看是否开启 IPVS（Master 节点）

上面全部组件都已经部署完成，不过还需要确认是否成功将网络模式设置为 IPVS，可以查看 kube-proxy 日志，在日志信息中查找是否存在 IPVS 关键字信息来确认。

1$ kubectl get pod -n kube-system | grep kube-proxy
2
3kube-proxy-9dlpz                           1/1     Running   0          42m
4kube-proxy-krd5n                           1/1     Running   0          42m
5kube-proxy-tntpr                           1/1     Running   0          49m

选择其中一个 Pod ，查看该 Pod 中的日志信息中是否存在 ipvs 信息：

 1$ kubectl logs kube-proxy-9dlpz -n kube-system
 2
 3I1120 18:13:46.357178       1 node.go:135] Successfully retrieved node IP: 192.168.2.13
 4I1120 18:13:46.357265       1 server_others.go:176] Using ipvs Proxier.
 5W1120 18:13:46.358005       1 proxier.go:420] IPVS scheduler not specified, use rr by default
 6I1120 18:13:46.358919       1 server.go:529] Version: v1.16.3
 7I1120 18:13:46.359327       1 conntrack.go:100] Set sysctl 'net/netfilter/nf_conntrack_max' to 131072
 8I1120 18:13:46.359379       1 conntrack.go:52] Setting nf_conntrack_max to 131072
 9I1120 18:13:46.359426       1 conntrack.go:100] Set sysctl 'net/netfilter/nf_conntrack_tcp_timeout_established' to 86400
10I1120 18:13:46.359452       1 conntrack.go:100] Set sysctl 'net/netfilter/nf_conntrack_tcp_timeout_close_wait' to 3600
11I1120 18:13:46.359626       1 config.go:313] Starting service config controller
12I1120 18:13:46.359685       1 shared_informer.go:197] Waiting for caches to sync for service config
13I1120 18:13:46.359833       1 config.go:131] Starting endpoints config controller
14I1120 18:13:46.359889       1 shared_informer.go:197] Waiting for caches to sync for endpoints config
15I1120 18:13:46.460013       1 shared_informer.go:204] Caches are synced for service config 
16I1120 18:13:46.460062       1 shared_informer.go:204] Caches are synced for endpoints config

如上，在日志中查到了 IPVS 字样，则代表使用了 IPVS 模式。

十二、部署 Kubernetes Dashboard

接下来我们将部署 Kubernetes 的控制看板，由于集群为 1.16.3，所以我们直接使用 Kubernetes Dashboard 2.0.0 版本，虽然为测试版本，不过它比较新，对新版本的兼容还是比旧版本好些，坐等它稳定，这里先部署尝尝鲜。

由于 Dashboard 部署流程也比较多，所以写在另一篇博文中，可以参考 Kubernetes 部署 Kubernetes-Dashboard v2.0.0

当 Kubernetes Dashboard 部署好了后，输入 Kubernetes 集群任意节点地址配置上面配置的 Service 的 NodePort 30001 来访问看板。输入地址 https://192.168.2.11:30001 进入看板页面，输入上面获取的 Token 串进行验证登录。

提醒一下，由于谷歌浏览器访问自签名证书的网址时，可能会被拒绝访问，所以，这里推荐最好使用火狐浏览器访问。

---END---