centos7使用kubeadm安装k8s集群

实验环境说明

实验架构

1
2
3
lab1: master 11.11.11.111
lab2: node 11.11.11.112
lab3: node 11.11.11.113

实验使用的Vagrantfile

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
# -*- mode: ruby -*-
# vi: set ft=ruby :

ENV["LC_ALL"] = "en_US.UTF-8"

Vagrant.configure("2") do |config|
(1..3).each do |i|
config.vm.define "lab#{i}" do |node|
node.vm.box = "centos-7.4-docker-17"
node.ssh.insert_key = false
node.vm.hostname = "lab#{i}"
node.vm.network "private_network", ip: "11.11.11.11#{i}"
node.vm.provision "shell",
inline: "echo hello from node #{i}"
node.vm.provider "virtualbox" do |v|
v.cpus = 2
v.customize ["modifyvm", :id, "--name", "lab#{i}", "--memory", "2048"]
end
end
end
end

安装要求

  • 需要在每个节点上先安装好kubeadm
  • 有每个节点配置好hosts解析
    1
    2
    3
    4
    5
    cat >>/etc/hosts<<EOF
    11.11.11.111 lab1
    11.11.11.112 lab2
    11.11.11.113 lab3
    EOF

安装配置master节点

说明

由于kubeadm默认会去拉取gcr.io上的镜像来启动master相关的组件,由于在国内无法访问gcr.io所以会导致无法成功启动。有如下几种解决办法:

  • 在能翻墙的机器上拉取镜像,再打包导入到master机器上(docker save/load)
  • 直接拉国内别人的镜像,然后打tag为gcr.io的镜像
  • 启动配置集群的时候指定镜像相关配置,使用阿里镜像(本次实验采用)

初始化

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
cat >kubeadm-master.config<<EOF
apiVersion: kubeadm.k8s.io/v1alpha1
kind: MasterConfiguration
kubernetesVersion: v1.10.7
imageRepository: registry.cn-hangzhou.aliyuncs.com/google_containers
etcd:
image: registry.cn-hangzhou.aliyuncs.com/google_containers/etcd-amd64:3.1.12
api:
advertiseAddress: 11.11.11.111

controllerManagerExtraArgs:
node-monitor-grace-period: 10s
pod-eviction-timeout: 10s

networking:
podSubnet: 10.244.0.0/16
EOF

# 配置kubelet使用国内可用pause镜像
# 修改/etc/systemd/system/kubelet.service.d/10-kubeadm.conf
# 添加如下配置
sed -i '/ExecStart=$/i Environment="KUBELET_EXTRA_ARGS=--pod-infra-container-image=registry.cn-shanghai.aliyuncs.com/gcr-k8s/pause-amd64:3.0"' /etc/systemd/system/kubelet.service.d/10-kubeadm.conf

# 重新载入配置
systemctl daemon-reload

# 设置kubelet开机启动
systemctl enable kubelet

# 使用配置文件方式
kubeadm init --config kubeadm-master.config

没有经过测试的另一种初始化方法

1
2
3
4
5
# 使用命令行方式
KUBE_REPO_PREFIX='registry.cn-hangzhou.aliyuncs.com/google_containers' kubeadm init \
--kubernetes-version=v1.10.3 \
--pod-network-cidr=10.244.0.0/16 \
--apiserver-advertise-address=11.11.11.111

配置kubectl使用

1
2
3
4
5
6
7
8
9
10
11
12
rm -rf $HOME/.kube
mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config

# 查看node节点
kubectl get nodes

# 只有网络插件也安装配置完成之后,才能会显示为ready状态
# 设置master允许部署应用pod,参与工作负载,现在可以部署其他系统组件
# 如 dashboard, heapster, efk等
kubectl taint nodes --all node-role.kubernetes.io/master-

配置使用网络插件

配置使用flannel

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
# 下载配置
mkdir flannel && cd flannel
wget https://raw.githubusercontent.com/coreos/flannel/master/Documentation/kube-flannel.yml

# 修改配置
# 此处的ip配置要与上面kubeadm的pod-network一致
net-conf.json: |
{
"Network": "10.244.0.0/16",
"Backend": {
"Type": "vxlan"
}
}

# 修改镜像
image: registry.cn-shanghai.aliyuncs.com/gcr-k8s/flannel:v0.10.0-amd64

# 如果Node有多个网卡的话,参考flannel issues 39701,
# https://github.com/kubernetes/kubernetes/issues/39701
# 目前需要在kube-flannel.yml中使用--iface参数指定集群主机内网网卡的名称,
# 否则可能会出现dns无法解析。容器无法通信的情况,需要将kube-flannel.yml下载到本地,
# flanneld启动参数加上--iface=<iface-name>
containers:
- name: kube-flannel
image: registry.cn-shanghai.aliyuncs.com/gcr-k8s/flannel:v0.10.0-amd64
command:
- /opt/bin/flanneld
args:
- --ip-masq
- --kube-subnet-mgr
- --iface=eth1

# 启动
kubectl apply -f kube-flannel.yml

# 查看
kubectl get pods --namespace kube-system
kubectl get svc --namespace kube-system

安装配置node节点

配置

1
2
3
4
5
6
7
8
9
10
# 配置kubelet使用国内可用pause镜像
# 修改/etc/systemd/system/kubelet.service.d/10-kubeadm.conf
# 添加如下配置
sed -i '/ExecStart=$/i Environment="KUBELET_EXTRA_ARGS=--pod-infra-container-image=registry.cn-shanghai.aliyuncs.com/gcr-k8s/pause-amd64:3.0"' /etc/systemd/system/kubelet.service.d/10-kubeadm.conf

# 重新载入配置
systemctl daemon-reload

# 设置kubelet开机启动
systemctl enable kubelet

加入集群

1
2
# 此命令为启动master成功后返回的结果
kubeadm join --token 55a6f8.1091208463fe1252 11.11.11.111:6443 --discovery-token-ca-cert-hash sha256:790c6b38b087b167c1f52c04526d8729115192a305eb91c01c0fd8dc7facbbcd

测试容器间的通信和DNS

配置好calico网络之后,kubeadm会自动部署kube-dns

启动

1
2
3
kubectl run nginx --replicas=2 --image=nginx:alpine --port=80
kubectl expose deployment nginx --type=NodePort --name=example-service-nodeport
kubectl expose deployment nginx --name=example-service

查看状态

1
2
3
4
kubectl get deploy
kubectl get pods
kubectl get svc
kubectl describe svc example-service

DNS解析

1
2
3
4
kubectl run curl --image=radial/busyboxplus:curl -i --tty
nslookup kubernetes
nslookup example-service
curl example-service

访问测试

1
2
3
4
5
6
# 10.96.59.56 为查看svc时获取到的clusterip
curl "10.96.59.56:80"

# 32223 为查看svc时获取到的 nodeport
http://11.11.11.112:32223/
http://11.11.11.113:32223/

清理删除

1
2
kubectl delete svc example-service example-service-nodeport
kubectl delete deploy nginx curl

挖坑记

1. 如果删除kube-dns后怎么修复

1
2
3
4
5
6
# 第一种方法
kubeadm upgrade apply v1.10.3 --config kubeadm-master.config

# 第二种方法
kubeadm config upload from-file --config kubeadm-master.config
kubeadm upgrade apply v1.10.3

2. 忘记初始master节点时的node节点加入集群命令怎么办

1
2
3
4
5
6
# 简单方法
kubeadm token create --print-join-command

# 第二种方法
token=$(kubeadm token generate)
kubeadm token create $token --print-join-command --ttl=0

参考文档