# K8s 零宕机服务发布 - 探针
# 1. Pod 状态及 Pod 故障排查命令
状态 | 说明 |
---|
Pending(挂起) | Pod 已被 Kubernetes 系统接收,但仍有一个或多个容器未被创建,可以通过 kubectl describe 查看处于 Pending 状态的原因 |
Running(运行中) | Pod 已经被绑定到一个节点上,并且所有的容器都已经被创建,而且至少有一个是运行状态,或者是正在启动或者重启,可以通过 kubectl logs 查看 Pod 的日志 |
Succeeded(成功) | 所有容器执行成功并终止,并且不会再次重启,可以通过 kubectl logs 查看 Pod 日志 |
Failed(失败) | 所有容器都已终止,并且至少有一个容器以失败的方式终止,也就是说这个容器要么以非零状态退出,要么被系统终止,可以通过 logs 和 describe 查看 Pod 日志和状态 |
Unknown(未知) | 通常是由于通信问题造成的无法获得 Pod 的状态 |
ImagePullBackOff ErrImagePull | 镜像拉取失败,一般是由于镜像不存在、网络不通或者需要登录认证引起的,可以使用 describe 命令查看具体原因 |
CrashLoopBackOff | 容器启动失败,可以通过 logs 命令查看具体原因,一般为启动命令不正确,健康检查不通过等 |
OOMKilled | 容器内存溢出,一般是容器的内存 Limit 设置的过小,或者程序本身有内存溢出,可以通过 logs 查看程序启动日志 |
Terminating | Pod 正在被删除,可以通过 describe 查看状态 |
SysctlForbidden | Pod 自定义了内核配置,但 kubelet 没有添加内核配置或配置的内核参数不支持,可以通过 describe 查看具体原因 |
Completed | 容器内部主进程退出,一般计划任务执行结束会显示该状态,此时可以通过 logs 查看容器日志 |
ContainerCreating | Pod 正在创建,一般为正在下载镜像,或者有配置不当的地方,可以通过 describe 查看具体原因 |
# 2. Pod 镜像拉取策略
通过 spec.containers [].imagePullPolicy 参数可以指定镜像的拉取策略,目前支持的策略如下:
操作方式 | 说明 |
---|
Always | 总是拉取,当镜像 tag 为 latest 时,且 imagePullPolicy 未配置,默认为 Always |
Never | 不管是否存在都不会拉取 |
IfNotPresent | 镜像不存在时拉取镜像,如果 tag 为非 latest,且 imagePullPolicy 未配置,默认为 IfNotPresent |
更改镜像拉取策略为 IfNotPresent:
| apiVersion: apps/v1 |
| kind: Deployment |
| metadata: |
| name: nginx-deploy |
| labels: |
| app: nginx-deploy |
| annotations: |
| app: nginx-deploy |
| namespace: default |
| spec: |
| selector: |
| matchLabels: |
| app: nginx-deploy |
| replicas: 3 |
| template: |
| metadata: |
| labels: |
| app: nginx-deploy |
| spec: |
| containers: |
| - name: nginx-deploy |
| image: nginx:latest |
| imagePullPolicy: IfNotPresent |
# 3. Pod 重启策略
操作方式 | 说明 |
---|
Always | 默认策略。容器失效时,自动重启该容器 |
OnFailure | 容器以不为 0 的状态码终止,自动重启该容器 |
Never | 无论何种状态,都不会重启 |
指定重启策略为 Always :
| apiVersion: apps/v1 |
| kind: Deployment |
| metadata: |
| name: nginx-deploy |
| labels: |
| app: nginx-deploy |
| annotations: |
| app: nginx-deploy |
| namespace: default |
| spec: |
| selector: |
| matchLabels: |
| app: nginx-deploy |
| replicas: 3 |
| template: |
| metadata: |
| labels: |
| app: nginx-deploy |
| spec: |
| containers: |
| - name: nginx-deploy |
| image: nginx:latest |
| imagePullPolicy: IfNotPresent |
| restartPolicy: Always |
# 4. Pod 的三种探针
种类 | 说明 |
---|
startupProbe | Kubernetes1.16 新加的探测方式,用于判断容器内的应用程序是否已经启动。如果配置了 startupProbe,就会先禁用其他探测,直到它成功为止。如果探测失败,Kubelet 会杀死容器,之后根据重启策略进行处理,如果探测成功,或没有配置 startupProbe,则状态为成功,之后就不再探测。 |
livenessProbe | 用于探测容器是否在运行,如果探测失败,kubelet 会 “杀死” 容器并根据重启策略进行相应的处理。如果未指定该探针,将默认为 Success |
readinessProbe | 一般用于探测容器内的程序是否健康,即判断容器是否为就绪(Ready)状态。如果是,则可以处理请求,反之 Endpoints Controller 将从所有的 Service 的 Endpoints 中删除此容器所在 Pod 的 IP 地址。如果未指定,将默认为 Success |
# 5. Pod 探针的实现方式
实现方式 | 说明 |
---|
ExecAction | 在容器内执行一个指定的命令,如果命令返回值为 0,则认为容器健康 |
TCPSocketAction | 通过 TCP 连接检查容器指定的端口,如果端口开放,则认为容器健康 |
HTTPGetAction | 对指定的 URL 进行 Get 请求,如果状态码在 200~400 之间,则认为容器健康 |
# 6. 健康检查配置
配置健康检查:
| apiVersion: apps/v1 |
| kind: Deployment |
| metadata: |
| name: nginx-deploy |
| labels: |
| app: nginx-deploy |
| annotations: |
| app: nginx-deploy |
| namespace: default |
| spec: |
| selector: |
| matchLabels: |
| app: nginx-deploy |
| replicas: 3 |
| template: |
| metadata: |
| labels: |
| app: nginx-deploy |
| spec: |
| containers: |
| - name: nginx-deploy |
| image: nginx:latest |
| imagePullPolicy: IfNotPresent |
| startupProbe: |
| initialDelaySeconds: 30 |
| timeoutSeconds: 2 |
| periodSeconds: 30 |
| successThreshold: 1 |
| failureThreshold: 2 |
| tcpSocket: |
| port: 80 |
| livenessProbe: |
| initialDelaySeconds: 30 |
| timeoutSeconds: 2 |
| periodSeconds: 30 |
| successThreshold: 1 |
| failureThreshold: 2 |
| tcpSocket: |
| port: 80 |
| readinessProbe: |
| initialDelaySeconds: 30 |
| timeoutSeconds: 2 |
| periodSeconds: 30 |
| successThreshold: 1 |
| failureThreshold: 2 |
| httpGet: |
| path: /index.html |
| port: 80 |
| scheme: HTTP |
| restartPolicy: Always |
# 7. PreStop 和 PostStart 配置
| [root@k8s-master01 ~] |
| apiVersion: apps/v1 |
| kind: Deployment |
| metadata: |
| name: nginx-deploy |
| labels: |
| app: nginx-deploy |
| annotations: |
| app: nginx-deploy |
| namespace: default |
| spec: |
| selector: |
| matchLabels: |
| app: nginx-deploy |
| replicas: 3 |
| template: |
| metadata: |
| labels: |
| app: nginx-deploy |
| spec: |
| containers: |
| - name: nginx-deploy |
| image: nginx:latest |
| imagePullPolicy: IfNotPresent |
| startupProbe: |
| initialDelaySeconds: 30 |
| timeoutSeconds: 2 |
| periodSeconds: 30 |
| successThreshold: 1 |
| failureThreshold: 2 |
| tcpSocket: |
| port: 80 |
| livenessProbe: |
| initialDelaySeconds: 30 |
| timeoutSeconds: 2 |
| periodSeconds: 30 |
| successThreshold: 1 |
| failureThreshold: 2 |
| tcpSocket: |
| port: 80 |
| readinessProbe: |
| initialDelaySeconds: 30 |
| timeoutSeconds: 2 |
| periodSeconds: 30 |
| successThreshold: 1 |
| failureThreshold: 2 |
| httpGet: |
| path: /index.html |
| port: 80 |
| scheme: HTTP |
| lifecycle: |
| postStart: |
| exec: |
| command: |
| - sh |
| - '-c' |
| - mkdir /data |
| preStop: |
| exec: |
| command: |
| - sh |
| - '-c' |
| - sleep 30 |
| restartPolicy: Always |
本文出自于:https://edu.51cto.com/course/23845.html