【干货】k8s-pod水平自动伸缩，入门到精通

Ghostcloud-001工号，资深Docker玩家，分布式系统研发11年。

作者：Ghostcloud - 沈芫玉

什么是Horizontal Pod Autoscaling?

使用Horizontal Pod Autoscaling，Kubernetes会自动地根据观察到的CPU利用率(或者通过一些其他应用程序提供的自定义的指标)自动地缩放在replication controller、deployment或replica set上pod的数量。

Horizontal Pod Autoscaler是作为Kubernetes API resource(K8s API 资源)和controller(控制器)实现的。资源决定控制器的行为。控制器周期性的调整replication controller或deployment中的Pod副本数量，以便将获得的CPU利用率与用户指定的目标利用率匹配。

注意，Horizontal Pod Autoscaling并不适用于不能缩放的对象，例如“DaemonSet”。

Horizontal Pod Autoscaler基本原理

Horizontal Pod Autoscaler是作为一个循环控制器实现的，周期由控制器管理器(controller manager)的--horizontal-pod-autoscaler-sync-period标志控制(默认为30秒)

每隔一段时间，控制器管理器根据每个HorizontalPodAutoscaler定义中指定的指标查询资源利用率----控制管理器将从资源度量API(对于每个pod的资源指标),或者自定义指标API(对于其他所有指标)获得资源指标,然后通过查询到的指标与设定的指标进行比较,获得缩放比例。

注意: 如果有些pod中的容器没有相关资源的请求集,pod的CPU利用率不会被定义并且自动缩放器(autoscaler)不会对该指标采取任何行动。

HorizontalPodAutoscaler控制器可以通过两种不同的方式获取指标:直接Heapster访问和REST客户端访问---当使用直接Heapster访问获取资源时,Heapster需要部署在集群上,并在kube-system命名空间(namespace)中运行。

API对象

Horizontal Pod Autoscaler是一个Kubernets autoscaling API组中的一个API资源.

目前稳定版本只支持基于CPU自动缩放,在 autoscaling/v1 API版本中

beta版本包括对内存和自定义指标的支持,在autoscaling/v2beta1 API版本中.

kubectl对Horizontal Pod Autoscaler的支持

kubectl可以像操作pod一样操作Horizontal Pod Autoscaler(例如create,delete,get,describe操作)---Horizontal Pod Autoscaler简写为hpa

此外,kubectl autoscale命令可以轻松的创建一个hpa,例如:执行

kubectl autoscale rc foo --min=2 --max=5 --cpu-percent=80会为replication controller创建一个autoscaler,目标CPU利用率被设为50%,副本数量在2到5之间

滚动更新中的Horizontal Pod Autoscaler

Horizontal Pod Autoscaler不适用直接使用replication controller的滚动更新，即不能将Horizontal Pod Autoscaler 直接绑定到replication controller，并执行滚动更新（例如使用kubectl rolling-update）。这并不会起作用---滚动更新创建一个新的replication controller时，Horizontal Pod Autoscaler不会绑定到新的replication controller。

支持cooldown/delay

当使用Horizontal Pod Autoscaler管理一组副本,由于度量指标的动态特性,副本的数量可能经常波动,产生thrashing(抖动)

从v1.6开始，集群运营商可以通过调整作为kube-controller-manager组件标志公开的全局HPA设置来缓解此问题：

--horizontal-pod-autoscaler-downscale-delay：此选项的值是一个持续时间，指定autoscaler在当前操作完成后需要等待多久时间才能执行另一个下调操作。默认值是5分钟(5m0s).

--horizontal-pod-autoscaler-upscale-delay：此选项的值是一个持续时间，指定autoscaler在当前操作完成后需要等待多久时间才能执行另一个上调操作。默认值是3分钟(3m0s)

其他

k8s 1.8支持使用多个指标与自定义指标

基于CPU指标自动缩放的实例

*前提条件

Heapster监控在集群中已部署(查看kube-system namespace中是否有heapster pod),因为Horizontal Pod Autoscaler会用它来获取指标；

kubenertes 集群；

集群能访问外国网站。