【干货】k8s-pod水平自动伸缩,入门到精通


作者:Ghostcloud - 沈芫玉

什么是Horizontal Pod Autoscaling?

使用Horizontal Pod Autoscaling,Kubernetes会自动地根据观察到的CPU利用率(或者通过一些其他应用程序提供的自定义的指标)自动地缩放在replication controller、deployment或replica set上pod的数量。

Horizontal Pod Autoscaler是作为Kubernetes API resource(K8s API 资源)和controller(控制器)实现的。资源决定控制器的行为。控制器周期性的调整replication controller或deployment中的Pod副本数量,以便将获得的CPU利用率与用户指定的目标利用率匹配。

注意,Horizontal Pod Autoscaling并不适用于不能缩放的对象,例如“DaemonSet”。

Horizontal Pod Autoscaler基本原理

Horizontal Pod Autoscaler是作为一个循环控制器实现的,周期由控制器管理器(controller manager)的--horizontal-pod-autoscaler-sync-period标志控制(默认为30秒)

每隔一段时间,控制器管理器根据每个HorizontalPodAutoscaler定义中指定的指标查询资源利用率----控制管理器将从资源度量API(对于每个pod的资源指标),或者自定义指标API(对于其他所有指标)获得资源指标,然后通过查询到的指标与设定的指标进行比较,获得缩放比例。

注意: 如果有些pod中的容器没有相关资源的请求集,pod的CPU利用率不会被定义并且自动缩放器(autoscaler)不会对该指标采取任何行动。

HorizontalPodAutoscaler控制器可以通过两种不同的方式获取指标:直接Heapster访问和REST客户端访问---当使用直接Heapster访问获取资源时,Heapster需要部署在集群上,并在kube-system命名空间(namespace)中运行。

API对象

Horizontal Pod Autoscaler是一个Kubernets autoscaling API组中的一个API资源.

目前稳定版本只支持基于CPU自动缩放,在 autoscaling/v1 API版本中

beta版本包括对内存和自定义指标的支持,在autoscaling/v2beta1 API版本中.

kubectl对Horizontal Pod Autoscaler的支持

kubectl可以像操作pod一样操作Horizontal Pod Autoscaler(例如create,delete,get,describe操作)---Horizontal Pod Autoscaler简写为hpa

此外,kubectl autoscale命令可以轻松的创建一个hpa,例如:执行

kubectl autoscale rc foo --min=2 --max=5 --cpu-percent=80会为replication controller创建一个autoscaler,目标CPU利用率被设为50%,副本数量在2到5之间

滚动更新中的Horizontal Pod Autoscaler

Horizontal Pod Autoscaler不适用直接使用replication controller的滚动更新,即不能将Horizontal Pod Autoscaler 直接绑定到replication controller,并执行滚动更新(例如使用kubectl rolling-update)。这并不会起作用---滚动更新创建一个新的replication controller时,Horizontal Pod Autoscaler不会绑定到新的replication controller。

支持cooldown/delay

当使用Horizontal Pod Autoscaler管理一组副本,由于度量指标的动态特性,副本的数量可能经常波动,产生thrashing(抖动)

从v1.6开始,集群运营商可以通过调整作为kube-controller-manager组件标志公开的全局HPA设置来缓解此问题:

--horizontal-pod-autoscaler-downscale-delay:此选项的值是一个持续时间,指定autoscaler在当前操作完成后需要等待多久时间才能执行另一个下调操作。默认值是5分钟(5m0s).

--horizontal-pod-autoscaler-upscale-delay:此选项的值是一个持续时间,指定autoscaler在当前操作完成后需要等待多久时间才能执行另一个上调操作。默认值是3分钟(3m0s)

其他

k8s 1.8支持使用多个指标与自定义指标

基于CPU指标自动缩放的实例

*前提条件

Heapster监控在集群中已部署(查看kube-system namespace中是否有heapster pod),因为Horizontal Pod Autoscaler会用它来获取指标;

kubenertes 集群;

集群能访问外国网站。

*创建测试服务



*为测试服务创建Horizontal Pod Autoscaler



注:表示replica数量最少一个,最多10个,CPU的平均利用率为50%.(HPA会通过deployment来增加或减少副本数量,以保持所有50%的Pod的平均CPU利用率)



*查看autoscaler当前状态



注:当前的CPU消耗为0%,因为我们没有向服务器发送任何请求(该TARGET 列/前面显示了由相应deployment控制的所有Pod的平均值).

*增加负荷(新开一个终端运行)



*一分钟左右,再次查看pha,就会看到当前的CPU使用率



*然后查看deploy会看到副本数量的变化



*停止增加负荷,一分钟左右后


编辑于 2017-12-25 15:33