由于Pod没有对内存及CPU进行限制,导致Pod在运行过程中所需的内存超过了节点本身的内存(OOM),从而导致节点崩溃,使得运行在该节点上的所有Pod都失败了。
DNSserver部署
之前已经发过一篇DNS服务器的部署教程,最近发现一个通过docker-compose启动的DNS服务,相对简单,也能实现需求,记录一下。
k8s部署新版elasticsearch+kibana并配置快照备份
Elasticsearch和Kibana是一对强大的开源工具,通常一起使用以构建实时数据分析和可视化解决方案。
certbot申请泛域名证书及自动续期
阿里云申请的免费证书有效期变短了,还有数量限制,而且不能申请泛域名证书,可以通过cerbot申请免费的域名证书并且自动续期。
k8s安装cert-manager及签发泛域名证书
cert-manager 是一个云原生证书管理开源项目,用于在 Kubernetes 集群中自动管理和颁发来自各种颁发源的 TLS 证书,它可以从各种受支持的来源颁发证书,包括 Let’s Encrypt、HashiCorp Vault和Venafi以及私有 PKI,它将确保证书定期有效和更新,并在到期前的适当时间尝试更新证书。
k8s使用NFS建立持久卷
由于服务在k8s集群是以容器方式启动,容器重启的话数据会丢失,所以我们一般会把重要的数据挂载到机器上,这里使用NFS做k8s的持久卷。
Prometheus实现运维告警
搭建好监控环境并且监控了服务器、数据库、应用,运维人员可以实时了解当前被监控对象的运行情况,但是他们不可能时时坐在电脑边上盯着DashBoard,这就需要一个告警功能,当服务器或应用指标异常时发送告警,通过邮件或者短信的形式告诉运维人员及时处理。接下来就来介绍非常重要的功能——告警。
Prometheus监控K8S集群
Prometheus是一个开源系统监控和警报工具包,最初由 SoundCloud构建。自 2012 年启动以来,许多公司和组织都采用了 Prometheus,该项目拥有非常活跃的开发者和用户社区。它现在是一个独立的开源项目,独立于任何公司进行维护。为了强调这一点,并明确项目的治理结构,Prometheus 于 2016 年作为继Kubernetes之后的第二个托管项目加入了云原生计算基金会。
prometheus.yaml.gz修改配置方法
通过kubesphere安装的Prometheus的配置文件是加密的,想要修改的话需要先把文件解压,解密,修改完之后再压缩,加密再替换回去。
Prometheus原理详解
Prometheus 最开始是由 SoundCloud 开发的开源监控告警系统,是 Google BorgMon 监控系统的开源版本。在 2016 年,Prometheus 加入 CNCF,成为继 Kubernetes 之后第二个被 CNCF 托管的项目。随着 Kubernetes 在容器编排领头羊地位的确立,Prometheus 也成为 Kubernetes 容器监控的标配。本文接下来将会对 Prometheus 做一个介绍。