运维开发网

监控

0
  • ChaosBlade x SkyWalking 微服务高可用实践

    在分布式系统架构下,服务组件繁多且服务间的依赖错综复杂,很难评估单个故障对整个系统的影响,而且请求链路长,如果监控告警、日志记录等基础服务不完善会造成故障响应、故障定位问题难,所以如何构建一个高可用的分布式系统面临着很大...[详细]

    2020-12-13 10:16 分类:云计算
  • ELK日志服务器搭建

    ELK日志服务器搭建[详细]

    2020-12-11 10:50 分类:云计算
  • 基于zabbix实现监控Jenkins过程详解

    这篇文章主要介绍了基于zabbix实现监控Jenkins过程详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下[详细]

    2020-11-30 15:59 分类:云计算
  • 如何用Prometheus监控十万container的Kubernetes集群

    概述不久前,我们在文章《如何扩展单个Prometheus实现近万Kubernetes集群监控?》中详细介绍了TKE团队大规模Kubernetes联邦监控系统Kvass的演进过程,其中介绍了针对规模较大的集群,我们是如何通过修改Prometheus代码来实现横向扩缩容的...[详细]

    2020-11-26 09:41 分类:云计算
  • 申通快递 双11 云原生应用实践

    一年一度的 “双11” 大促中,交易额每年都在刷新,承接这些交易商品的快递包裹的数量也在成倍增长。这些快速的增长对物流系统带来了巨大的挑战,让物流管理更加敏捷来应对 “双11” 成为了必须解决的问题。[详细]

    2020-11-26 09:26 分类:云计算
  • Prometheus监控实战(二)

    Prometheus监控实战(二)标签(空格分隔):Prometheus系列[toc]一、Prometheus的度量类型(metrictypes)在学习Prometheus的常用函数前,我们得先知道Prometheus的几度量类型,然后才能使用相应的函数来进行计算。不知道大家有没有注意到,...[详细]

    2020-11-25 15:11 分类:Linux
  • 运维监控之zabbix(5.0 LTS)

    前言监控是每个公司必不可少的部门,通过监控我们能实时的观察设备的运行状态,保证业务稳定运行。当业务出现问题时,监控及时给各负责人发送告警,从而我们能够快速定位问题,及时止损。所以监控就像是眼睛一样,帮我们时刻盯着各个设备...[详细]

    2020-11-25 14:05 分类:Linux
  • 如何基于Python和Flask编写Prometheus监控

    介绍 Prometheus 的基本原理是通过 HTTP 周期性抓取被监控组件的状态。 任意组件只要提供对应的 HTTP 接口并且符合 Prometheus 定义的数据格式,就可以接入 Prometheus 监控。[详细]

    2020-11-25 12:41 分类:Python
  • 玩玩kubernetes可视化界面吧

    1前言管理kubernentes集群时,总是需要登陆机器命令行查看,难免有时候显得繁琐。那么有没有一种可视化的更方便管理kubernente的工具呢,这样更方便的全局查看整个集群的各种资源。目前用的比较多的是KubernetesDashBoard和Rancher,其中...[详细]

    2020-11-25 10:05 分类:云计算
  • python实现系统公网和私网流量监控

    目前很多公司业务已经上云,使用了大量的云主机。当前大多数云厂商的云主机公网都是采用的eip,也就是内网和外网使用的同一张网卡,所以流量全部经过的同一个网卡。然而这就面临一个问题,如何将公网和私网的流量分开统计呢?特别是当机器...[详细]

    2020-11-15 12:11 分类:Linux