运维开发网

监控

0
  • 面对大规模 K8s 集群,如何先于用户发现问题?

    怎样才能在复杂的大规模场景中,做到真正先于用户发现问题呢?下面我会带来我们在管理大规模 ASI 集群过程中对于快速发现问题的一些经验和实践,希望能对大家有所启发。[详细]

    2021-04-26 11:01 分类:云计算
  • MongoDB Ops Manager部署

    基础环境CentOS7.5MongoDB4.2部署MongoDB前期已经部署过MongoDB分片集群安装MongoDBOpsManagerserver节点安装rpm-ivhmongodb-mms-4.2.20.57016.20201007T1901Z-1.x86_64.rpm配置参数文件conf-mms.propertiesvi/opt/mongodb/mms/conf/conf...[详细]

    2021-04-24 12:44 分类:Linux
  • Fluid 给数据弹性一双隐形的翅膀 -- 自定义弹性伸缩

    弹性伸缩作为 Kubernetes 的核心能力之一,但它一直是围绕这无状态的应用负载展开。而 Fluid 提供了分布式缓存的弹性伸缩能力,可以灵活扩充和收缩数据缓存。 它基于 Runtime 提供了缓存空间、现有缓存比例等性能指标, 结合自身对于 Runt...[详细]

    2021-04-21 09:42 分类:云计算
  • 利用 Amazon CloudWatch 监控 GPU

    说明由于当前K8S测试和生产环境已经有容器应用在使用,所以不太适合去更改底层容器运行时(runtime),所以这里使用自定义GPU监控指标推送至CloudWatch触发阈值来完成GPU监控和报警活动。方案架构方案部署首先,我们需要给每个使用GPU的实...[详细]

    2021-04-17 18:34 分类:Linux
  • 监控想玩新花样?请认准prometheus

    像我这么热爱野外生活的人,初冬时节,还找了个隐蔽的地方去野炊。现在的社会,为了找找到这么一个静谧的存在,我可谓煞费苦心。 初冬的夜,连虫鸣声都没有,星空高而深远。蜷缩在篝火旁边,我想起了普罗米修斯。在希腊神话中,他教会人类...[详细]

    2021-04-16 15:52 分类:Linux
  • 三分钟构建自动化运维平台-nightingale(夜莺)

    最终搭建完成成品监控效果如图所示夜莺是一套分布式高可用的运维监控系统,最大的特点是混合云支持,既可以支持传统物理机虚拟机的场景,也可以支持K8S容器的场景。同时,夜莺也不只是监控,还有一部分CMDB的能力、自动化运维的能力,很多...[详细]

    2021-04-13 18:28 分类:Linux
  • 基于 RocketMQ Prometheus Exporter 打造定制化 DevOps 平台

    本文将对 RocketMQ-Exporter 的设计实现做一个简单的介绍,读者可通过本文了解到 RocketMQ-Exporter 的实现过程,以及通过 RocketMQ-Exporter 来搭建自己的 RocketMQ 监控系统。RocketMQ 在线可交互教程现已登录知行动手实验室,PC 端登录...[详细]

    2021-04-08 10:15 分类:云计算
  • 聊一聊SpringBoot服务监控机制

    前言 任何一个服务如果没有监控,那就是两眼一抹黑,无法知道当前服务的运行情况,也就无法对可能出现的异常状况进行很好的处理,所以对任意一个服务来说,监控都是必不可少的。[详细]

    2021-04-08 09:31 分类:编程语言
  • 通过修改源码突破zabbix单server监控数量

    最近业务的快速增长,zabbix监控的VPS(Required server performance, new values per second)早已超过六位数,这也许是达到他的单server最大吞吐量。而zabbix server的CPU负载、内存使用率、网络IO、磁盘IO、MySQL的QPS等关键性能指标都...[详细]

    2021-04-07 20:54 分类:Linux
  • 云原生时代下,容器安全的“四个挑战”和“两个关键”

    云原生的火热带来了企业基础设施和应用架构等技术层面的革新,在云原生的大势所趋下,越来越多的企业选择拥抱云原生,在 CNCF 2020 年度的调研报告中,已经有83% 的组织在生产环境中选择 Kubernetes,容器已经成为应用交付的标准,也是云...[详细]

    2021-04-07 18:42 分类:云计算