使用SLS构建企业级监控最佳实践
随着企业信息化的发展,面向云的IT基础设施越来越普遍,如何解决跑大的软件系统的监控问题,成为IT稳定性保障的关键环节。 本方案主要介绍如何使用SLS 对阿里云、专有IDC以及第
(一)背景 随着企业信息化的发展,面向云的IT基础设施越来越普遍,如何解决跑大的软件系统的监控问题,成为IT稳定性保障的关键环节。 本方案主要介绍如何使用SLS 对阿里云、专有IDC以及第三方云场景下,进行企业级的监控方案。 (二)架构 依托于MetricStore/Logstore存储能力,SLS提供了从底向上全栈的监控能力 (三)前序工作 在阿里云官网已经开通 SLS服务 确保现有的网络环境,可以连通到阿里云网络。 网络联通说明: 本方案要求现有的需要采集指标或日志的设备能够联通阿里云的网络环境应用接入,目前SLS支持的Region 参考 对于IDC或者其他云厂商的场景,如果是进行POC的话可以优先使用SLS的公网地址进行日志收集;如果是生产使用建议搭建相应的专线接入阿里云网络,以保障数据传输的可靠性 (四)步骤 配置步骤汇总 监控层次监控类型接入方式接入说明 IAAS层 k8s指标监控 配置即可接入(Promethues Remote Write) 支持Pod、Deployment、SatefulSet、k8s核心组件指标监控,具体配置方法 参考:[help.aliyun.com/document_detail/171781.html?spm=a2c4g.11186623.6.969.69dc3e2baQZAEO] IAAS层 k8s事件监控 配置即可接入(需部署k8s npd组件) 容器的重启、Crash、OOM等监控,关键组件异常监控 参考:[help.aliyun.com/document_detail/150476.html?spm=a2c4g.11186623.6.1365.5a0f4027w8jmCx] IAAS层 主机监控 logtail采集 支持CPU、Mem、Disk、Net、System等相关指标采集 参考:[help.aliyun.com/document_detail/171717.html?spm=a2c4g.11186623.6.966.66d828afG60IvG] PAAS层 logtail采集 logtail采集 配置方案见 [help.aliyun.com/document_detail/178832.html?spm=a2c4g.11186623.6.974.73da320bHq8niL] PAAS层 MongoDB logtail采集 配置方案见[help.aliyun.com/document_detail/197550.html?spm=a2c4g.11186623.6.981.7e9d5ff2cGvqu5] PAAS层 Redis logtail采集 配置方案见[help.aliyun.com/document_detail/185092.html?spm=a2c4g.11186623.6.975.1a409bb381knFM] PAAS层 ClickHouse logtail采集 配置方案见[help.aliyun.com/document_detail/185094.html?spm=a2c4g.11186623.6.977.50c17b20RkHCEG] PAAS层 Kafka logtail采集 配置方案见[help.aliyun.com/document_detail/185095.html?spm=a2c4g.11186623.6.976.ea45335aOE5p4L] PAAS层 logtail采集 配置方案见[help.aliyun.com/document_detail/190137.html?spm=a2c4g.11186623.6.979.5bcd18e9Spju9C] PAAS层 logtail采集 配置方案见[help.aliyun.com/document_detail/185089.html?spm=a2c4g.11186623.6.973.68d728afqHWa15] PAAS层 阿里云云产品 logtail采集 支持常见的云产品(ecs、rds等)指标接入[help.aliyun.com/document_detail/171780.html?spm=a2c4g.11186623.6.982.4cb823e0b8GUFc] 应用层 应用Trace 业务代码集成(部分支持无侵入) 支持常见语言SDK 请参考[help.aliyun.com/document_detail/208900.html]Java Trace接入(支持无侵入接入)Golang Trace接入Python Trace接入NodeJS Trace接入C# Trace接入Rust Trace接入Ruby Trace接入 应用层 现有Trace集成 配置即可接入 请参考:[help.aliyun.com/document_detail/208911.html] OpenCensus Trace 数据接入 Zipkin Trace数据接入 SkyWalking Trace数据接入 Jaeger Trace数据接入 应用层 JVM指标监控 配置即可接入 配置方式参考[help.aliyun.com/document_detail/185096.html?spm=a2c4g.11186623.6.990.73da320bZSPJkW] 应用层 自定义指标 开发接入/SLS数据加工/SLS ScheduleSQL 支持使用Python、Java、Go等语言,向SLS MetricStore写入自定义的监控数据。参考[help.aliyun.com/document_detail/175624.html?spm=a2c4g.11186623.6.983.7cd518baiSROA5] 业务层 业务接入层分析 配置即可接入 Nginx访问日志分析 [help.aliyun.com/document_detail/197669.html] ALB访问日志分析 [help.aliyun.com/document_detail/197663.html]SLB访问日志分析 [help.aliyun.com/document_detail/183237.html]Kubernetes Ingress日志分析 [help.aliyun.com/document_detail/184949.html] 业务层 自定义指标 开发接入/SLS数据加工/SLS ScheduleSQL 业务日志中的日志,通过计算转换为指标 使用SLS数据加工转换日志为指标 请参考[developer.aliyun.com/article/782905] 部分监控效果展示 k8s 接入Prometheus后指标查询展示 k8s 接入Prometheus后使用Grafana查询 k8s事件中心 Redis监控 云产品 - ecs指标导入 SLB日志中心 应用JVM监控 应用Trace接入 进一步参考 为您推荐 阿里云日志服务:日志审计多帐号采集方案升级--资源目录集成 阿里云日志服务:SIGMOD 2021《Kafka 流处理对一致性和完整性的设计》解读 阿里云日志服务:SLS发布Scheduled SQL功能——支持大规模日志上的全局分析与调度 (编辑:孝感站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |