当多米诺骨牌倒下时:只有DataOps和AI以及机器学习才能让微服务和分布式系统立于不败之地
[[440885]]
【51CTO.com快译】可以想象这样一个场景:当IT运维人员准备享受咖啡的当多倒下时候,突如其来的米诺急促报警会搅乱他们的好心情。即便经过不懈努力解决了大量的骨牌警报信息,如此大的和A和分工作量也会使运维人员深陷疲惫。我们不禁要问:系统为什么不能通过智能的及机器方式预测问题并在报警发出之前就修复它们呢?想象一下, 当IT运维人员使用复杂的学习系统 IT系统和混合云上的应用程序来处理告警信息时会发生什么?无疑!他们会身陷 “报警泥潭”,无法自拔。让微

为了达到如下几个目的服务,为微服务量身打造的布式不败新兴架构就诞生了:
支持业务能力自动将应用程序部署为服务端点智能语言和数据的去中心化控制任何应用中的微服务都有紧密关联的迹象,这种关联会导致多米诺骨牌效应。立于应用中任何一点延迟或更改都会以意想不到的当多倒下速度影响到其他服务。每个数字原生企业都依赖于两个要素:数据和分布式系统。米诺两个要素可以保证企业应用中服务的骨牌完整交付。数字原生组织越成熟,和A和分就会使用更多的及机器分布式系统,也会拥有更多的数据。
成熟的免费信息发布网云原生企业会遇到另一个问题,那就是数据碎片化。这需要构建一个整体的应用方案来解决。Gartner 估计,IT 基础设施产生的数据量会以每年两到三倍的速度增长。
在这样的背景下,为什么人类要为应用程序故障负责?这使我们回过头来质疑一些基本的配置和报警解决方式。
在现代微服务世界中哪些需要改变?
1. 准备你的日志
打破集中和孤立的架构,请将日志汇集到一个系统中。无论是存放还是展示,尽量让它们保存到同一个数据源中。考虑到微服务会生成大量数据,单一视图的方式可以让日志轻松地被搜索到。这是升级现代微服务监控方法的基本操作。
2. 管理分布式网络
分布式网络及其通信不容忽视。它是任何组织的重要组成部分。使用可以长期保存历史数据的集群解决方案,b2b信息网并不会通过过度的下采样(downsampling 对样本再次采样,舍弃多余的样本)而牺牲数据粒度。开源和 SaaS 云服务使这种解决方案变得更加复杂。但是它们可以确保当你工作的监控系统与第三方平台集成后能提供完整的可观察性,即便这个三方平台拥有大型和动态的生态系统也是如此。
3. 管理动态日志/跟踪数据
随着基于微服务的应用程序演进与变化,它们生成数据的变化也悄然发生。考虑到在这种情况下监控系统也需要检测异常,所以不能仅仅依赖于手动创建的报警规则。最重要的是,关键报警不会因为日志数据的创建或更新而被忽略。
智能与机器人数据自动化 (RDA)
机器人数据自动化 (RDA Robotic Data Automation)旨在自动处理数据,并使监控系统和流程更加智能从而管理报警。机器学习算法可以使用历史数据和现有学习模型随时随地创建新报警规则。它处理底层机器数据和报警,进而提供优化报警处理过程的建议。RDA 让报警处理过程变得智能化,以减少人为干预。
迈向新的源码下载微服务世界
摒弃旧监控方法的四大原因如下:
1. 更多的应用程序正被部署到云中。
2. 迭代会显得更加频繁,对于程序的微小修改都需要将整体应用重新编译和发布。
3. 每次变更都会影响到其他模块,正所谓牵一发而动全身。
4. 如果沿用旧有监控的扩展方式则会影响到整个应用程序,实际上只需要扩展部分资源就可以满足监控扩展需求。
同时,新的微服务架构模式需要关注服务发现、配置管理、负载均衡、消息传递等。您需要具备数据获取和与第三方系统集成的能力。通过RDA 的AIOps(人工智能运维)方式帮助实现混合 IT系统的性能与可用性监控。
译者介绍
崔皓:51CTO社区编辑,资深架构师,拥有18年的软件开发和架构经验,10年分布式架构经验。曾任惠普技术专家。乐于分享,撰写了很多热门技术文章,阅读量超过60万。《分布式架构原理与实践》作者。
原文标题:When Dominoes Fall: Microservices and Distributed Systems Need Intelligent DataOps and AI/ML To Stand Up Tall,作者:Srinivas Miriyala
【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】
相关文章
老捷达电脑板拆卸教程——解密老爷车中的黑科技(学会拆卸老捷达电脑板,让你的车焕然一新)
摘要:在如今科技日新月异的时代,老爷车仿佛成了一道风景线。然而,在享受驾驶老捷达的同时,我们是否曾想过如何改善它的性能和使用体验?本文将向大家介绍如何拆卸老捷达电脑板,以便进行更好的维护...2025-11-05
背景介绍在当今快速发展的数字化时代,IT 系统和应用程序对业务运营至关重要。为了确保顺畅的性能、可靠性和安全性,IT 团队依靠监控事件来实时检测、分析和响应问题。监控事件是指任何影响 IT 系统正常运2025-11-05- 复制select*fromadu_userwheregmt_modified>=#{date} 1.2025-11-05
Ubuntu系统中的实用程序 needrestart 近日被曝出存在5个本地权限提升 LPE) 漏洞,这些漏洞不是最近才产生,而是已经潜藏了10年未被发现。这些漏洞由 Qualys 发现,并被跟踪为2025-11-05- 摘要:如今,电脑已经成为我们生活和工作中不可或缺的一部分。然而,随着时间的推移,电脑性能可能会逐渐下降,运行速度变慢,卡顿频繁。本文将为大家介绍一种提升电脑性能的利器——动态渲染,并详细...2025-11-05
- 云原生和微服务架构等技术的流行让API受到越来越大的重视。那么当应用程序开始上云,各项需求都可以通过云服务满足的情况下,应用程序,尤其基于云端API的应用程序的安全问题该如何解决?延伸阅读,点击链接了2025-11-05

最新评论