天旦发布开源端口镜像工具

2018-09-14 13:20 来源:美通社 作者:niko

近日,天旦发布开源端口镜像工具 Packet Agent,帮助运维人员通过旁路方式简单获取业务过程数据而不需要硬件探针设备,跨越公有云、私有云、虚拟机、物理机等各种环境。目前,天旦 Packet Agent 已公开提供免费下载(关注天旦公众号“天旦Netis”,即可获得)。

随着 Iaas 的兴起,越来越多的企业将自己的 IT 基建托管到专业的服务商,将自己的业务构建在服务商的公有云虚拟机中。这带给企业极大的轻便性和敏捷性,却给运维带来难题:一方面,只有极少数的公有云平台能够提供业务数据的镜像端口,完整的业务过程数据无从获取,业务何时消失在了监控视野中无从察觉;另一方面,现有的工具要么开销较大、要么功能单一,无法支持企业各种自有业务协议,甚至不支持数据的导出。天旦,作为国内领先的企业级软件产品公司,多年来致力于业务与网络性能管理产品的研究与开发,得益于成熟的互联数据核心算法以及丰富的行业实践经验,凝结为 Packet-Agent,一款开源的虚拟机端口镜像工具,造福运维行业、回馈社区。而这也是天旦在 AIOps 实践中一个小小的里程碑。

AI 与 Ops

早在2016年,Gartner 就已经提出了 AIOps 的概念并宣称,到2020年,将近50%的企业将会在他们的业务和 IT运 维方面采用 AIOps,远远高于今天的10%。理解 AI 与 Ops 的关系,不如从 Gartner 的理解入手。

AIOps 在 Gartner 的词库中是 AlgorithmicIT Operations 的缩写,字面的解释是一种基于 AI 算法的运维方式,Gartner 在今年发布的《Market Guide for AIOps Platforms》报告中为 AIOps 作出如下定义:AIOps 平台是结合大数据、人工智能 (AI) 或机器学习功能的软件系统,用以增强和部分取代广泛应用的现有 IT 运维流程和事务,包括可用性和性能监控、事件关联和分析,IT 服务管理以及运维自动化。简而言之,AI 是不需要人工干预,就能帮助运维人员提高生产力的一种途径。未来,AI 是否可以完全取代人类思考,还未可知,但至少在目前看来,这种美好的预期还必须人的智慧去创造。

另一方面,当越来越多的业务系统、新技术应用承载于 IT 系统之上,IT 系统作为基础设施也迅速拓建和创新:从过去的物理机,到虚拟化技术带来的虚拟机运载,到当下正热的 LXC 软件容器,公有云和私有云的应用,运维监控对象的数量和监控难度都呈指数级增长。

天旦一直致力于通过旁路方式实现实时、全量、精准的的业务性能监控,当一次在与国外用户的交流沟通汇总发现,在云环境下,尤其大部分的公有云几乎都不提供获取流量的端口,租户无法突破其封闭式的底层架构而获得详细的业务过程数据。一方面,这让业务的性能变化过程“两眼一抹黑”,无从即刻知晓;另一方面,一旦业务在非人为的情况下产生迁移,就会逃出运维人员的监控视野。随着云计算的普及,这将是广泛存在的运维盲区。天旦研发人员基于 SDPM (Software Define Performance Management) 思维,应用历年来互联数据引擎的核心算法积累而开发了一款开源的镜像工具,Packet Agent。

2236722-1-a

天旦免费开源端口镜像工具Packet Agent示意图

Packet-Agent 端口镜像工具,旨在帮助用户解决在云环境、虚拟机等复杂环境下无法实时获取完整业务过程数据,感知业务变化的问题,而不需要网络镜像的硬件设备,可适用于 Linux,Unix,Mac,Windows 等各种操作系统。与 PacketBeat、Splunk App for Stream 等工具比较,天旦Packet Agent 大大节省了机器开销,并且实现了自定义化的协议支持,甚至直接导出数据包(另2种工具尚且无法实现)等功能。(关注天旦公众号“天旦Netis”,免费获取 Packet-Agent 端口镜像工具)

天旦认为,技术的问题,应当交给技术来解决。用 AIOps 去解决运维中的问题,释放运维的潜力,给予运维人更多的时间去集中思考,找到合适的方法去攻克下一个难题。

AIOps,走出“有多少人,就有多少智能”的怪圈

Gartner 在《Market Guide for AIOps Platforms》报告中指出: 过去三年,IT 运营部门分别部署了大数据和机器学习技术,以支持 IT 运营的监控。然而,在过去的6个月里,企业已经开始将面向 IT 运营的大数据和机器学习项目相结合,并将其扩展到服务台和自动化。企业在 IT 运营 (AIOps) 平台上使用人工智能来增强并取代传统的应用性能监控 (APM) 和网络性能监控与诊断 (NPMD) 工具。

人工智能算法的成长离不开队海量案例的分析和学习,而现在许多所谓 AI 告警的定制化方案受限于缺乏充足的真实案例,需要在部署后耗费繁重的人工进行后期的调整和维护,原本想要解放劳动力的项目,却成为了耗费人力和时间的黑洞,而且算法效果极不稳定。

天旦作为企业级软件产品公司,通过提供通用性的产品而非定制化的解决方案,使得智能算法真正成熟产品化。多年来,陪伴120+家银行经历数字化转型的整个过程,每天保障超过200亿笔交易的稳定运行,积累了极其丰富的案例资源与经验,为算法的不断完善提供扎实的依据,并转而进一步将成熟的智能化技术应用到产品功能的之中。

天旦业务性能管理 BPC,通过算法升级集合智能发现、智能梳理、智能告警、智能预测、智能排障五大模块,使得运维人员只需简单配置全面覆盖的告警规则,结合自动故障定位和自动故障域分析,加速故障发现和分析流程,缩短故障恢复时间。

智能发现:5年自研专利解码引擎,自动发现应用访问关系,自动解析业务数据内容。

智能梳理:通过天旦 BPC 的核心组件 -- 服务路径图发现,自动梳理业务访问关系,呈现以服务为中心的拓扑视图,让数以月计的业务梳理工作突破性地缩短到天。

2236722-1-b

天旦服务路径图发现,让数以月计的业务梳理工作突破性地缩短到天

智能告警:将告警场景归纳为五大类型,几乎涵盖所有常见的高频故障场景。运维人员仅需选择合适的告警场景,智能告警算法将自动匹配与之对应的告警逻辑,大大提高告警的配置效率。

2236722-1-c

天旦BPC五大场景化告警,让告警无需一一配置

智能预测:实时监控,智能算法自动根据历史表现绘制基线,直观发现变化趋势。

智能排障:自动定位故障节点,一键解析造成故障发生的维度和指标,无需专家介入。

正所谓“科学技术是第一生产力”。天旦相信,随着智能化运维技术的不断演进,AIOps脱离人力干预而自动处理运维问题的能力一定会得以实现。

未来:源于“人”

尽管 Google 助手可以帮助主人像真人一般沟通交流,但无法代替主人决心的每日行程;尽管自动驾驶技术可以如真人驾驶一般控制汽车,但无法代替人决定出行的意愿。AI 的使命在于为人类解决问题,而非控制或取代人类。

李开复在 TED 2018年度大会上发表演讲说,工业革命把手工工匠的工作转化成大量常规工作(如生产线工作),但是人工智能革命将彻底取代这些生产线工作。不出十五年,驾驶、电话销售、卡车司机甚至是放射科医生等类似工作和事务也将被人工智能取而代之。在这场人工智能摧毁工作的浩劫中,唯有创造性工作才能从中全身而退。在所有重复性工作上,人工智能都将高出人类一筹。但我们并非因为擅长重复性工作而为人。

天旦相信,随着数字化转型的深入,AIOps 必将成为运维组织高效运作的关键所在。运维过程中琐碎、重复的工作终将被由智能化的工具所替代,但却无法磨灭运维人的存在使命:基于运维系统的深刻理解,做智能化运维的指挥官,谋略布局。而天旦也将继续精进算法、积累行业经验,将智能化的技术植根于产品研发与功能设计的细节之中,帮助“运维指挥官”释放运维的智慧潜力,为企业在数字化转型之路上创造更多业务可能。

天旦 端口镜像 AIOps

一周热门

2018电源网工程师巡回研讨会