指标计算、中心化收集以及规则引擎设想 #777

pj1987111 · 2023-04-09T07:31:35Z

pj1987111
Apr 9, 2023

iLogtail 数据处理现状

目前iLogtail在processor插件中对于日志处理是一等公民，拥有非常多处理日志的插件，但是针对于指标方面的处理较为缺失。暂时想了几个使用场景。

一些指标方面的功能设想

指标计算

同timestamp下，不同指标之间的四则运算。
在阿里云emr业务下，有比较多类似场景，比如采集到了yarn 队列已用资源以及总资源，计算队列中资源使用百分比作为一个新的指标。
一段时序中，相同指标以及指定tag的聚合计算。
举个例子，计算cpu使用率近10分钟内min/max/avg/sum/count/rate/p90/p95/p99 等。

中心化收集

在大数据场景下，有众多组件采集的指标分散在集群各个node上，有些场景需要将这些分散的指标汇聚到一个中心节点，进行聚合分析。
目前ilogtail有http-server-input和http-flusher两插件，node可以通过http-flusher发送指标到master的http-server-input上进行汇聚。可能需要针对指标场景对这两个插件进行改造。
还有中心化汇聚需要存储，是否要引入一个本地化时序。

规则引擎

前面提及的指标计算和中心化收集在于处理和汇聚数据，最后需要更好的使用数据。
规则引擎可以是一些简单的if else 以及> <等条件表达式的实现。
在一些基于指标做弹性伸缩的业务场景有非常大的前景。举例子通过指标计算或者中心化收集再计算，得到二次计算后的指标，然后通过规则引擎，当新指标满足阈值后就可以通过http-flusher插件调用http接口，做一些告警接口对接或者业务系统弹性伸缩接口对接。

总结

有上述三个功能，就打造了一个在边缘侧的指标收集和处理引擎，可以将一些之前需要flink/spark streaming/kafka streaming等业务场景去掉计算引擎，将业务整体链路缩短，提高稳定性。

messixukejia · 2023-04-09T13:56:55Z

messixukejia
Apr 9, 2023
Maintainer

通过http-flusher实现与业务系统的对接这个想法很👍

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

指标计算、中心化收集以及规则引擎设想 #777

Uh oh!

{{title}}

Uh oh!

Uh oh!

{{editor}}'s edit

{{editor}}'s edit

Uh oh!

Replies: 1 comment

Uh oh!

{{title}}

Uh oh!

Select a reply

Uh oh!

指标计算、中心化收集以及规则引擎设想 #777

Uh oh!

Uh oh!

pj1987111 Apr 9, 2023

iLogtail 数据处理现状

一些指标方面的功能设想

指标计算

中心化收集

规则引擎

总结

Replies: 1 comment

Uh oh!

messixukejia Apr 9, 2023 Maintainer

pj1987111
Apr 9, 2023

messixukejia
Apr 9, 2023
Maintainer