kibana 嵌套聚合的问题ElasticSearch：在最大值之后求和

Daniel Schneiter 2020-02-01 23:41

我不确定100％想要实现什么，如果您也将共享映射会有所帮助。

桶聚合是关于定义桶/组的。正如您在示例中所做的那样，您可以包装/嵌套存储桶聚合，以进一步将存储桶分解为子存储桶，依此类推。

默认情况下，Elasticsearch总是计算计数指标，但是您也可以指定其他指标以进行计算。一个指标是针对每个存储桶/针对一个存储桶（而不是另一个指标）计算的，这就是为什么您不能将一个指标聚合嵌套在一个指标聚合之下，这根本没有意义。

根据数据的外观，您可能需要做的唯一更改是将sum_done聚合移出-clause aggs，移到与max_date_aggs-aggregation 相同的级别。

代码段

"aggs": {
  "max_date_aggs": { "max": {"field": "timestamp"} },
  "sum_done": { "sum": { "field": "itemNumberDone"} }
}

在您提出问题并提出问题之后，我设法提出了一个需要一个请求的解决方案。如前所述，sum-metric聚合需要在存储桶而不是度量上进行操作。解决方案非常简单：无需计算max-date，只需将该聚合重新计算为terms-aggregation，然后按时间戳记降序排序即可，只需要一个存储桶即可。

解

GET gos_element/_search
{
  "size": 0, 
  "aggs": {
    "sender_comp_aggs": {
      "terms": {"field": "senderComponent.keyword"},
      "aggs": {
        "activity_mnemo_aggs": {
          "terms": {"field": "activityMnemo.keyword"},
          "aggs": {
            "activity_instance_id_aggs": {
              "terms": {"field": "activityInstanceId.keyword"},
              "aggs": {
                "business_date_aggs": {
                  "terms": {"field": "correlationIdSet.businessDate"},
                  "aggs": {
                    "context_set_id_closing_aggs": {
                      "terms": {"field": "contextSetId.closing.keyword"},
                      "aggs": {
                        "max_date_bucket_aggs": {
                          "terms": {
                            "field": "timestamp",
                            "size": 1, 
                            "order": {"_key": "desc"} 
                          },
                          "aggs": {
                            "sum_done": {
                              "sum": {"field": "itemNumberDone"}
                            }
                          }
                        }
                      }
                    }
                  }
                }
              }
            }
          }
        }
      }
    }
  }
}

当我依靠默认的Elasticsearch映射时，我不得不引用.keyword字段的-version。如果您的字段直接映射到类型的字段keyword，则不需要这样做。

使用以下2条命令为您提供的文档建立索引后，您可以立即测试以上请求：

PUT gos_element/_doc/AW_yu3dIa2R_HwqpSz
{
  "senderComponent": "PS",
  "timestamp": "2020-01-28T02:31:00Z",
  "activityMnemo": "PScommand",
  "activityInstanceId": "123466",
  "activityStatus": "Progress",
  "activityStatusNumber": 300,
  "specificActivityStatus": "",
  "itemNumberTotal": 10,
  "itemNumberDone": 9,
  "itemNumberInError": 0,
  "itemNumberNotStarted": 1,
  "itemNumberInProgress": 0,
  "itemUnit": "Command",
  "itemList": [],
  "contextSetId": {
    "PV": "VAR",
    "closing": "PARIS"
  },
  "correlationIdSet": {
    "closing": "PARIS",
    "businessDate": "2020-01-27",
    "correlationId": "54947df8-0e9e-4471-a2f9-9af509fb5899"
  },
  "errorSet": [],
  "kpiSet": "",
  "activitySpecificPayload": "",
  "messageGroupUUID": "54947df8-0e9e-4471-a2f9-9af509fb5899"
}


PUT gos_element/_doc/AW_yu3dIa2R_HwqpSz8z
{
  "senderComponent": "PS",
  "timestamp": "2020-01-28T03:01:00Z",
  "activityMnemo": "PScommand",
  "activityInstanceId": "123466",
  "activityStatus": "End",
  "activityStatusNumber": 200,
  "specificActivityStatus": "",
  "itemNumberTotal": 10,
  "itemNumberDone": 10,
  "itemNumberInError": 0,
  "itemNumberNotStarted": 0,
  "itemNumberInProgress": 0,
  "itemUnit": "Command",
  "itemList": [],
  "contextSetId": {
    "PV": "VAR",
    "closing": "PARIS"
  },
  "correlationIdSet": {
    "closing": "PARIS",
    "businessDate": "2020-01-27",
    "correlationId": "54947df8-0e9e-4471-a2f9-9af509fb5899"
  },
  "errorSet": [],
  "errorMessages": "",
  "kpiSet": "",
  "activitySpecificPayload": "",
  "messageGroupUUID": "54947df8-0e9e-4471-a2f9-9af509fb5899"
}

结果，您将获得以下响应（预期值为10）：

{
  "took" : 8,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 2,
      "relation" : "eq"
    },
    "max_score" : null,
    "hits" : [ ]
  },
  "aggregations" : {
    "sender_comp_aggs" : {
      "doc_count_error_upper_bound" : 0,
      "sum_other_doc_count" : 0,
      "buckets" : [
        {
          "key" : "PS",
          "doc_count" : 2,
          "activity_mnemo_aggs" : {
            "doc_count_error_upper_bound" : 0,
            "sum_other_doc_count" : 0,
            "buckets" : [
              {
                "key" : "PScommand",
                "doc_count" : 2,
                "activity_instance_id_aggs" : {
                  "doc_count_error_upper_bound" : 0,
                  "sum_other_doc_count" : 0,
                  "buckets" : [
                    {
                      "key" : "123466",
                      "doc_count" : 2,
                      "business_date_aggs" : {
                        "doc_count_error_upper_bound" : 0,
                        "sum_other_doc_count" : 0,
                        "buckets" : [
                          {
                            "key" : 1580083200000,
                            "key_as_string" : "2020-01-27T00:00:00.000Z",
                            "doc_count" : 2,
                            "context_set_id_closing_aggs" : {
                              "doc_count_error_upper_bound" : 0,
                              "sum_other_doc_count" : 0,
                              "buckets" : [
                                {
                                  "key" : "PARIS",
                                  "doc_count" : 2,
                                  "max_date_bucket_aggs" : {
                                    "doc_count_error_upper_bound" : 0,
                                    "sum_other_doc_count" : 1,
                                    "buckets" : [
                                      {
                                        "key" : 1580180460000,
                                        "key_as_string" : "2020-01-28T03:01:00.000Z",
                                        "doc_count" : 1,
                                        "sum_done" : {
                                          "value" : 10.0
                                        }
                                      }
                                    ]
                                  }
                                }
                              ]
                            }
                          }
                        ]
                      }
                    }
                  ]
                }
              }
            ]
          }
        }
      ]
    }
  }
}

SophiP 2020-01-31 21:14:17

嗨，首先感谢您的快速回复！我尝试将sum_done与max_date_aggs移到同一级别。它向我显示了所有已完成项目的总和，而不是具有最大时间戳的已完成项目的总和。我也尝试使用存储桶，但我不知道如何获取字段itemNumberDone的总和。我将立即添加更多详细信息。

Daniel Schneiter 2020-01-31 21:18:50

哦，您想要实现的目标完全不同。您将需要一个存储桶/范围，所有具有该max_date作为值的文档。您最有可能必须在应用程序端解决此问题：-第一个请求：查询Elasticsearch以了解max_date（s）-第二个请求：使用带有单个max_dates的过滤器聚合作为过滤器来创建存储桶，然后您可以询问Elasticsearc求该存储桶中文档的总和。我可能还是想重新考虑您的数据模型，因为您已经有很多嵌套的聚合。

SophiP 2020-01-31 21:23:20

我尝试了存储桶，但不知道如何检索然后将itemNumberDone求和。我将为您提供映射和更多详细信息。

SophiP 2020-01-31 21:44:40

当您说“在应用程序端”时。您的意思是创建一个可以执行请求的后端？我想只用一个查询就没有后端（如果可能的话）。

SophiP 2020-02-03 17:16:54

谢谢，它奏效了！我通过“ _term”更改了“ _key”，并且效果很好。

kibana - 嵌套聚合的问题ElasticSearch：在最大值之后求和

相关问题

热门github