温馨提示:本文翻译自stackoverflow.com，查看原文请点击：java - Kafka streams return all records where fieldx = some value

apache-kafka-streams java spring-kafka

java - Kafka流返回所有记录，其中fieldx =某个值

发布于 2020-03-27 11:57:27

我有多个非唯一字段进入 Kafka 的记录，我们称它们为Field1 ... Field n。

我想编写一个查询以返回其中fieldx =某个值的所有记录。让我们举一个简单的例子。想象一下订单进入系统，订单中的一个字段是customerId。基本操作是获取特定客户的所有订单。如何使用Kafka Streams做到这一点？

我已经有一个KTable和所有记录的实例化视图，因此我可以遍历视图中的所有记录并挑选出我想要的记录，但这似乎效率低下且成本高昂。

我真的很想创建一个物化视图，其中该视图包含由fieldx分组的记录，但是我看不到任何实现此目的的方法。看来您只能在聚合，计数，减少等条件下使用groupby。

有关如何执行此操作的任何想法？

提问者

mbluke

被浏览

24

查看英文版

查看原文

Nishu Tayal 2019-07-05 21:41

您应该在“ customerID”上对订单流进行分组，并将所有订单汇总到一个列表中。结果KTable将具有<CustomerId, [List of Order]>类型事件。

使用交互式查询，您可以查询状态存储，

StreamsBuilder builder = new StreamsBuilder();
KStream<String, Order> orderStream = builder.stream("orders");
KTable<String,ArrayList<Order>> orderTable = orderStream
      .groupBy((key,value)-> value .get("customerId"))
      .aggregate(()-> new ArrayList<Order>(),
                 (key,val,agg)-> agg.add(val),
                  Materialized.as("customer-orders")
                  .withValueSerde(ArrayListSerde())          
       );

它将创建一个物化视图“客户订单”，您可以通过其余端点进行查询。

您可以点击以下链接将KTables公开为休息端点：

https://docs.confluent.io/current/streams/developer-guide/interactive-queries.html

Matthias J. Sax 2019-07-06 04:35:16

这种方法的问题可能是List of Orders可能会变得太大而超过最大消息大小。

Nishu Tayal 2019-07-07 05:10:02

同意，为了处理该问题，OP需要更改max.message.bytes或可能更改用于优化列表的键。我遇到了类似的问题，因此必须制作更多详细信息键以减小列表大小。

mbluke 2019-07-07 18:19:35

我必须稍微更改答案中的代码才能使其正常工作。1.我必须为groupby添加Serialized.with，以便它可以正确地反序列化订单。2.（）-> new ArrayList <Order>（）不起作用。起作用的是.aggregate（ArrayList :: new，（newKey，val，agg）-> {agg.add（val）; return agg;}，

相关问题

1

检查数据类型以构建对象的替代方法

2

是否可以从Firebase上的Google身份验证获取姓氏和名字？

3

接收TXT文件以读取和存储它们的构造方法

4

xml DSL中的 Camel 谓词示例

5

如何获得用户输入验证到我的Java计算器程序中？

6

Firebase从数据库中获取确切的孩子

7

自定义对话框的侦听器null

8

带有Logback的AWS Elastic Beanstalk应用程序日志记录

9

如何更改ArrayList中对象的显示名称

10

Flutter BLE字节到阵列的转换

热门github

1

Python tool for converting files and office documents to Markdown.

2

Run LLMs with MLX

3

基于大模型和 RAG 的智能问数系统。Text-to-SQL Generation via LLMs using RAG.

4

DeepResearchAgent is a hierarchical multi-agent system designed not only for deep research tasks but also for general-purpose task solving. The framework leverages a top-level planning agent to coordinate multiple specialized lower-level agents, enabling automated task decomposition and efficient execution across diverse and complex domains.

5

An AI Hedge Fund Team

6

A cryptocurrency trading API with more than 100 exchanges in JavaScript / TypeScript / Python / C# / PHP / Go (翻译：一个 JavaScript / Python / PHP 加密货币交易 API，支持 100 多个比特币/山寨币交易所)

7

"DeepCode: Open Agentic Coding (Paper2Code & Text2Web & Text2Backend)"

8

Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 80+ languages. (翻译：PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库，助力开发者训练出更好的模型，并应用落地。)

9

zero-shot voice conversion & singing voice conversion, with real-time support

10

AI wearables. Put it on, speak, transcribe, automatically

11

12

3D Reconstruction for all

13

PowerShell for every system! (翻译：适用于各系统的PowerShell)

14

Perplexica is an AI-powered search engine. It is an Open source alternative to Perplexity AI

15

All Algorithms implemented in Python (翻译：用 Python 实现的所有算法)