当前位置：移动技术网 > IT编程>开发语言>Java > Java kafka如何实现自定义分区类和拦截器

Java kafka如何实现自定义分区类和拦截器

2020年06月14日 | 移动技术网IT编程 | 我要评论

生产者发送到对应的分区有以下几种方式：

（1）指定了patition，则直接使用；(可以查阅对应的java api, 有多种参数)

（2）未指定patition但指定key，通过对key的value进行hash出一个patition；

（3）patition和key都未指定，使用轮询选出一个patition。

但是kafka提供了，自定义分区算法的功能,由业务手动实现分布：

1、实现一个自定义分区类，custompartitioner实现partitioner

import org.apache.kafka.clients.producer.partitioner;
import org.apache.kafka.common.cluster;

import java.util.map;

public class custompartitioner implements partitioner {

  /**
   *
   * @param topic 当前的发送的topic
   * @param key  当前的key值
   * @param keybytes 当前的key的字节数组
   * @param value 当前的value值
   * @param valuebytes 当前的value的字节数组
   * @param cluster
   * @return
   */
  @override
  public int partition(string topic, object key, byte[] keybytes, object value, byte[] valuebytes, cluster cluster) {
    //这边根据返回值就是分区号, 这边就是固定发送到三号分区
    return 3;
  }

  @override
  public void close() {

  }
  @override
  public void configure(map<string, ?> configs) {

  }

}

2、producer配置文件指定，具体的分区类

// 具体的分区类
props.put(producerconfig.partitioner_class_config, "kafka.custompartitioner");

技巧：可以使用producerconfig中提供的配置producerconfig

kafka producer拦截器

拦截器(interceptor)是在kafka 0.10版本被引入的。

interceptor使得用户在消息发送前以及producer回调逻辑前有机会对消息做一些定制化需求，比如修改消息等。

许用户指定多个interceptor按序作用于同一条消息从而形成一个拦截链(interceptor chain)。

所使用的类为：

org.apache.kafka.clients.producer.producerinterceptor

我们可以编码测试下：

1、定义消息拦截器，实现消息处理(可以是加时间戳等等，unid等等。)

import org.apache.kafka.clients.producer.producerinterceptor;
import org.apache.kafka.clients.producer.producerrecord;
import org.apache.kafka.clients.producer.recordmetadata;

import java.util.map;
import java.util.uuid;

public class messageinterceptor implements producerinterceptor<string, string> {

  @override
  public void configure(map<string, ?> configs) {
    system.out.println("这是messageinterceptor的configure方法");
  }

  /**
   * 这个是消息发送之前进行处理
   *
   * @param record
   * @return
   */
  @override
  public producerrecord<string, string> onsend(producerrecord<string, string> record) {
    // 创建一个新的record，把uuid入消息体的最前部
    system.out.println("为消息添加uuid");
    return new producerrecord(record.topic(), record.partition(), record.timestamp(), record.key(),
        uuid.randomuuid().tostring().replace("-", "") + "," + record.value());
  }

  /**
   * 这个是生产者回调函数调用之前处理
   * @param metadata
   * @param exception
   */
  @override
  public void onacknowledgement(recordmetadata metadata, exception exception) {
    system.out.println("messageinterceptor拦截器的onacknowledgement方法");
  }

  @override
  public void close() {
    system.out.println("messageinterceptor close 方法");
  }
}

2、定义计数拦截器

import java.util.map;
import org.apache.kafka.clients.producer.producerinterceptor;
import org.apache.kafka.clients.producer.producerrecord;
import org.apache.kafka.clients.producer.recordmetadata;

public class counterinterceptor implements producerinterceptor<string, string>{
  private int errorcounter = 0;
  private int successcounter = 0;

  @override
  public void configure(map<string, ?> configs) {
    system.out.println("这是counterinterceptor的configure方法");
  }

  @override
  public producerrecord<string, string> onsend(producerrecord<string, string> record) {
    system.out.println("counterinterceptor计数过滤器不对消息做任何操作");
    return record;
  }

  @override
  public void onacknowledgement(recordmetadata metadata, exception exception) {
    // 统计成功和失败的次数
    system.out.println("counterinterceptor过滤器执行统计失败和成功数量");
    if (exception == null) {
      successcounter++;
    } else {
      errorcounter++;
    }
  }

  @override
  public void close() {
    // 保存结果
    system.out.println("successful sent: " + successcounter);
    system.out.println("failed sent: " + errorcounter);
  }
}

3、producer客户端：

import org.apache.kafka.clients.producer.*;

import java.util.arraylist;
import java.util.list;
import java.util.properties;

public class producer1 {
  public static void main(string[] args) throws exception {
    properties props = new properties();
    // kafka服务端的主机名和端口号
    props.put("bootstrap.servers", "localhost:9092");
    // 等待所有副本节点的应答
    props.put("acks", "all");
    // 消息发送最大尝试次数
    props.put("retries", 0);
    // 一批消息处理大小
    props.put("batch.size", 16384);
    // 请求延时，可能生产数据太快了
    props.put("linger.ms", 1);
    // 发送缓存区内存大小，数据是先放到生产者的缓冲区
    props.put("buffer.memory", 33554432);
    // key序列化
    props.put("key.serializer", "org.apache.kafka.common.serialization.stringserializer");
    // value序列化
    props.put("value.serializer", "org.apache.kafka.common.serialization.stringserializer");
    // 具体的分区类
    props.put(producerconfig.partitioner_class_config, "kafka.custompartitioner");
    //定义拦截器
    list<string> interceptors = new arraylist<>();
    interceptors.add("kafka.messageinterceptor");
    interceptors.add("kafka.counterinterceptor");
    props.put(producerconfig.interceptor_classes_config, interceptors);

    producer<string, string> producer = new kafkaproducer<>(props);
    for (int i = 0; i < 1; i++) {
      producer.send(new producerrecord<string, string>("test_0515", i + "", "xxx-" + i), new callback() {
        public void oncompletion(recordmetadata recordmetadata, exception e) {
          system.out.println("这是producer回调函数");
        }
      });
    }
    /*system.out.println("现在执行关闭producer");
    producer.close();*/
    producer.close();
  }
}

总结，我们可以知道拦截器链各个方法的执行顺序，假如有a、b拦截器，在一个拦截器链中：

(1)执行a的configure方法，执行b的configure方法

(2)执行a的onsend方法，b的onsend方法

(3)生产者发送完毕后，执行a的onacknowledgement方法，b的onacknowledgement方法。

(4)执行producer自身的callback回调函数。

(5)执行a的close方法，b的close方法。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持移动技术网。

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

springcloud中feign调用处理mybatis-plus Ipage反序列化问题。

通过feign接口返回的分页列表IPage，出现报错，具体报错内容如下：feign.codec.DecodeEx... [阅读全文]
大数据云计算——Azkaban组件

什么是 AzkabanAzkaban 是由 Linkedin 公司推出的一个批量工作流任务调度器，主要用于在一个... [阅读全文]
荐聊聊数据库表结构设计心得

本文讨论是一般表的设计，有一定的普遍性和通用性，当然对于特殊性的考量则不在本文讨论之列。自增 idJava 层的... [阅读全文]
SpringCloud各个组件最强总结

一、概念1.1 什么是Spring Cloud？Spring Cloud就是微服务系统架构的一站式解决方案，在平... [阅读全文]
微服务之SpringCloud

# 微服务介绍将一个原本独立的系统拆分成多个小型服务，这些小型服务都在各自独立的进程中运行，并使用轻量级机制通信... [阅读全文]
劝退记：如你如我，平庸且不甘 | 年中总结

关于我前端劝退师，最近也叫前端失业师。没能力没学历没背景，三无前端。工作第四年，想和优秀的一批人竞争，永远和自己... [阅读全文]
Flume 史上最全面的大数据学习第十篇（一）别再说不知道flume是什么了

昨天没有增加小粉丝，我反思了一下自己，是不是我写的东西太过枯燥了呀！挺难受的！算了还是不说了，每天都是美好的一天... [阅读全文]
一直想学习Java网络编程，却不知道怎么入门？

其实，我刚学习Netty的时候，也是很迷茫的，直到有一天，一个同事收到了阿里的offer，他要去阿里做中台了，临... [阅读全文]
SpringCloud相关笔记一系统架构的演变(一)

SpringCloudSpringBoot 四种属性注入小结1.@Autowired注入2.构造方法注入3.@B... [阅读全文]
面试官：说说Kafka控制器事件处理全流程

前言大家好，我是 yes。这是Kafka源码分析第四篇文章，今天来说说 Kafka控制器，即 Kafka Con... [阅读全文]

网友评论


验证码：

Java kafka如何实现自定义分区类和拦截器

2020年06月14日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论