Apache Kafka 是一個(gè)分布式流處理平臺(tái),也是一種高性能、可擴(kuò)展的消息系統(tǒng)。它在處理海量數(shù)據(jù)時(shí)表現(xiàn)出色,而且易于使用和部署。
Apache Kafka 是一種分布式發(fā)布-訂閱消息系統(tǒng),由 LinkedIn 公司開發(fā)。它具有高性能、高并發(fā)、可擴(kuò)展等特點(diǎn),適合用于大型實(shí)時(shí)數(shù)據(jù)處理場景。Kafka 的核心概念包括:
1、消息(Message):Kafka 中的基本數(shù)據(jù)單元,由一個(gè)鍵和一個(gè)值組成。
2、生產(chǎn)者(Producer):向 Kafka 中寫入消息的程序。
3、消費(fèi)者(Consumer):從 Kafka 中讀取消息的程序。
4、主題(Topic):消息的類別或者主要內(nèi)容,每個(gè)主題可以劃分為多個(gè)分區(qū)。
5、分區(qū)(Partition):主題的一個(gè)子集,每個(gè)分區(qū)都有自己的偏移量。
6、偏移量(Offset):表示消費(fèi)者在某個(gè)主題中讀取的位置。
Kafka 生產(chǎn)者用于向 Kafka 集群發(fā)送消息。在使用 Kafka 生產(chǎn)者時(shí),需要指定消息的主題和消息的鍵和值,然后將消息發(fā)送到 Kafka 集群中。下面是使用 Kafka 生產(chǎn)者發(fā)送消息的代碼示例:
Properties props = new Properties();props.put("bootstrap.servers", "localhost:9092");props.put("acks", "all");props.put("retries", 0);props.put("batch.size", 16384);props.put("linger.ms", 1);props.put("buffer.memory", 33554432);props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");Producer<String, String> producer = new KafkaProducer<>(props);String topic = "test";String key = "key1";String value = "Hello, Kafka!";ProducerRecord<String, String> record = new ProducerRecord<>(topic, key, value);try { RecordMetadata metadata = producer.send(record).get(); System.out.printf("Sent record with key='%s' and value='%s' to partition=%d, offset=%d/n", key, value, metadata.partition(), metadata.offset());} catch (Exception ex) { ex.printStackTrace();} finally { producer.close();}
在上述代碼中,我們使用了 KafkaProducer 類創(chuàng)建了一個(gè)生產(chǎn)者實(shí)例,并指定了各種配置參數(shù)。其中,bootstrap.servers 參數(shù)用于指定 Kafka 集群的地址,key.serializer 和 value.serializer 則用于指定消息鍵和值的序列化方式。然后,我們將消息的主題、鍵和值包裝成一個(gè) ProducerRecord 對象,并使用 send() 方法發(fā)送到 Kafka 集群中。最后,我們使用 get() 方法獲取發(fā)送消息的元數(shù)據(jù),并輸出發(fā)送結(jié)果。
Kafka 消費(fèi)者用于從 Kafka 集群中讀取消息,并進(jìn)行相應(yīng)的處理。在使用 Kafka 消費(fèi)者時(shí),需要指定要消費(fèi)的主題和在主題中的位置(也就是偏移量)。下面是使用 Kafka 消費(fèi)者消費(fèi)消息的代碼示例:
Properties props = new Properties();props.put("bootstrap.servers", "localhost:9092");props.put("group.id", "test-group");props.put("enable.auto.commit", "true");props.put("auto.commit.interval.ms", "1000");props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");KafkaConsumer<String, String> consumer = new KafkaConsumer<>(props);String topic = "test";consumer.subscribe(Collections.singletonList(topic));while (true) { ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100)); for (ConsumerRecord<String, String> record : records) { System.out.printf("Received record with key='%s' and value='%s' from partition=%d, offset=%d/n", record.key(), record.value(), record.partition(), record.offset()); }}//consumer.close();
在上述代碼中,我們使用 KafkaConsumer 類創(chuàng)建了一個(gè)消費(fèi)者實(shí)例,并指定了各種配置參數(shù)。其中,bootstrap.servers 和 group.id 參數(shù)與生產(chǎn)者類似,而 enable.auto.commit 和 auto.commit.interval.ms 則用于自動(dòng)提交偏移量。然后,我們使用 subscribe() 方法訂閱指定的主題并進(jìn)入輪詢狀態(tài),通過 poll() 方法獲取最新的消息記錄。最后,我們輸出消息記錄的鍵、值、所在的分區(qū)和偏移量。
在實(shí)際生產(chǎn)環(huán)境中,Kafka 的可靠性非常重要。為了確保消息能夠被有效地處理和傳輸,在 Kafka 中提供了多種可靠性保證機(jī)制。
1、消息復(fù)制(Message Replication) Kafka 通過將每條消息復(fù)制到多個(gè)副本來保證消息的可靠性。當(dāng)其中一個(gè) broker 處理失敗時(shí),其他 broker 可以接替它的工作,確保消息仍然可以被正確地處理。
2、優(yōu)先副本選舉(Preferred Replica Election) Kafka 通過選舉一個(gè)或多個(gè)優(yōu)先副本來增加集群的可靠性。這些優(yōu)先副本可以優(yōu)先處理請求,并在其他副本出現(xiàn)故障時(shí)接替它們的工作。
3、ISR(In-Sync Replica)機(jī)制 Kafka 中的 ISR 機(jī)制用于確保所有的副本都保持同步。只有處于 ISR 中的 broker 才能夠與生產(chǎn)者進(jìn)行通信,也才能夠被選為新的 leader,從而保證消息的可靠性和一致性。
4、偏移量管理(Offset Management) Kafka 提供了不同的偏移量管理方式,包括自動(dòng)提交偏移量、手動(dòng)提交偏移量和定期提交偏移量。每種管理方式都有其特點(diǎn)和適用場景。
Apache Kafka 是一種高性能、可擴(kuò)展的消息系統(tǒng),適用于大規(guī)模實(shí)時(shí)數(shù)據(jù)處理場景。在 Java 中,可以使用 Kafka 生產(chǎn)者和消費(fèi)者 API 構(gòu)建可靠的消息系統(tǒng)。同時(shí),Kafka 還提供了多種可靠性保證機(jī)制,以確保消息能夠被有效地處理和傳輸。
本文鏈接:http://www.tebozhan.com/showinfo-26-14581-0.html使用Java與Apache Kafka構(gòu)建可靠的消息系統(tǒng)
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com