kafka

kafka

开源分布式事件流平台

Apache Kafka是一个开源的分布式事件流平台,为数据管道、流分析、数据集成和关键任务应用提供支持。它采用发布/订阅模式,具有高吞吐量、可扩展性和容错能力。Kafka支持多种编程语言,提供完整的开发工具链。开发者可在本地或集群环境中运行Kafka,进行各类测试。该项目致力于社区建设,欢迎各方贡献。

Apache Kafka分布式消息系统JavaScala构建测试Github开源项目

Apache Kafka

有关项目的详细信息,请参阅我们的网站

您需要安装Java

我们使用Java 8、11、17和21来构建和测试Apache Kafka。我们在javac和scalac中将release参数设置为8,以确保生成的二进制文件与Java 8或更高版本兼容(与用于编译的Java版本无关)。自Apache Kafka 3.0以来,项目范围内的Java 8支持已被弃用,自Apache Kafka 3.7以来,代理和工具的Java 11支持已被弃用,计划在Apache Kafka 4.0中移除这两者(有关更多详细信息,请参阅KIP-750KIP-1013)。

支持Scala 2.12和2.13,默认使用2.13。自Apache Kafka 3.0以来,Scala 2.12支持已被弃用,并将在Apache Kafka 4.0中移除(有关更多详细信息,请参阅KIP-751)。有关如何使用特定Scala版本或所有支持的Scala版本,请参见下文。

构建jar包并运行

./gradlew jar

按照https://kafka.apache.org/quickstart中的说明操作

构建源代码jar包

./gradlew srcJar

构建聚合javadoc

./gradlew aggregatedJavadoc

构建javadoc和scaladoc

./gradlew javadoc
./gradlew javadocJar # 为每个模块构建javadoc jar包
./gradlew scaladoc
./gradlew scaladocJar # 为每个模块构建scaladoc jar包
./gradlew docsJar # 为每个模块构建javadoc和scaladoc jar包(如适用)

运行单元/集成测试

./gradlew test # 运行单元和集成测试
./gradlew unitTest
./gradlew integrationTest

在代码没有更改的情况下强制重新运行测试

./gradlew test --rerun
./gradlew unitTest --rerun
./gradlew integrationTest --rerun

运行特定的单元/集成测试

./gradlew clients:test --tests RequestResponseTest

重复运行特定的单元/集成测试

I=0; while ./gradlew clients:test --tests RequestResponseTest --rerun --fail-fast; do (( I=$I+1 )); echo "Completed run: $I"; sleep 1; done

运行单元/集成测试中的特定测试方法

./gradlew core:test --tests kafka.api.ProducerFailureHandlingTest.testCannotSendToInternalTopic
./gradlew clients:test --tests org.apache.kafka.clients.MetadataTest.testTimeToNextUpdate

运行带有log4j输出的特定单元/集成测试

默认情况下,测试过程中只会输出少量日志。您可以通过修改模块的src/test/resources目录中的log4j.properties文件来调整它。

例如,如果您想查看clients项目测试的更多日志,可以修改clients/src/test/resources/log4j.properties中的这一行log4j.logger.org.apache.kafka=INFO,然后运行:

./gradlew cleanTest clients:test --tests NetworkClientTest   

您应该能看到clients/build/test-results/test目录下文件中的INFO级别日志。

指定测试重试

默认情况下,每个失败的测试会重试一次,每次测试运行最多重试五次。测试会在测试任务结束时重试。通过以下方式调整这些参数:

./gradlew test -PmaxTestRetries=1 -PmaxTestRetryFailures=5

更多详细信息,请参阅测试重试Gradle插件

生成测试覆盖率报告

为整个项目生成覆盖率报告:

./gradlew reportCoverage -PenableTestCoverage=true -Dorg.gradle.parallel=false

为单个模块生成覆盖率报告,例如:

./gradlew clients:reportCoverage -PenableTestCoverage=true -Dorg.gradle.parallel=false

构建二进制发布的gzip压缩tar包

./gradlew clean releaseTarGz

发布文件可以在./core/build/distributions/目录中找到。

构建自动生成的消息

有时在切换分支时,只需要重新构建RPC自动生成的消息数据,因为它们可能会由于代码更改而失败。您可以直接运行:

./gradlew processMessages processTestMessages

在KRaft模式下运行Kafka代理

使用编译后的文件:

KAFKA_CLUSTER_ID="$(./bin/kafka-storage.sh random-uuid)"
./bin/kafka-storage.sh format -t $KAFKA_CLUSTER_ID -c config/kraft/server.properties
./bin/kafka-server-start.sh config/kraft/server.properties

使用docker镜像:

docker run -p 9092:9092 apache/kafka:3.7.0

在ZooKeeper模式下运行Kafka代理

使用编译后的文件:

./bin/zookeeper-server-start.sh config/zookeeper.properties
./bin/kafka-server-start.sh config/server.properties

由于ZooKeeper模式已被弃用,计划在Apache Kafka 4.0中移除,docker镜像仅支持在KRaft模式下运行

清理构建

./gradlew clean

使用可用的Scala版本之一(2.12.x或2.13.x)运行任务

请注意,如果使用2.13.x以外的版本构建jar包,您需要在bin/kafka-run-class.sh中设置SCALA_VERSION变量或更改它以运行快速启动。

您可以传递主版本号(如2.12)或完整版本号(如2.12.7):

./gradlew -PscalaVersion=2.12 jar
./gradlew -PscalaVersion=2.12 test
./gradlew -PscalaVersion=2.12 releaseTarGz

使用默认启用的所有Scala版本运行任务

调用gradlewAll脚本,后跟任务:

./gradlewAll test
./gradlewAll jar
./gradlewAll releaseTarGz

为特定项目运行任务

适用于coreexamplesclients

./gradlew core:jar
./gradlew core:test

Streams有多个子项目,但您可以运行所有测试:

./gradlew :streams:testAll

列出所有gradle任务

./gradlew tasks

构建IDE项目

请注意,这并非严格必要(例如,IntelliJ IDEA对Gradle项目有很好的内置支持)。

./gradlew eclipse
./gradlew idea

eclipse任务已配置为使用${project_dir}/build_eclipse作为Eclipse的构建目录。Eclipse的默认构建目录(${project_dir}/bin)与Kafka的脚本目录冲突,我们不使用Gradle的构建目录以避免已知的此配置问题。

将所有Scala版本和所有项目的jar包发布到maven

推荐的命令是:

./gradlewAll publish

为了向后兼容,以下命令也可以工作:

./gradlewAll uploadArchives

请注意,要使其正常工作,您应该创建/更新${GRADLE_USER_HOME}/gradle.properties(通常是~/.gradle/gradle.properties)并分配以下变量

mavenUrl=
mavenUsername=
mavenPassword=
signing.keyId=
signing.password=
signing.secretKeyRingFile=

将streams快速启动原型制品发布到maven

对于Streams原型项目,不能使用gradle上传到maven;相反,需要在quickstart文件夹中调用mvn deploy命令:

cd streams/quickstart
mvn deploy

请注意,要使其正常工作,您应该创建/更新用户maven设置(通常是${USER_HOME}/.m2/settings.xml)以分配以下变量

<settings xmlns="http://maven.apache.org/SETTINGS/1.0.0"
   xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
   xsi:schemaLocation="http://maven.apache.org/SETTINGS/1.0.0
                       https://maven.apache.org/xsd/settings-1.0.0.xsd">
...                           
<servers>
   ...
   <server>
      <id>apache.snapshots.https</id>
      <username>${maven_username}</username>
      <password>${maven_password}</password>
   </server>
   <server>
      <id>apache.releases.https</id>
      <username>${maven_username}</username>
      <password>${maven_password}</password>
    </server>
    ...
 </servers>
 ...

将所有jar包安装到本地Maven仓库

推荐的命令用于同时构建Scala 2.12和2.13版本是:

./gradlewAll publishToMavenLocal

为了向后兼容,以下命令也可以工作:

./gradlewAll install

将特定项目安装到本地Maven仓库

./gradlew -PskipSigning=true :streams:publishToMavenLocal

如果需要,您可以使用-PscalaVersion=2.13指定Scala版本。

构建测试jar包

./gradlew testJar

运行代码质量检查

我们定期运行两种代码质量分析工具:spotbugs和checkstyle。

Checkstyle

Checkstyle在Kafka中强制执行一致的编码风格。 您可以使用以下命令运行checkstyle:

./gradlew checkstyleMain checkstyleTest spotlessCheck

checkstyle警告将在子项目构建目录的reports/checkstyle/reports/main.htmlreports/checkstyle/reports/test.html文件中找到。它们也会打印到控制台。如果Checkstyle失败,构建将失败。

请注意,./gradlew spotlessCheck目前在Java 21上存在问题(参见https://github.com/diffplug/spotless/pull/1920),因此请确保使用JDK 11或17运行此命令

Spotless

导入顺序是静态检查的一部分。在提交拉取请求之前,请调用spotlessApply(需要JDK 11+)来优化Java代码的导入。

./gradlew spotlessApply

请注意,./gradlew spotlessApply目前在Java 21上存在问题(参见https://github.com/diffplug/spotless/pull/1920),因此请确保使用JDK 11或17运行此命令

Spotbugs

Spotbugs使用静态分析来查找代码中的错误。 您可以使用以下命令运行spotbugs:

./gradlew spotbugsMain spotbugsTest -x test

spotbugs警告将在子项目构建目录的reports/spotbugs/main.htmlreports/spotbugs/test.html文件中找到。使用-PxmlSpotBugsReport=true生成XML报告而不是HTML报告。

JMH微基准测试

我们使用JMH来编写微基准测试,以在JVM中产生可靠的结果。

有关如何运行微基准测试的详细信息,请参阅jmh-benchmarks/README.md

依赖分析

gradle的依赖调试文档提到可以使用dependenciesdependencyInsight任务来调试根项目或单个子项目的依赖关系。

或者,使用allDepsallDepInsight任务递归遍历所有子项目:

./gradlew allDeps

./gradlew allDepInsight --configuration runtimeClasspath --dependency com.fasterxml.jackson.core:jackson-databind

这些任务接受与内置变体相同的参数。

确定是否有任何依赖可以更新

./gradlew dependencyUpdates

常用构建选项

以下选项应使用-P开关设置,例如./gradlew -PmaxParallelForks=1 test

  • commitId:设置构建提交ID,因为.git/HEAD可能由于构建目的而添加了本地提交而不正确。
  • mavenUrl:设置maven部署仓库的URL(可以使用file://path/to/repo指向本地仓库)。
  • maxParallelForks:并行启动的最大测试进程数。默认为JVM可用的处理器数量。
  • maxScalacThreads:scalac后端的最大工作线程数。默认为8和JVM可用处理器数量中的较低值。该值必须在1到16(包括)之间。
  • ignoreFailures:忽略junit的测试失败。
  • showStandardStreams:在控制台上显示测试JVM的标准输出和标准错误。
  • skipSigning:跳过制品签名。
  • testLoggingEvents:要记录的单元测试事件,用逗号分隔。例如./gradlew -PtestLoggingEvents=started,passed,skipped,failed test
  • xmlSpotBugsReport:启用spotBugs的XML报告。这也会禁用HTML报告,因为一次只能启用一种。
  • maxTestRetries:失败测试用例的最大重试次数。
  • maxTestRetryFailures:在禁用后续测试重试之前的最大测试失败次数。
  • enableTestCoverage:启用测试覆盖率插件和任务,包括跟踪覆盖率所需的类的字节码增强。请注意,这会在运行测试时引入一些开销,因此默认情况下是禁用的(开销因情况而异,但15-20%是一个合理的估计)。
  • keepAliveMode:配置Gradle编译守护进程的保活模式 - 重用可以改善启动时间。值应为daemonsession之一(默认为daemon)。daemon保持守护进程活动直到显式停止,而session保持它活动直到构建会话结束。目前这只影响Scala编译器,请参阅https://github.com/gradle/gradle/pull/21034 了解尝试对Java编译器执行相同操作的PR。
  • scalaOptimizerMode:配置scala编译器的优化行为,值应为nonemethodinline-kafkainline-scala之一(默认为inline-kafka)。none是scala编译器默认值,只消除不可达代码。method还包括方法内优化。inline-kafka添加了kafka包内方法的内联。最后,inline-scala还包括scala库内方法的内联(这避免了Option.exists等方法的lambda分配)。inline-scala只有在编译时和运行时Scala库版本相同时才安全。由于我们不能保证所有情况都是这样(例如,用户可能依赖kafka jar进行集成测试,其中可能包含不同版本的scala库),因此我们默认不启用它。有关更多详细信息,请参阅https://www.lightbend.com/blog/scala-inliner-optimizer。

运行系统测试

请参阅tests/README.md

在Vagrant中运行

请参阅vagrant/README.md

贡献

Apache Kafka致力于建设社区;我们欢迎任何想法或补丁。您可以通过Apache邮件列表联系我们。

要贡献,请按照以下说明操作:

编辑推荐精选

Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
问小白

问小白

全能AI智能助手,随时解答生活与工作的多样问题

问小白,由元石科技研发的AI智能助手,快速准确地解答各种生活和工作问题,包括但不限于搜索、规划和社交互动,帮助用户在日常生活中提高效率,轻松管理个人事务。

热门AI助手AI对话AI工具聊天机器人
Transly

Transly

实时语音翻译/同声传译工具

Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

AI办公办公工具AI工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图热门
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

热门AI开发模型训练AI工具讯飞星火大模型智能问答内容创作多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

热门AI辅助写作AI工具讯飞绘文内容运营AI创作个性化文章多平台分发AI助手
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

openai-agents-python

openai-agents-python

OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。

openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。

下拉加载更多