brooklin

brooklin

高可靠性多源异构数据流处理系统

Brooklin是一个分布式系统,用于在异构源系统和目标系统之间进行高可靠、高吞吐量的大规模数据流传输。它支持多租户,能同时处理数百个跨系统数据管道,并易于扩展以适配新的数据源和目标。Brooklin具备优秀的可扩展性和易操作性,支持变更数据捕获和数据引导功能。该系统已在Kafka集群镜像等实际场景中得到大规模验证。

Brooklin数据流系统分布式系统多租户Kafka集群镜像Github开源项目

= 布鲁克林

image:https://img.shields.io/github/license/linkedin/brooklin.svg[link="https://github.com/linkedin/brooklin/blob/master/LICENSE"] image:https://img.shields.io/badge/bintray-v5.1.0-blue.svg?style=popout[link="https://bintray.com/linkedin/maven/brooklin"] image:https://img.shields.io/gitter/room/linkedin/kafka.svg?style=popout[link="https://gitter.im/linkedin/brooklin"] image:https://img.shields.io/github/last-commit/linkedin/brooklin.svg?style=popout[link="https://github.com/linkedin/brooklin/commits/master"] image:https://img.shields.io/github/issues/linkedin/brooklin/bug.svg?color=orange?style=popout[link="https://github.com/linkedin/brooklin/labels/bug"]

image::images/brooklin-overview.svg[Brooklin 概览] {empty} + 布鲁克林是一个分布式系统,旨在在各种异构的源系统和目标系统之间以高可靠性和吞吐量的方式流式传输数据。为了支持多租户,布鲁克林可以同时支撑不同系统上的数百条数据管线,并且可以轻松地扩展以支持新的源和目标。

== 显著特征

  • 可扩展到任何源和目标

** 布鲁克林提供了一个灵活的 API,可以扩展以支持各种各样的源和目标系统。它不局限于单一类型的源或目标系统。 ** 源和目标系统可以自由混合搭配。它们不必是相同的。

  • 可扩展性 ** 布鲁克林支持创建任意数量的并发和独立处理的数据流,这样一个流中的错误不会影响其他流。 ** 布鲁克林的核心实现和 API 都支持分区数据流。 ** 布鲁克林可以部署在一个机器集群中(横向扩展)来支持任意多的数据流。

  • 易于操作和管理 ** 布鲁克林提供了一个 REST 端点来管理数据流,除了基本的CRUD操作外,还提供了丰富的其他操作(如暂停恢复)。 ** 布鲁克林还公开了一个诊断 REST 端点,可用于按需查询数据流的状态。

  • 在 Kafka 上经受过大规模考验 ** 虽然它不仅限于任何特定系统,但布鲁克林提供了以高可靠性大规模读写 Kafka 海量数据的功能。你可以在 <<Use cases>> 部分了解更多。

  • 支持变更数据捕获并启动 ** 布鲁克林支持传播来自数据存储(如关系数据库、键值存储等)的 https://en.wikipedia.org/wiki/Change_data_capture[变更数据捕获]事件。 ** 布鲁克林还支持在传播变更事件之前先流式传输现有数据的快照。

== 使用案例 === 镜像 Kafka 集群

  • 多租户

单个布鲁克林集群可用于镜像多个 Kafka 集群间的数据。

  • 跨分区的故障隔离

一个坏分区不会影响整个 Kafka 主题。镜像会继续进行其他健康分区。

  • 使用正则表达式进行主题白名单

可以使用正则表达式模式匹配主题名称来选择要镜像的主题。

  • 暂停和恢复单个分区

通过其 https://github.com/linkedin/brooklin/wiki/Brooklin-Architecture#rest-endpoints[数据流管理服务 (DMS)],布鲁克林公开了 REST API,允许更精细地控制复制管线,例如暂停和恢复 Kafka 主题的单个分区。

查看 https://github.com/linkedin/brooklin/wiki/mirroring-kafka-clusters[镜像 Kafka 集群]了解更多关于使用布鲁克林镜像 Kafka 集群的信息。

=== 变更数据捕获

=== 流处理桥

== 试用布鲁克林 欢迎查看我们的 https://github.com/linkedin/brooklin/wiki/test-driving-brooklin[分步教程],了解如何在本地运行几个示例场景中的布鲁克林。

== 文档 https://github.com/linkedin/Brooklin/wiki[布鲁克林 Wiki 页面]

== 社区

== 贡献

== 许可证 版权所有 (c) LinkedIn Corporation。保留所有权利。 根据 https://github.com/linkedin/brooklin/blob/master/LICENSE[BSD 2-Clause] 许可证许可。

编辑推荐精选

音述AI

音述AI

全球首个AI音乐社区

音述AI是全球首个AI音乐社区,致力让每个人都能用音乐表达自我。音述AI提供零门槛AI创作工具,独创GETI法则帮助用户精准定义音乐风格,AI润色功能支持自动优化作品质感。音述AI支持交流讨论、二次创作与价值变现。针对中文用户的语言习惯与文化背景进行专门优化,支持国风融合、C-pop等本土音乐标签,让技术更好地承载人文表达。

QoderWork

QoderWork

阿里Qoder团队推出的桌面端AI智能体

QoderWork 是阿里推出的本地优先桌面 AI 智能体,适配 macOS14+/Windows10+,以自然语言交互实现文件管理、数据分析、AI 视觉生成、浏览器自动化等办公任务,自主拆解执行复杂工作流,数据本地运行零上传,技能市场可无限扩展,是高效的 Agentic 生产力办公助手。

lynote.ai

lynote.ai

一站式搞定所有学习需求

不再被海量信息淹没,开始真正理解知识。Lynote 可摘要 YouTube 视频、PDF、文章等内容。即时创建笔记,检测 AI 内容并下载资料,将您的学习效率提升 10 倍。

AniShort

AniShort

为AI短剧协作而生

专为AI短剧协作而生的AniShort正式发布,深度重构AI短剧全流程生产模式,整合创意策划、制作执行、实时协作、在线审片、资产复用等全链路功能,独创无限画布、双轨并行工业化工作流与Ani智能体助手,集成多款主流AI大模型,破解素材零散、版本混乱、沟通低效等行业痛点,助力3人团队效率提升800%,打造标准化、可追溯的AI短剧量产体系,是AI短剧团队协同创作、提升制作效率的核心工具。

seedancetwo2.0

seedancetwo2.0

能听懂你表达的视频模型

Seedance two是基于seedance2.0的中国大模型,支持图像、视频、音频、文本四种模态输入,表达方式更丰富,生成也更可控。

nano-banana纳米香蕉中文站

nano-banana纳米香蕉中文站

国内直接访问,限时3折

输入简单文字,生成想要的图片,纳米香蕉中文站基于 Google 模型的 AI 图片生成网站,支持文字生图、图生图。官网价格限时3折活动

扣子-AI办公

扣子-AI办公

职场AI,就用扣子

AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!

堆友

堆友

多风格AI绘画神器

堆友平台由阿里巴巴设计团队创建,作为一款AI驱动的设计工具,专为设计师提供一站式增长服务。功能覆盖海量3D素材、AI绘画、实时渲染以及专业抠图,显著提升设计品质和效率。平台不仅提供工具,还是一个促进创意交流和个人发展的空间,界面友好,适合所有级别的设计师和创意工作者。

图像生成AI工具AI反应堆AI工具箱AI绘画GOAI艺术字堆友相机AI图像热门
码上飞

码上飞

零代码AI应用开发平台

零代码AI应用开发平台,用户只需一句话简单描述需求,AI能自动生成小程序、APP或H5网页应用,无需编写代码。

Vora

Vora

免费创建高清无水印Sora视频

Vora是一个免费创建高清无水印Sora视频的AI工具

下拉加载更多