Apache InLong:一站式海量数据集成框架

RayRay
Apache InLong数据集成大数据数据传输流处理Github开源项目

Apache InLong简介

Apache InLong是一个一站式、全场景的海量数据集成框架,旨在为用户提供自动化、安全可靠的数据传输能力。InLong支持数据摄取、数据同步和数据订阅等多种功能,能够同时处理批量和流式数据,为构建实时数据分析、建模等应用提供了强大的支持。

InLong最初由腾讯开发,在过去8年中为其在线业务提供了大规模数据处理服务,每天处理超过80万亿条数据。整个平台集成了5个模块:摄取、汇聚、缓存、排序和管理,使得业务只需提供数据源、数据服务质量要求、数据落地集群和格式,就可以实现数据从源端到目标集群的持续推送,极大地满足了大数据场景下的数据上报需求。

InLong架构

InLong的主要特性

Apache InLong提供了多种强大的功能:

  1. 易用性: InLong采用SaaS服务平台模式。用户可以基于主题轻松快速地发布和订阅数据,实现数据的上报、传输和分发。

  2. 稳定性和可靠性: InLong源自实际的在线生产环境,具有处理10万亿级数据流的高性能处理能力,以及为1000亿级数据流提供高度可靠服务的能力。

  3. 功能全面: InLong支持多种类型的数据接入方法,可以与不同类型的消息队列(MQ)服务集成。它还提供基于规则的实时数据ETL和排序功能。用户可以插件化地扩展系统功能。

  4. 服务集成: InLong提供统一的系统监控和告警服务。它提供细粒度的指标以方便数据可视化。用户可以在统一的数据指标平台上查看队列的运行状态和基于主题的数据统计。用户还可以根据业务需求配置告警服务,以便在出现错误时及时获得通知。

  5. 可扩展性: InLong采用可插拔架构,允许用户基于特定协议插入模块到系统中。用户可以根据业务需求替换组件和添加功能。

InLong的适用场景

InLong适用于以下场景:

  1. 需要快速构建数据上报平台的环境
  2. 超大规模数据上报环境
  3. 需要自动对上报数据进行分类和落地的环境

用户可以通过以下方式使用InLong:

  • 通过SDK集成InLong,管理数据流
  • 使用InLong命令行工具查看和创建数据流
  • 在InLong仪表板上可视化操作

InLong支持的数据节点

InLong支持多种数据源和目标节点,包括:

  • 提取节点: Auto Push、File、Kafka、MongoDB、MQTT、MySQL、Oracle、PostgreSQL、Pulsar、Redis、SQLServer等
  • 加载节点: Auto Consumption、ClickHouse、Elasticsearch、Greenplum、HBase、HDFS、Hive、Iceberg、Hudi、Kafka、MySQL、Oracle、PostgreSQL、SQLServer、Doris、StarRocks、Kudu、Redis、OceanBase等

这些广泛的支持使InLong能够适应各种复杂的数据集成场景。

构建和部署InLong

构建InLong需要以下环境:

  • Java JDK 8
  • Maven 3.6.1+
  • Docker 19.03.1+

用户可以通过以下命令编译和安装InLong:

mvn clean install -DskipTests

InLong支持多种部署方式:

  • 单机部署
  • Docker Compose部署
  • Kubernetes部署
  • 裸机部署

这些灵活的部署选项使InLong能够适应不同的生产环境需求。

开发和贡献

InLong欢迎开发者参与贡献。开发者可以通过以下方式扩展InLong:

  • 为Agent开发插件以扩展提取数据节点
  • 为Sort开发插件以扩展数据节点
  • 为Manager开发插件以扩展数据节点
  • 为Dashboard开发插件以扩展数据节点页面

结语

Apache InLong作为一个一站式的海量数据集成框架,为用户提供了强大而灵活的数据处理能力。无论是数据摄取、同步还是订阅,InLong都能够满足用户的需求。其高性能、高可靠性和可扩展性使其成为处理大规模数据流的理想选择。随着数据规模的不断增长和实时处理需求的增加,InLong将在数据集成领域发挥越来越重要的作用。

如果您对Apache InLong感兴趣,欢迎访问项目官网了解更多信息,或者加入InLong社区,为这个开源项目贡献自己的力量。让我们共同努力,推动大数据处理技术的发展,为更多企业和开发者提供优秀的数据集成解决方案。

编辑推荐精选

音述AI

音述AI

全球首个AI音乐社区

音述AI是全球首个AI音乐社区,致力让每个人都能用音乐表达自我。音述AI提供零门槛AI创作工具,独创GETI法则帮助用户精准定义音乐风格,AI润色功能支持自动优化作品质感。音述AI支持交流讨论、二次创作与价值变现。针对中文用户的语言习惯与文化背景进行专门优化,支持国风融合、C-pop等本土音乐标签,让技术更好地承载人文表达。

QoderWork

QoderWork

阿里Qoder团队推出的桌面端AI智能体

QoderWork 是阿里推出的本地优先桌面 AI 智能体,适配 macOS14+/Windows10+,以自然语言交互实现文件管理、数据分析、AI 视觉生成、浏览器自动化等办公任务,自主拆解执行复杂工作流,数据本地运行零上传,技能市场可无限扩展,是高效的 Agentic 生产力办公助手。

lynote.ai

lynote.ai

一站式搞定所有学习需求

不再被海量信息淹没,开始真正理解知识。Lynote 可摘要 YouTube 视频、PDF、文章等内容。即时创建笔记,检测 AI 内容并下载资料,将您的学习效率提升 10 倍。

AniShort

AniShort

为AI短剧协作而生

专为AI短剧协作而生的AniShort正式发布,深度重构AI短剧全流程生产模式,整合创意策划、制作执行、实时协作、在线审片、资产复用等全链路功能,独创无限画布、双轨并行工业化工作流与Ani智能体助手,集成多款主流AI大模型,破解素材零散、版本混乱、沟通低效等行业痛点,助力3人团队效率提升800%,打造标准化、可追溯的AI短剧量产体系,是AI短剧团队协同创作、提升制作效率的核心工具。

seedancetwo2.0

seedancetwo2.0

能听懂你表达的视频模型

Seedance two是基于seedance2.0的中国大模型,支持图像、视频、音频、文本四种模态输入,表达方式更丰富,生成也更可控。

nano-banana纳米香蕉中文站

nano-banana纳米香蕉中文站

国内直接访问,限时3折

输入简单文字,生成想要的图片,纳米香蕉中文站基于 Google 模型的 AI 图片生成网站,支持文字生图、图生图。官网价格限时3折活动

扣子-AI办公

扣子-AI办公

职场AI,就用扣子

AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!

堆友

堆友

多风格AI绘画神器

堆友平台由阿里巴巴设计团队创建,作为一款AI驱动的设计工具,专为设计师提供一站式增长服务。功能覆盖海量3D素材、AI绘画、实时渲染以及专业抠图,显著提升设计品质和效率。平台不仅提供工具,还是一个促进创意交流和个人发展的空间,界面友好,适合所有级别的设计师和创意工作者。

图像生成热门AI工具AI图像AI反应堆AI工具箱AI绘画GOAI艺术字堆友相机
码上飞

码上飞

零代码AI应用开发平台

零代码AI应用开发平台,用户只需一句话简单描述需求,AI能自动生成小程序、APP或H5网页应用,无需编写代码。

Vora

Vora

免费创建高清无水印Sora视频

Vora是一个免费创建高清无水印Sora视频的AI工具

下拉加载更多