
数据工程师成长路线图及关键技能学习资源
该项目提供了一个系统化的数据工程学习路线图,涵盖编程语言、SQL、数据库、数据处理、集群计算、数据可视化等核心领域。路线图内容丰富,包括Linux系统、数据结构与算法、数据库基础、SQL、NoSQL、数据处理、集群计算、数据仓库、数据可视化等。同时涵盖了CI/CD、云计算、机器学习等相关技术,为构建完整的数据工程知识体系提供了全面指导。它推荐了各方面的学习资源和实用工具,旨在帮助学习者全面掌握数据工程技能,而非仅追随热点。路线图适合不同水平的学习者,为数据工程职业发展提供了清晰指导。
本路线图的目的是让您了解整体情况。当您对下一步学习内容感到困惑时,路线图会为您提供指导,而不是鼓励您选择当下流行和热门的内容。您应该对为什么某些工具在某些情况下比其他工具更合适有一定的了解,并记住流行和热门并不总是意味着最适合该工作。
如果您喜欢或正在使用这个项目来学习或开始您的解决方案,请给它一个星星。谢谢!

Linux 学习主要分为两个部分:系统管理和 Shell 脚本编程。您可以根据自己的偏好安排学习深度
有许多免费的在线SQL入门资源可供使用。也有一些付费资源我推荐给初学者,它们非常有效,我认为值得花钱购买。
几点说明:
Portnov计算机学校"SQL初学者教程" 这是一个微课程(总共约4小时),据说非常不错。 链接:
SQL问题与解决方案 - 互动书籍 "...学生可以提问并得到答案,即使这些 答案在教科书中找不到。在某种程度上,互动教科书旨在替代教师/顾问,这在我们看来是在远程学习系统中使用此类教材的必要条件。"
艰难地学习SQL "本书将教你80%你可能需要有效使用的SQL知识,同时还会介绍数据建模的概念。如果你因为不懂SQL而在构建网络、桌面或移动应用时遇到困难,那么这本书就是为你准备的。它是为没有数据库、编程或SQL知识的人编写的,但至少了解一门编程语言会有帮助。"
GalaXQL "GalaXQL是一个有趣的SQL教程,其中数据库是一个以3D方式呈现的星系。观察星系如何随着你的SQL命令创建、修改和销毁天体而变化。还有什么比这更有趣的呢?"
PostgreSQL教程 "我们开发PostgreSQL教程是为了展示PostgreSQL独特的功能,这些功能使它成为世界上最先进的开源数据库管理系统。此外,我们还将向你展示如何利用这些功能使你的应用更快、更安全。"
深入浅出SQL 这是一个我多年前学习过的优秀初学者资源。如果你真的想从最基础开始学习,我强烈建议你购买一本。这是一本大书,但字体很大,有练习和图片等。大约需要1-2天就能看完,分散开来可能需要一周左右。 "你的数据是否让你感到沮丧?你的表格是否一团糟?好吧,我们有工具来教你如何驯服你的数据库。《深入浅出SQL》运用神经生物学、认知科学和学习理论的最新研究,创造了一种多感官的SQL学习体验,采用视觉丰富的格式,专为你的大脑工作方式而设计,而不是让你昏昏欲睡的文本密集型方法。 也许你已经写过一些简单的SQL查询来与数据库交互。但现在你想要更多,你想真正深入挖掘这些数据库并处理你的数据。《深入浅出SQL》将向你展示SQL的基础知识,以及如何真正利用它。我们将带你踏上一段语言之旅,从基本的INSERT语句和SELECT查询,到hardcore的数据库操作,如索引、连接和事务。我们都知道"数据就是力量" - 但我们会向你展示如何"掌控你的数据"。当你读完本书时,你可以期待有趣的学习经历,期待学到知识,也期待像专业人士一样查询、规范化和连接你的数据!"
SchemaVerse "SchemaVerse是一个完全在PostgreSQL数据库中实现的基于太空的策略游戏。使用原始SQL命令与其他玩家竞争来指挥你的舰队。或者,如果你的PL/pgSQL功力够强,可以用它来编写AI,让你的舰队自己指挥。"
SqlEx sql-tutorial.ru书籍的扩展,提供练习题。
SQLZoo 一些教程和练习题
PostgreSQL练习 "这个网站诞生于我注意到有大量材料帮助人们学习SQL,但没有太多资源让人们通过实践来轻松学习。PGExercises提供了一系列基于单一简单数据集的问题和解释。它旨在作为优秀书籍或Postgres出色文档的配套使用。 本网站的练习从简单的select和where子句,到连接和case语句,再到聚合、窗口函数和递归查询。大多数还不是专业人士的人都应该能找到一些可以测试自己的内容。"
批处理
流处理
混合处理
:books: DPhi-数据科学课程
:books: 数据科学方法论
:bulb: 数据科学速查表
:bulb: 数据科学路线图
:books: IBM 数据科学 Coursera 课程
:video_camera: R语言数据科学入门
:bulb: 从零开始实现机器学习算法
:books: Python 数据科学基础
:books: Python 数据科学进阶
如果你认为这份路线图可以改进,请随时提交PR进行更新或提出问题。我也会继续完善它,所以你可能想给这个仓库加星标以便重新访问。 灵感来源:Python开发者路线图
该路线图使用Draw.io构建。项目文件可以在DataEngRoadmap.xml文件中找到。要修改它,请打开draw.io,点击打开现有图表并选择项目的xml文件。它将为你打开路线图。更新它,上传并更新readme中的图片,然后创建PR(以400%缩放导出为png,并使用Compressor.io进行压缩)。


全球首个AI音乐社区
音述AI是全球首个AI音乐社区,致力让每个人都能用音乐表达自我。音述AI提供零门槛AI创作工具,独创GETI法则帮助用户精准定义音乐风格,AI润色功能支持自动优化作品质感。音述AI支持交流讨论、二次创作与价值变现。针对中文用户的语言习惯与文化背景进行专门优化,支持国风融合、C-pop等本土音乐标签,让技术更好地承载人文表达。


阿里Qoder团队推出的桌面端AI智能体
QoderWork 是阿里推出的本地优先桌面 AI 智能体,适配 macOS14+/Windows10+,以自然语言交互实现文件管理、数据分析、AI 视觉生成、浏览器自动化等办公任务,自主拆解执行复杂工作流,数据本地运行零上传,技能市场可无限扩展,是高效的 Agentic 生产力办公助手。


一站式搞定所有学习需求
不再被海量信息淹没,开始真正理解知识。Lynote 可摘要 YouTube 视频、PDF、文章等内容。即时创建笔记,检测 AI 内容并下载资料,将您的学习效率提升 10 倍。


为AI短剧协作而生
专为AI短剧协作而生的AniShort正式发布,深度重构AI短剧全流 程生产模式,整合创意策划、制作执行、实时协作、在线审片、资产复用等全链路功能,独创无限画布、双轨并行工业化工作流与Ani智能体助手,集成多款主流AI大模型,破解素材零散、版本混乱、沟通低效等行业痛点,助力3人团队效率提升800%,打造标准化、可追溯的AI短剧量产体系,是AI短剧团队协同创作、提升制作效率的核心工具。


能听懂你表达的视频模型
Seedance two是基于seedance2.0的中国大模型,支持图像、视频、音频、文本四种模态输入,表达方式更丰富,生成也更可控。


国内直接访问,限时3折
输入简单文字,生成想要的图片,纳米香蕉中文站基于 Google 模型的 AI 图片生成网站,支持文字生图、图生图。官网价格限时3折活动


职场AI,就用扣子
AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!


多风格AI绘画神器
堆友平台由阿里巴巴设计团队创建,作为一款AI驱动的设计工具,专为设计师提供一站式增长服务。功能覆盖海量3D素材、AI绘画、实时渲染以及专业抠图,显著提升设计品质和效率。平台不仅提供工具,还是一个促进创意交流和个人发展的空间,界面友好,适合所有级别的设计师和创意工作者。


零代码AI应用开发平台
零代码AI应用开发平台,用户只需一句话简单描述需求,AI能自动生成小程序、APP或H5网页应用,无需编写代码。


免费创建高清无水印Sora视频
Vora是一个免费创建高清无水印Sora视频的AI工具
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号