#数据管理
Apache Gravitino: 高性能、跨地域的联合元数据湖

Apache Gravitino: 打造高性能、地理分布式和联邦式元数据湖的开源数据目录


taipy
Taipy 是为数据科学家和机器学习工程师设计的,帮助他们使用Python快速构建数据与AI网络应用,无需学习新语言。它支持UI生成与场景/数据管理,使用户能够专注于数据和AI算法,同时简化开发和部署的复杂性。此外,Taipy还提供强大的定制能力和扩展性,让用户从简单的原型快速过済到生产就绪的应用。

eidos
Eidos是一个可扩展的个人数据管理框架,支持离线访问和AI功能,用户可在一个平台管理其全生命周期数据。无需服务器,作为纯PWA运行,兼容Chromium内核浏览器,支持SQLite标准化及API与SDK。项目尚处于早期阶段,建议持续关注其更新。

TensorFlow-Examples
TensorFlow-Examples提供针对TensorFlow 1和2的详尽教程,涵盖从基础操作到高级模型如深度神经网络,适合初学者通过详细的笔记本和代码解析深入学习,同时介绍最新的API使用实践,如layers、estimator和dataset。

awesome-mlops
发掘和运用顶尖MLOps工具:该项目汇集了多种自动化机器学习、数据处理、模型部署工具,供数据科学家和机器学习工程师选择使用,以简化机器学习流程,优化生产活动。

awesome-data-catalogs
该项目收集了一系列精心挑选的数据目录和监控平台,帮助企业高效发现、管理和观察数据。通过综合列表,用户可以比较开源和专有工具的不同功能,如数据溯源、数据质量保障和数据协作,满足多样化的数据管理需求。

vector-admin
VectorAdmin是一个多用户应用,提供高效的矢量数据管理功能。支持本地和远程托管,适用于管理多种矢量数据库。主要特性包括视图、更新和删除文本块,复制文档或命名空间,直接上传并嵌入新文档,迁移矢量数据库,自动进行回归测试等。此外,VectorAdmin还与API、JavaScript、Python独立客户端及LangChain集成,为用户简化矢量数据管理流程。

alluxio
Alluxio是一个虚拟分布式存储系统,用于在计算框架与多个存储系统之间搭建桥梁,使计算应用能够通过统一接口访问各种存储资源。凭借其出色的数据管理能力,Alluxio已被众多知名企业采用,管理数PB的数据,部署规模可达3000个节点以上,同时提供多个社区互动渠道如Slack和社区会议。

awesome-saas-services
awesome-saas-services项目汇集了开发者和企业主常用的优质SaaS服务。涵盖基础设施、销售、分析、生产力、通讯、认证等多个领域。该项目帮助用户筛选适合需求的SaaS工具,以提升工作效率并促进业务发展。项目列表持续更新,接受社区贡献新的优质服务推荐。

clearml
ClearML是一个开源平台,集成了实验管理、MLOps/LLMOps、数据管理、模型服务和报告生成功能。支持云端和本地部署,帮助用户实现AI项目的高效管理和自动化,包括实验记录、数据版本控制、模型部署与监控等。ClearML支持多种机器学习和深度学习框架,并与Jupyter Notebook无缝集成,适合团队协作和远程任务执行,提升AI工作流效率。