顶级数据处理AI工具集合 | 提升效率与精确度

数据处理

anonymizer-beto-cased-flair

anonymizer-beto-cased-flair

法律系统AymurAI

利用BETO嵌入增强西班牙语法律文件匿名化

llmlingua-2-bert-base-multilingual-cased-meetingbank

llmlingua-2-bert-base-multilingual-cased-meetingbank

Huggingface开源项目

基于BERT的多语言提示词压缩模型

pvnet_v2_summation

pvnet_v2_summation

开源项目模型

英国光伏电力预测的先进融合模型

mlrun

mlrun

MLRunMLOps

MLRun简化机器学习应用的全生命周期管理

API-Security-Checklist

API-Security-Checklist

API安全身份认证

API安全清单 开发者必备的设计测试发布指南

elasticsearch-py

elasticsearch-py

ElasticsearchPython客户端

Elasticsearch官方Python客户端 全面集成搜索引擎功能

Examine

Examine

ExamineLucene.Net

基于Lucene.Net的高效索引搜索库

awesome-json

awesome-json

JSON开源库

JSON 库和资源全面指南

awesome-opensource-data-engineering

awesome-opensource-data-engineering

开源数据工程

全面的数据工程开源项目资源库

awesome-node-based-uis

awesome-node-based-uis

node-based UI可视化编程

精选节点式UI开发资源:库与应用汇总

batchflow

batchflow

BatchFlow数据处理

高效灵活的大规模数据处理和机器学习框架

jackson

jackson

JacksonJSON

Java多功能数据处理工具集

qsv

qsv

qsvCSV

多功能高性能CSV数据处理工具集

pathway

pathway

Pathway数据处理

高性能Python数据处理框架 支持流处理和LLM应用

feathr

feathr

Feathr特征工程平台

企业级统一数据和AI工程开源平台

nuclio

nuclio

Nuclioserverless框架

实时事件和数据处理的高性能无服务器框架

cudf

cudf

cuDFGPU

基于GPU的高性能DataFrame库 实现快速数据处理与分析

modin

modin

Modinpandas

轻松实现pandas并行化加速

q

q

数据处理SQL查询

命令行文本数据SQL查询工具

PapaParse

PapaParse

CSV解析JavaScript

快速灵活的JavaScript CSV解析工具 适用于浏览器和Node.js