最佳Github AI工具与开源项目集锦

csprecon

csprecon

csprecon内容安全策略

基于内容安全策略的目标域名发现工具

awesome-pretrained-models-for-information-retrieval

awesome-pretrained-models-for-information-retrieval

信息检索预训练模型

信息检索领域预训练模型研究综述与最新进展

SimSIMD

SimSIMD

SimSIMD向量计算

快速高效的向量相似度计算库

awesome-neural-models-for-semantic-match

awesome-neural-models-for-semantic-match

文本匹配自然语言处理

神经网络语义匹配模型开源资源集合

solr

solr

Apache Solr搜索平台

开源高性能搜索引擎

pisa

pisa

PISA搜索引擎

高效率大规模文本搜索引擎

scilla

scilla

信息收集工具子域名枚举

多功能网络信息收集工具 支持DNS子域名端口目录枚举

lucene

lucene

Apache Lucene全文搜索引擎

Java高性能全功能文本搜索引擎库

StringZilla

StringZilla

StringZilla字符串处理

跨平台高性能字符串操作加速库

spark

spark

DataFlintApache Spark

实时监控和优化Apache Spark应用性能的开源解决方案

screenFetch

screenFetch

screenFetchBash脚本

Bash脚本终端系统信息展示工具

core

core

KoolReportPHP报表框架

灵活高效的PHP报告生成框架

datajoint-python

datajoint-python

DataJoint科学工作流管理

基于关系原则的科学工作流管理框架 DataJoint

tuva

tuva

Tuva Project医疗分析

综合医疗数据分析平台 支持多种数据仓库

dud

dud

Dud数据版本控制

高效数据版本管理与流程自动化工具

dataplane

dataplane

Dataplane数据管道

高效灵活的开源数据管道构建平台

versatile-data-kit

versatile-data-kit

Versatile Data Kit数据处理框架

全面的数据工作流开发、部署和运维框架

dbt-data-reliability

dbt-data-reliability

Elementary数据可观测性

基于dbt的数据可观测性工具,增强数据管道监控

recap

recap

Recap数据架构

多源数据模式读写与转换工具

transfer

transfer

数据复制实时同步

实时数据复制工具 支持OLTP和OLAP数据库