最佳Github AI工具与开源项目集锦

manga-ocr-base

manga-ocr-base

视觉编码器解码器开源项目

高精度日语漫画OCR模型支持多场景文本识别

Qwen1.5-7B

Qwen1.5-7B

语言模型模型

多语言大规模预训练模型支持32K上下文

vit_base_patch16_384.augreg_in21k_ft_in1k

vit_base_patch16_384.augreg_in21k_ft_in1k

ImageNet模型

Vision Transformer用于图像分类和特征提取的先进模型

e5-mistral-7b-instruct

e5-mistral-7b-instruct

模型MTEB

多语言NLP任务的全能型模型

gpt-neo-1.3B

gpt-neo-1.3B

文本生成神经网络

EleutherAI开发的13亿参数语言模型GPT-Neo 1.3B

opus-mt-en-ru

opus-mt-en-ru

语言模型模型

开源英俄翻译模型高性能机器翻译

brouhaha

brouhaha

语音活动检测房间声学

集成语音活动检测、信噪比和房间声学评估的开源音频分析模型

roberta-large-NER

roberta-large-NER

模型命名实体识别

XLM-RoBERTa大型模型用于多语言命名实体识别

ViT-B-16-SigLIP

ViT-B-16-SigLIP

ViT-B-16图像文本对比

基于WebLI数据集的SigLIP视觉语言模型

colpali-v1.2

colpali-v1.2

ColPali语言模型

基于PaliGemma-3B和ColBERT策略的创新视觉文档检索模型

bge-large-zh-v1.5

bge-large-zh-v1.5

模型检索增强

大规模中文预训练向量模型 优化检索性能

msmarco-distilbert-dot-v5

msmarco-distilbert-dot-v5

模型Github

用于语义搜索的句子嵌入模型

ProteusV0.3

ProteusV0.3

anime图像生成

融合动漫与写实风格的AI图像生成模型

xlnet-base-cased

xlnet-base-cased

模型XLNet

创新的广义排列语言建模与自回归预训练技术

snowflake-arctic-embed-l

snowflake-arctic-embed-l

特征提取Huggingface

高性能句子嵌入模型在自然语言处理任务中的应用

deberta-v3-small

deberta-v3-small

Huggingface注意力机制

微软开发的高效轻量级预训练语言模型 实现出色NLP性能

baidu-ultr_uva-bert_ips-pointwise

baidu-ultr_uva-bert_ips-pointwise

模型排序模型

基于逆向倾向评分的Baidu-ULTR排序模型

Realistic_Vision_V6.0_B1_noVAE

Realistic_Vision_V6.0_B1_noVAE

模型开源项目

开创写实人物图像生成新纪元

SDXL-Lightning

SDXL-Lightning

AI绘图模型

快速高质量文本到图像生成的突破性模型

mask2former-swin-base-coco-panoptic

mask2former-swin-base-coco-panoptic

语义分割计算机视觉

多任务图像分割的先进模型