最佳Github AI工具与开源项目集锦

blip-vqa-capfilt-large

blip-vqa-capfilt-large

图像生成Huggingface

跨视觉语言任务的统一预训练框架

lilt-xlm-roberta-base

lilt-xlm-roberta-base

模型布局转换器

融合LiLT和XLM-RoBERTa的多语言文档布局分析模型

stable-diffusion-3-medium-diffusers

stable-diffusion-3-medium-diffusers

MMDiTHuggingface

先进的文本生成图像技术

resnet50_gn.a1h_in1k

resnet50_gn.a1h_in1k

模型神经网络

ResNet-B架构图像分类模型结合先进训练方法

speecht5_tts

speecht5_tts

模型Github

基于统一模态预训练的高效语音合成模型

codebert-javascript

codebert-javascript

代码生成评估Huggingface

基于CodeBERT的JavaScript代码评估预训练模型

Mistral-7B-Instruct-v0.1-GGUF

Mistral-7B-Instruct-v0.1-GGUF

模型量化

Mistral 7B Instruct模型的GGUF量化版本

text2vec-base-multilingual

text2vec-base-multilingual

模型多语言

多语言文本嵌入与分类模型

Nomic-embed-text-v1.5-Embedding-GGUF

Nomic-embed-text-v1.5-Embedding-GGUF

模型代码使用

开源文本嵌入模型用于自然语言处理任务

llavanext-qwen-siglip-tokenizer

llavanext-qwen-siglip-tokenizer

模型Github

整合多模态模型的开源项目探索图像与文本处理新方向

ner-bert-base-cased-pt-lenerbr

ner-bert-base-cased-pt-lenerbr

Huggingface模型

葡萄牙语法律文本的BERT命名实体识别模型

tiny-random-PhiForCausalLM

tiny-random-PhiForCausalLM

模型软件许可

轻量级开源因果语言模型项目

tiny-random-ast

tiny-random-ast

模型AST模型

轻量级随机AST模型助力Hugging Face仓库测试

whisper-medium-fleurs-lang-id

whisper-medium-fleurs-lang-id

FLEURS数据集Whisper

Whisper Medium微调模型实现多语言音频识别

tiny-random-latent-consistency

tiny-random-latent-consistency

法律协议模型

稳定随机潜在特征生成方法

KoELECTRA-small-v3-modu-ner

KoELECTRA-small-v3-modu-ner

模型韩语

基于KoELECTRA的韩语命名实体识别模型

tiny-random-whisper

tiny-random-whisper

模型软件协议

轻量级随机耳语模型为语音识别提供高效解决方案

GLuCoSE-base-ja

GLuCoSE-base-ja

GLuCoSE文本嵌入

基于LUKE的日语文本嵌入模型GLuCoSE支持语义相似度和搜索应用

NV-Embed-v1

NV-Embed-v1

检索模型

多任务自然语言处理领域的高性能嵌入式模型

DepthCrafter

DepthCrafter

视频处理模型

生成开放世界视频的长序列一致深度估计