最佳Github AI工具与开源项目集锦

bert_uncased_L-4_H-512_A-8

bert_uncased_L-4_H-512_A-8

模型BERT

BERT小型模型为资源受限环境提供高效自然语言处理解决方案

sentence-t5-large

sentence-t5-large

模型Github

将句子和段落转化为768维向量的自然语言处理模型

segformer-b5-finetuned-ade-640-640

segformer-b5-finetuned-ade-640-640

语义分割Transformer

SegFormer-b5模型用于ADE20k数据集的语义分割

wav2vec2-large-xlsr-53-hungarian

wav2vec2-large-xlsr-53-hungarian

模型匈牙利语

基于XLSR-53微调的匈牙利语语音识别模型

IF-I-M-v1.0

IF-I-M-v1.0

Huggingface模型

DeepFloyd-IF像素级文本到图像级联扩散模型

mt5-small-parsinlu-opus-translation_fa_en

mt5-small-parsinlu-opus-translation_fa_en

模型Persian

基于mT5的波斯语至英语机器翻译模型

speech-separation-ami-1.0

speech-separation-ami-1.0

模型开源项目

基于pyannote.audio的多说话人语音分离与分类系统

ese_vovnet19b_dw.ra_in1k

ese_vovnet19b_dw.ra_in1k

模型VoVNet

VoVNet-v2轻量级图像分类模型 兼顾性能与能效

marigold-depth-lcm-v1-0

marigold-depth-lcm-v1-0

模型扩散模型

基于扩散技术的单目深度估计模型实现零样本迁移

Phi-3.5-mini-instruct-bnb-4bit

Phi-3.5-mini-instruct-bnb-4bit

微调模型

轻量级多语言模型支持高效微调和长文本理解

wav2vec2-lg-xlsr-en-speech-emotion-recognition

wav2vec2-lg-xlsr-en-speech-emotion-recognition

微调模型

微调Wav2Vec 2.0实现高精度语音情感识别

wav2vec2-large-xlsr-53-italian

wav2vec2-large-xlsr-53-italian

Huggingface模型

XLSR-53微调的开源意大利语语音识别模型

videomae-base

videomae-base

VideoMAE开源项目

基于掩码自编码器的视频自监督预训练模型

gatortron-base

gatortron-base

模型医疗信息学

大规模临床语言模型GatorTron-Base助力医疗AI研究

koelectra-base-v3-generalized-sentiment-analysis

koelectra-base-v3-generalized-sentiment-analysis

模型情感分析

基于ELECTRA的韩语情感分析模型实现商品评论智能分类

SapBERT-from-PubMedBERT-fulltext-mean-token

SapBERT-from-PubMedBERT-fulltext-mean-token

SapBERT模型

生物医学实体表示自对齐预训练模型

DreamPhotoGASM

DreamPhotoGASM

模型真实感

高级写实AI图像生成工具

stsb-mpnet-base-v2

stsb-mpnet-base-v2

嵌入向量特征提取

将句子映射至向量空间的自然语言处理模型

LLaVA-NeXT-Video-7B-hf

LLaVA-NeXT-Video-7B-hf

模型人工智能

先进多模态AI模型实现视频和图像理解

sd-vae-ft-mse

sd-vae-ft-mse

模型模型微调

改进稳定扩散自编码器提升图像重建效果