最佳Github AI工具与开源项目集锦

albert-base-v2

albert-base-v2

TransformerHuggingface

ALBERT基础模型v2实现高效自然语言处理

bert-base-multilingual-cased

bert-base-multilingual-cased

Huggingface模型

BERT多语言预训练模型覆盖104种语言

Llama-3.1-8B-Instruct

Llama-3.1-8B-Instruct

模型Llama 3.1

Meta推出的多语言大规模语言模型Llama 3.1

all-distilroberta-v1

all-distilroberta-v1

模型Github

针对语义搜索和句子相似度优化的句子嵌入模型

wav2vec2-large-xlsr-53-portuguese

wav2vec2-large-xlsr-53-portuguese

模型Wav2Vec2

XLSR-53微调的葡萄牙语语音识别模型

chronos-t5-tiny

chronos-t5-tiny

语言模型时间序列预测

轻量级预训练时间序列预测模型

vit-base-patch16-224

vit-base-patch16-224

模型神经网络

Vision Transformer图像分类模型在ImageNet数据集上的应用

ms-marco-MiniLM-L-4-v2

ms-marco-MiniLM-L-4-v2

模型评估Cross-Encoder

MS Marco跨编码器模型优化信息检索和段落排序效率

Llama-3.1-70B-Instruct

Llama-3.1-70B-Instruct

模型Meta-Llama-3.1-70B

Meta推出的多语言大规模语言模型 支持商业与研究应用

CLIP-ViT-B-16-laion2B-s34B-b88K

CLIP-ViT-B-16-laion2B-s34B-b88K

CLIP模型

基于LAION-2B数据集训练的CLIP零样本图像分类模型

distilgpt2

distilgpt2

模型DistilGPT2

基于GPT-2知识蒸馏的高效英语文本生成模型

deberta-v3-large

deberta-v3-large

模型Github

微软DeBERTa-v3-large模型提升自然语言理解性能

MeloTTS-English

MeloTTS-English

模型多语言支持

多语言实时文本转语音开源库

speaker-diarization

speaker-diarization

模型说话人分离

高效实时的开源语音说话人分割系统

twitter-roberta-base-sentiment

twitter-roberta-base-sentiment

模型TweetEval

RoBERTa模型实现Twitter推文情感分析

deberta-base

deberta-base

Huggingface注意力机制

DeBERTa模型提升自然语言理解性能

chronos-t5-small

chronos-t5-small

时间序列预测Huggingface

基于T5架构的时间序列预测模型

paraphrase-MiniLM-L6-v2

paraphrase-MiniLM-L6-v2

嵌入向量特征提取

句子嵌入模型实现语义搜索和文本聚类

Bio_ClinicalBERT

Bio_ClinicalBERT

模型BERT

为医疗临床文本优化的BERT模型

wav2vec2-large-xlsr-53-russian

wav2vec2-large-xlsr-53-russian

模型俄语

基于XLSR-53的俄语语音识别微调模型