值得探索的AI开源项目:工具、网站与应用合集

sapbert-from-pubmedbert-squad2

sapbert-from-pubmedbert-squad2

数据集Github

针对问答系统的超参数微调提升模型性能

efficientnet_b5.sw_in12k_ft_in1k

efficientnet_b5.sw_in12k_ft_in1k

timm图像分类

EfficientNet-加强版:适用于图像分类与特征提取的高效模型

xglm-564M

xglm-564M

多语言Github

提升跨语言AI技术的多语言自回归语言模型

llm-compiler-7b

llm-compiler-7b

Meta Large Language Model Compiler开源项目

一种用于增强代码优化的先进语言模型

celebs_face_image_detection

celebs_face_image_detection

名人脸部识别Huggingface

明星面部图像识别的高效开源工具

sentence-camembert-base

sentence-camembert-base

Github模型

提供法语句子嵌入的先进方法,有效提升文本相似度

IF-I-XL-v1.0

IF-I-XL-v1.0

AI绘画扩散模型

先进的多级级联扩散模型实现高质量文本到图像生成

Tess-v2.5-Phi-3-medium-128k-14B

Tess-v2.5-Phi-3-medium-128k-14B

Github开源项目

提高大型语言模型指令处理的效率与准确性

ToxicityModel

ToxicityModel

词汇评级毒性识别

基于RoBERTa的毒性检测与评分优化工具

sentence-transformers-multilingual-e5-small

sentence-transformers-multilingual-e5-small

Github开源项目

多语言句子相似性和分类模型,覆盖多种语言选择

Codestral-22B-v0.1

Codestral-22B-v0.1

编程语言代码生成

支持多语言代码生成和填空功能,涵盖80多种编程语言,包括Python和Java

distilbert-base-uncased-go-emotions-student

distilbert-base-uncased-go-emotions-student

开源项目文本分类

面向GoEmotions数据集的高效情感分类模型

bge-base-zh-v1.5

bge-base-zh-v1.5

Github模型

文本低维向量映射提升中文检索与分类效率

bcms-bertic

bcms-bertic

语义标注Huggingface

多语言Transformer模型助力波斯尼亚及周边语言处理

squeezebert-uncased

squeezebert-uncased

预训练Huggingface

SqueezeBERT:提高NLP任务效率的高效开源模型

roberta-base-bne

roberta-base-bne

西班牙语开源项目

基于西班牙国家图书馆数据的RoBERTa语言模型

t5-large-medium

t5-large-medium

Retrieva日语

基于Transformer的日文预训练模型,提高NLP任务性能

opus-mt-de-nl

opus-mt-de-nl

数据集transformer-align

德语到荷兰语的机器翻译模型

ddpm-celebahq-256

ddpm-celebahq-256

图像合成Github

高效的无条件图像生成与渐进解压的新型扩散模型

zero123-xl-diffusers

zero123-xl-diffusers

Zero-1-to-3Github

探索模型在研究及艺术创作中的安全应用