值得探索的AI开源项目:工具、网站与应用合集

Qwen2.5-32B

Qwen2.5-32B

自然语言处理开源项目

32B参数大语言模型支持128K上下文与多语言多领域能力

nllb-200-3.3B

nllb-200-3.3B

机器翻译Github

Facebook Research开发的200语言互译机器翻译模型

xphonebert-base

xphonebert-base

语音合成开源项目

基于BERT的多语言语音合成音素表示预训练模型

Cadet-Tiny

Cadet-Tiny

Cadet-TinySODA数据集

边缘设备上高效运行的小型对话模型

SPO-SDXL_4k-p_10ep

SPO-SDXL_4k-p_10ep

AI绘图Github

新型步骤感知优化技术实现高质量AI图像生成

bert-base-german-uncased

bert-base-german-uncased

数据预处理德语模型

基于多源语料库训练的德语BERT预训练模型

Llama-3.2-3B-Instruct-4bit

Llama-3.2-3B-Instruct-4bit

开源许可机器学习

MLX框架专用的Llama 3.2指令模型4位精度优化版

Arabic-Whisper-CodeSwitching-Edition

Arabic-Whisper-CodeSwitching-Edition

代码转换Github

针对阿拉伯语和英语混合语音的优化识别模型

all-MiniLM-L6-v1

all-MiniLM-L6-v1

语义相似度语义搜索

基于MiniLM的神经网络句子编码模型

Anole-7b-v0.1-hf

Anole-7b-v0.1-hf

图文生成深度学习

基于深度学习的多模态文本图像交互生成模型

ddcolor_paper_tiny

ddcolor_paper_tiny

图片着色计算机视觉

双解码器驱动的照片级图像上色预训练模型

epiCDream

epiCDream

AI绘图科幻场景

先进文本转图像模型生成逼真风景和肖像

NextPhoton

NextPhoton

图像生成Huggingface

AI图像生成模型以摄影级真实感著称

transliterate

transliterate

模型训练Github

高精度自然语言音译转换模型达99.12%准确率

doctr-torch-parseq-multilingual-v1

doctr-torch-parseq-multilingual-v1

PyTorchDoctr

多语言OCR解决方案,兼具TensorFlow 2和PyTorch兼容性

internlm2-chat-1_8b

internlm2-chat-1_8b

开源模型长文本支持

优化指令遵循与对话功能的开源对话模型

graphic-novel-illustration

graphic-novel-illustration

漫画艺术Huggingface

基于SDXL的高质量漫画风格插画模型

OPT-6B-nerys-v2

OPT-6B-nerys-v2

Huggingface文本生成

基于多样数据集训练的文本生成模型

convnextv2_huge.fcmae_ft_in22k_in1k_384

convnextv2_huge.fcmae_ft_in22k_in1k_384

图像分类Huggingface

高级卷积网络用于图像分类与特征提取

wav2vec2-xls-r-300m-timit-phoneme

wav2vec2-xls-r-300m-timit-phoneme

DARPA TIMIT语音识别

改进Wav2Vec2的音素识别性能的开源AI模型