最佳Github AI工具与开源项目集锦

Qwen2-VL-72B-Instruct

Qwen2-VL-72B-Instruct

模型多模态处理

多模态视觉语言模型实现图像视频理解与交互

glm-4-9b-chat

glm-4-9b-chat

模型工具调用

多语言支持和长文本处理的开源预训练模型

riffusion-model-v1

riffusion-model-v1

模型开源项目

基于稳定扩散的实时音乐生成模型

wav2vec-english-speech-emotion-recognition

wav2vec-english-speech-emotion-recognition

模型模型微调

英语语音情感识别模型:Wav2Vec 2.0的微调应用

InternViT-300M-448px

InternViT-300M-448px

知识蒸馏Huggingface

动态分辨率视觉模型提供高效特征提取和OCR功能

titania-mix-realistic-pony-gbv30-sdxl

titania-mix-realistic-pony-gbv30-sdxl

模型角色扮演

基于SDXL的真实感小马图像生成模型

atomix-pony-anime-xl-v3-sdxl

atomix-pony-anime-xl-v3-sdxl

模型Stable Diffusion

Stable Diffusion XL驱动的动漫风格小马图像生成模型

NSFW-gen-v2

NSFW-gen-v2

模型成人内容

无限制AI文本到图像生成器 支持3D渲染和多语言

ul2

ul2

模型Github

融合多种预训练范式的通用语言模型

convnextv2_tiny.fcmae_ft_in22k_in1k

convnextv2_tiny.fcmae_ft_in22k_in1k

ConvNeXt-V2模型

ConvNeXt-V2图像分类模型 FCMAE预训练与ImageNet微调

mpt-7b

mpt-7b

Huggingface模型

高性能开源大语言模型

mamba-2.8b

mamba-2.8b

法律Huggingface

突破性能界限的高效开源语言模型

Midjourney

Midjourney

模型LoRA

Midjourney风格AI图像生成模型 FLUX.1-dev的艺术呈现

blenderbot-400M-distill

blenderbot-400M-distill

开放域聊天机器人Huggingface

基于深度学习的高性能开放域聊天机器人

paligemma-3b-mix-448

paligemma-3b-mix-448

视觉语言模型图像处理

基于SigLIP和Gemma的多语言视觉语言模型

NoInstruct-small-Embedding-v0

NoInstruct-small-Embedding-v0

模型文本分类

小型嵌入模型在MTEB基准测试中展现卓越性能

wavlm-base-plus-sv

wavlm-base-plus-sv

模型预训练模型

面向说话人验证的先进语音模型

IndicBERTv2-MLM-only

IndicBERTv2-MLM-only

模型Github

支持23种印度语言和英语的大规模多语言预训练模型

T0pp

T0pp

语言模型T0

多任务语言模型展现跨任务零样本泛化能力

Llama-3.1-405B-FP8

Llama-3.1-405B-FP8

Huggingface模型

Meta推出的405B参数多语言AI模型支持128K上下文