值得探索的AI开源项目:工具、网站与应用合集

vit_large_patch16_384.augreg_in21k_ft_in1k

vit_large_patch16_384.augreg_in21k_ft_in1k

Vision Transformer特征提取

使用ImageNet数据集进行图像分类的Vision Transformer模型

segformer-b2-finetuned-ade-512-512

segformer-b2-finetuned-ade-512-512

视觉Transformer

SegFormer模型实现高效语义分割的新方法

Mythalion-13B-AWQ

Mythalion-13B-AWQ

Huggingface文本生成

利用高效的低比特量化提升Transformer推理速度

dolly-v2-12b

dolly-v2-12b

指令调优dolly-v2-12b

Databricks开源商用语言模型

deberta-v3-base-zeroshot-v2.0

deberta-v3-base-zeroshot-v2.0

Huggingfacezero-shot-classification

DeBERTa V3零样本分类模型,适用于多场景

VLM2Vec-Full

VLM2Vec-Full

Github开源项目

视觉语言模型VLM2Vec的多模态嵌入训练方法

genre-linking-blink

genre-linking-blink

GENRE实体检索

使用BART架构实现的实体检索系统GENRE

PairRM

PairRM

LLM评估高效解码

LLM质量提升的Pairwise奖励模型

opus-mt-de-fr

opus-mt-de-fr

性能opus-mt-de-fr

德语至法语翻译模型,采用OPUS数据集实现高效

Qwen2.5-Coder-1.5B

Qwen2.5-Coder-1.5B

代码推理Qwen2.5-Coder

提高代码生成和推理的新一代开源模型

financial-summarization-pegasus

financial-summarization-pegasus

Samba Financial Group银行收购

提供金融新闻快速建模能力

Qwen2-7B-Instruct-GGUF

Qwen2-7B-Instruct-GGUF

推理能力Github

广泛基准测试中表现突出的大型语言模型

kandinsky-2-2-decoder-inpaint

kandinsky-2-2-decoder-inpaint

扩散模型开源项目

Kandinsky 2.2的文本引导图像修复及生成新方法

bert_uncased_L-8_H-256_A-4

bert_uncased_L-8_H-256_A-4

计算资源预训练

24种BERT小模型为计算资源有限的研究环境提供支持

deit-small-patch16-224

deit-small-patch16-224

图像分类DeiT

数据高效的图像Transformer模型,用于精炼图像分类

Swallow-7b-instruct-hf

Swallow-7b-instruct-hf

训练数据集Github

日语与英语双支持的Swallow模型,带来高效文本推理

MobileLLaMA-1.4B-Base

MobileLLaMA-1.4B-Base

Github模型

简化的1.4B参数Transformer模型,支持快速部署

phi-1

phi-1

模型限制代码生成

用于Python代码生成的1.3亿参数Transformer

Hermes-2-Pro-Mistral-7B-GGUF

Hermes-2-Pro-Mistral-7B-GGUF

APIHuggingface

这款增强模型支持多功能任务调用和 JSON 结构化输出

Llama-3.1-8B-EZO-1.1-it

Llama-3.1-8B-EZO-1.1-it

社区许可协议Llama 3.1

优化日本语AI模型性能,实现多语言任务支持