值得探索的AI开源项目:工具、网站与应用合集

LLaMA3-iterative-DPO-final

LLaMA3-iterative-DPO-final

开源模型Github

高效集成在线RLHF技术的指令模型

leandojo-lean4-retriever-byt5-small

leandojo-lean4-retriever-byt5-small

LeanDojo开源项目

利用检索增强模型改进定理证明技术

prometheus-7b-v2.0

prometheus-7b-v2.0

权重合并绝对评分

用于语言模型评估的开源工具与反馈优化

SuperNova-Medius-GGUF

SuperNova-Medius-GGUF

ARMHuggingface

多种量化方法提升模型性能与适配性

granite-8b-code-base-4k

granite-8b-code-base-4k

机器学习Github

多语言代码处理和优化的开源模型

Mistral-7B-v0.1-sharded

Mistral-7B-v0.1-sharded

Hugging Face大语言模型

模型带来更高效的文本生成性能

upernet-swin-small

upernet-swin-small

视觉转换Github

UperNet结合Swin Transformer实现精确语义分割

stable-diffusion-v1-5-inpainting

stable-diffusion-v1-5-inpainting

图像修复文本生成图像

稳定扩散修复模型,提升图像生成与修复能力

Qwen1.5-110B-Chat

Qwen1.5-110B-Chat

HuggingfaceQwen1.5

多语言模型与人类偏好优化的显著提升

Qwen2.5-Coder-1.5B-Instruct-GGUF

Qwen2.5-Coder-1.5B-Instruct-GGUF

Qwen2.5-Coder长上下文支持

Qwen2.5-Coder致力于提升代码生成及修复

mHuBERT-147

mHuBERT-147

数据集开源项目

支持147种语言的紧凑型多语言HuBERT模型

albert-base-v2-fakenews-discriminator

albert-base-v2-fakenews-discriminator

albert-base-v2假新闻

假新闻检测模型,基于albert-base-v2,具备高准确率和良好的训练参数优化潜力

generative-qa-model

generative-qa-model

Github模型

简述AI问答模型的生成式技术

Qwen2.5-1.5B-Instruct-GGUF

Qwen2.5-1.5B-Instruct-GGUF

Qwen2.5长上下文支持

多语言文本生成与指令理解能力的优化与突破

gpt2-arxiv

gpt2-arxiv

Github开源项目

基于GPT-2的学术文本生成与预测工具

CodeLlama-7B-GGUF

CodeLlama-7B-GGUF

CodeLlama代码生成

采用GGUF格式的CodeLlama 7B模型提高编码效率与多平台兼容性

sn9_vx

sn9_vx

评估指标transformers

了解sn9_vx模型的特性与应用场景

mobilenetv3_small_075.lamb_in1k

mobilenetv3_small_075.lamb_in1k

特征提取开源项目

移动网络V3小型模型的图像分类与优化方法

umberto-wikipedia-uncased-v1

umberto-wikipedia-uncased-v1

UmBERTo词汇表

UmBERTo模型专注意大利语NLP任务

bert-base-portuguese-cased-nli-assin-2

bert-base-portuguese-cased-nli-assin-2

模型训练Huggingface

提升句子相似度与语义搜索的句子转换器