值得探索的AI开源项目:工具、网站与应用合集

L-MChat-7b

L-MChat-7b

Github模型

合并技术提升文本生成能力

bert-medium-mnli

bert-medium-mnli

MNLI开源项目

Pytorch平台上的MNLI任务BERT预训练模型

slimsam-77-uniform

slimsam-77-uniform

web应用JavaScript库

Transformers.js中的ONNX模型兼容性和遮罩生成

OLMo-1B-hf

OLMo-1B-hf

开放语言模型开源项目

结合开放性与多功能性提升语言模型科学

glm-4-9b-chat-1m

glm-4-9b-chat-1m

Huggingface机器学习

广泛语言支持与长文本处理能力的先进预训练模型

twins_svt_large.in1k

twins_svt_large.in1k

timmTwins-SVT

Twins-SVT模型适用于图像分类的创新Transformer架构

wide_resnet101_2.tv_in1k

wide_resnet101_2.tv_in1k

wide_resnet101_2.tv_in1k特征提取

宽残差网络101_2图像分类与特征提取功能

llama-3-cat-8b-instruct-v1-GGUF

llama-3-cat-8b-instruct-v1-GGUF

量化模型性能

文本生成模型的量化选择

granite-3.0-8b-instruct-GGUF

granite-3.0-8b-instruct-GGUF

huggingface量化

文本生成模型的量化优化与性能提升

suzume-llama-3-8B-multilingual-orpo-borda-top75

suzume-llama-3-8B-multilingual-orpo-borda-top75

Suzume ORPO数据集

多语言模型的ORPO方法微调及性能评估

Aura_L3_8B-GGUF-IQ-Imatrix

Aura_L3_8B-GGUF-IQ-Imatrix

实验性开源项目

体验Llama-3的进化之旅,适配最新模型

Midnight-Miqu-70B-v1.5

Midnight-Miqu-70B-v1.5

情感合并Midnight Miqu-70B-v1.5

多功能文本生成和角色扮演模型

EvoLLM-JP-v1-7B

EvoLLM-JP-v1-7B

EvoLLM-JP-v1-7B开源项目

探索日语语言模型的进化潜力

Qwen2-1.5B-Instruct-GGUF

Qwen2-1.5B-Instruct-GGUF

Transformer架构多语言能力

Qwen2提供出色的多语言支持与兼容性

STRANGER-ANIME

STRANGER-ANIME

AI绘图开源项目

利用Huggingface API的数字艺术创作工具

text2cypher-demo-6bit-gguf

text2cypher-demo-6bit-gguf

Tomasonjotext-generation-inference

采用Unsloth加速的llama文本生成模型

albert-large-v2

albert-large-v2

开源项目预训练模型

高效低内存占用的英语语言预训练模型

opus-mt-tc-big-fr-en

opus-mt-tc-big-fr-en

神经机器翻译SentencePiece

法语到英语神经机器翻译模型概述

Llama3-8B-Chinese-Chat

Llama3-8B-Chinese-Chat

Llama3-70B中文对话

多功能中英文指令语言模型

langdetect

langdetect

Github文本分类

语言检测工具,支持现代和中世纪多种语言