预训练模型工具大全:精选AI工具、网站及开源项目集锦

mbart-large-cc25

mbart-large-cc25

mbart-large-cc25Hugging Face

基于深度学习的多语言模型支持文本翻译与摘要微调

gpt2

gpt2

预训练模型机器学习

预训练语言模型与自然语言生成技术

matscibert

matscibert

开源项目预训练模型

材料科学领域的专用文本挖掘与信息提取语言模型

xlm-roberta-xxl

xlm-roberta-xxl

XLM-RoBERTa-XLGithub

基于2.5TB数据训练的100语言自然语言处理模型

ag-nli-DeTS-sentence-similarity-v3-light

ag-nli-DeTS-sentence-similarity-v3-light

HuggingfaceCross-Encoder

多语言句子相似性评分模型

bert-base-arabic-camelbert-da

bert-base-arabic-camelbert-da

阿拉伯语自然语言处理

基于方言数据的阿拉伯语预训练语言模型

bert-large-nli-mean-tokens

bert-large-nli-mean-tokens

BERTHuggingface

句子相似性嵌入与聚类应用

glm-4-9b

glm-4-9b

GLM-4-9B自然语言处理

开源预训练模型GLM-4-9B实现多语言及多任务处理能力

deberta-v2-xxlarge

deberta-v2-xxlarge

DeBERTaBERT

强大的自然语言处理模型,采用解耦注意力机制的BERT增强版

rugpt3small_based_on_gpt2

rugpt3small_based_on_gpt2

Huggingface俄语

俄语预训练语言模型基于GPT-2架构

albert-base-v1

albert-base-v1

掩码语言建模ALBERT

共享层架构的轻量级语言模型

quora-roberta-large

quora-roberta-large

开源项目预训练模型

利用Cross-Encoder模型判断Quora重复问题,增强问答匹配效果

camembert-large

camembert-large

Hugging Face开源项目

先进的法语自然语言处理模型

pix2struct-docvqa-base

pix2struct-docvqa-base

Huggingface图像编码器

基于pix2struct的跨领域视觉问答图像解码模型

t5-efficient-tiny

t5-efficient-tiny

预训练模型Github

基于深层窄结构设计的轻量级自然语言处理模型

KoSimCSE-roberta

KoSimCSE-roberta

KoSimCSE语义相似度

基于RoBERTa架构的韩语句子相似度预训练模型

codet5-base

codet5-base

代码生成Github

基于标识符语义的代码理解生成预训练模型

xphonebert-base

xphonebert-base

语音合成开源项目

基于BERT的多语言语音合成音素表示预训练模型

ddcolor_paper_tiny

ddcolor_paper_tiny

图片着色计算机视觉

双解码器驱动的照片级图像上色预训练模型

convnextv2_huge.fcmae_ft_in22k_in1k_384

convnextv2_huge.fcmae_ft_in22k_in1k_384

图像分类Huggingface

高级卷积网络用于图像分类与特征提取