模型训练必备工具推荐:精选AI软件与开源项目

upos-multi

upos-multi

多语言Github

多语言支持的高效词性标注模型

norbert2_sentiment_test1

norbert2_sentiment_test1

Huggingfacesentiment analysis

挪威评论情感分析:基于Norwegian Review Corpus的精确模型

wav2vec2-xls-r-300m-phoneme

wav2vec2-xls-r-300m-phoneme

wav2vec2-xls-r-300m语音识别

微调后的Facebook语音处理模型

H2-keywordextractor

H2-keywordextractor

AutoTrain二氧化碳排放

精准高效的文本摘要生成工具

pythia-1.4b-deduped

pythia-1.4b-deduped

HuggingfaceEleutherAI

用于解释性研究的大规模语言模型套件

LaMini-Flan-T5-783M

LaMini-Flan-T5-783M

模型评估模型训练

增强自然语言处理能力的多样化指令微调模型

llama2_esci_v1

llama2_esci_v1

Github模型

针对ESCI查询,利用Llama2进行微调提升产品关联度

deberta-v3-large-zeroshot-v1

deberta-v3-large-zeroshot-v1

模型训练零样本分类

强大高效的零样本文本分类能力

bitnet_b1_58-xl

bitnet_b1_58-xl

开源模型训练

概述BitNet b1.58模型的再现性和性能

mmarco-mMiniLMv2-L12-H384-v1

mmarco-mMiniLMv2-L12-H384-v1

Google翻译模型训练

支持多语言的MMARCO跨编码器模型

gliner_small-v2.1

gliner_small-v2.1

模型训练命名实体识别

基于双向Transformer的轻量级通用实体识别模型

lt-wikidata-comp-en

lt-wikidata-comp-en

数据清洗Github

高级模型,简化实体匹配与数据链接

tiny-random-bert-sharded

tiny-random-bert-sharded

Github开源项目

模型从零开始训练,适应不明数据集进行深度学习

t5-base-grammar-correction

t5-base-grammar-correction

模型训练Happy Transformer

自动化语法纠正,通过T5模型提升文本准确性

quora-distilroberta-base

quora-distilroberta-base

HuggingfaceCross-Encoder

客观识别Quora问题重复性的开源模型

RealVisXL_V4.0_Lightning

RealVisXL_V4.0_Lightning

MageGithub

探索新一代现实风图像生成技术

xlm-roberta-large-finetuned-conll03-german

xlm-roberta-large-finetuned-conll03-german

模型训练命名实体识别

基于XLM-RoBERTa的大型多语言模型优化德国文本的命名实体识别

granite-3b-code-instruct-2k

granite-3b-code-instruct-2k

数据集Github

用于改进代码生成的3B参数AI模型

pegasus-multi_news

pegasus-multi_news

模型训练开源项目

优化文本摘要生成:采用混合数据集和随机抽样

gpt2-lora-random

gpt2-lora-random

peft机器学习

GPT2模型LoRA微调框架 提升语言模型性能的开源项目