bleurt-tiny-512

bleurt-tiny-512项目介绍

bleurt-tiny-512是一个用于文本分类的模型，它是基于BERT模型开发的。这个项目源自Google Research团队的研究成果，由Elron Bandel、Thibault Sellam、Dipanjan Das和Ankur P. Parikh共同开发。该模型是原始BLEURT模型的PyTorch版本，最初发表在ACL会议上。

模型用途

bleurt-tiny-512主要用于文本分类任务。它可以直接应用于评估自然语言生成的质量，特别是在机器翻译和文本摘要等领域。该模型通过比较参考文本和候选文本，给出一个评分，反映了生成文本的质量。

训练数据

模型的训练数据来自WMT Metrics Shared Task的2017年至2019年的英语对数据。这些数据集包含了数千对句子，每对句子都有人工评分，主要涉及新闻领域的内容。具体来说，2017年、2018年和2019年的训练集分别包含5,360、9,492和147,691条记录。

模型特点

基于BERT：bleurt-tiny-512继承了BERT模型的强大特性，能够处理复杂的语言理解任务。
轻量级：相比原始BLEURT模型，tiny-512版本更加轻量，适合在资源受限的环境中使用。
多语言支持：虽然具体支持的语言还需要更多信息，但基于其训练数据，该模型至少支持英语。

使用注意事项

尽管bleurt-tiny-512在文本分类任务中表现出色，但用户应当注意以下几点：

潜在偏见：像许多语言模型一样，bleurt-tiny-512可能存在一些偏见，特别是在涉及受保护类别、身份特征以及敏感的社会和职业群体时。
使用限制：该模型不应被用于故意创造敌对或疏远他人的环境。
环境影响：使用大型语言模型可能会产生相当大的碳排放，用户应当考虑其环境影响。

如何开始使用

使用bleurt-tiny-512非常简单。用户可以通过Hugging Face的transformers库轻松加载和使用该模型。以下是一个简单的使用示例：

from transformers import AutoModelForSequenceClassification, AutoTokenizer
import torch

tokenizer = AutoTokenizer.from_pretrained("Elron/bleurt-tiny-512")
model = AutoModelForSequenceClassification.from_pretrained("Elron/bleurt-tiny-512")
model.eval()

references = ["hello world", "hello world"]
candidates = ["hi universe", "bye world"]

with torch.no_grad():
  scores = model(**tokenizer(references, candidates, return_tensors='pt'))[0].squeeze()

print(scores) # tensor([-0.9414, -0.5678])