kf-deberta-base

KF-DeBERTa项目介绍

项目概述

KF-DeBERTa是由韩国的KakaoBank和FnGuide联合开发的一款针对金融领域的专业语言模型。这款模型不仅结合了通用领域的语料，还特别针对金融领域进行了深度学习。通过这种双重训练模式，KF-DeBERTa在各种任务中都展示了其卓越的性能。

模型描述

KF-DeBERTa基于DeBERTa-v2的架构进行了训练。虽然DeBERTa-v3对某些任务的表现不佳，但KF-DeBERTa通过DeBERTa-v2实现了更好的性能。在多个通用和金融领域的下游任务中，KF-DeBERTa表现优异，尤其在KLUE基准测试中，超过了许多传统语言模型，如RoBERTa-Large。

使用方法

以下是KF-DeBERTa模型的基本使用步骤：

from transformers import AutoModel, AutoTokenizer

model = AutoModel.from_pretrained("kakaobank/kf-deberta-base")
tokenizer = AutoTokenizer.from_pretrained("kakaobank/kf-deberta-base")

text = "카카오뱅크와 에프엔가이드가 금융특화 언어모델을 공개합니다."
tokens = tokenizer.tokenize(text)
print(tokens)

inputs = tokenizer(text, return_tensors="pt")
model_output = model(**inputs)
print(model_output)

基准测试

KLUE基准测试

KF-DeBERTa在KLUE基准测试的多个项目中取得了优异成绩，在几乎所有项目中均有显著表现，特别是在知识图谱、命名实体识别等任务中表现突出。

模型	YNAT	KLUE-ST	KLUE-NLI	KLUE-NER	KLUE-RE	KLUE-DP	KLUE-MRC	WoS	总平均
KF-DeBERTa (Base)	87.51	93.24/87.73	88.37	89.17/93.30	69.70/75.07	94.05/87.97	72.59/78.08	50.21/92.59	82.83

金融领域基准测试

在针对金融领域的各种测试中，KF-DeBERTa模型也表现突出，特别在金融情感分析、广告新闻分类和实体识别任务中，其性能优于其他模型。

模型	FN-Sentiment (v1)	FN-Sentiment (v2)	FN-Adnews	FN-NER	KorFPB	KorFiQA-SA	KorHeadline	Avg (FiQA-SA 제외)
KF-DeBERTa (Base)	99.36	92.29	97.63	91.80	93.47	0.0553	82.12	95.27

通用领域基准测试

KF-DeBERTa在传统自然语言处理任务中，同样展现了其优越的综合能力。

模型	NSMC	PAWS	KorNLI	KorSTS	KorQuAD	Avg (KorQuAD 제외)
KF-DeBERTa (Base)	91.36	86.14	84.54	85.99	86.60/95.07	87.01

许可证

KF-DeBERTa的源代码和模型都在MIT许可证下发布。使用过程中如发生任何损害，本项目概不承担责任。

引用方式

如果在研究中使用KF-DeBERTa，请引用以下论文：

@proceedings{jeon-etal-2023-kfdeberta,
  title         = {KF-DeBERTa: Financial Domain-specific Pre-trained Language Model},
  author        = {Eunkwang Jeon, Jungdae Kim, Minsang Song, and Joohyun Ryu},
  booktitle     = {Proceedings of the 35th Annual Conference on Human and Cognitive Language Technology},
  moth          = {oct},
  year          = {2023},
  publisher     = {Korean Institute of Information Scientists and Engineers},
  url           = {http://www.hclt.kr/symp/?lnb=conference},
  pages         = {143--148},
}

通过这款语言模型，KakaoBank和FnGuide展现了在语言处理技术与金融领域深度结合的创新能力，为相关领域的研究和应用带来了更多可能性。