支持超长序列处理的多语言Transformer模型
LongT5模型:基于transient-global注意力的长序列文本转换器
高性能长序列文本处理的稀疏注 意力Transformer模型
针对无限长度上下文设计的高效Transformer模型
支持长序列处理的韩语预训练模型