自然语言处理

多语言共享向量空间映射的强大工具

基于MS Marco训练的跨编码器模型实现高效文本排序

CTranslate2格式Whisper小型模型实现多语言语音识别

基于Transformer的大规模印刷文本OCR模型

XLM-RoBERTa句子嵌入模型支持多语言语义相似度和文本聚类

40B参数规模的开源指令型语言模型

突破性的多轮对话AI模型

多数据集训练的DPR问题编码器助力开放域问答

高效文本摘要生成模型

用于语义搜索的句子向量化模型

EleutherAI开发的27亿参数GPT-Neo语言模型展现多任务处理能力

多模态大语言模型支持多语言及多媒体理解

针对语义搜索的384维句子嵌入模型

基于Common Voice数据集微调的泰语语音识别模型

Google推出的轻量级开源大语言模型适用于资源有限环境

统一框架下的多语言文本转换模型

性能卓越的开源指令调优语言模型

MiniLM模型在证据类型分类任务上的应用与性能

优化大型语言模型微调的开源工具

医疗领域专用BERT模型助力临床文本分析