在人工智能快速发展的今天,大型语言模型(LLM)正在各个领域发挥着越来越重要的作用。然而,通用领域的语言模型在处理专业科学问题时往往力不从心。为了推动科学领域语言模型的发展,来自伊利诺伊大学厄巴纳-香槟分校的研究人员发起了Awesome-Scientific-Language-Models项目,旨在汇集和整理科学领域预训练语言模型的相关资源。
Awesome-Scientific-Language-Models是一个精心策划的资源列表,收集了各个科学领域的预训练语言模型。这些模型涵盖了数学、物理、化学、材料科学、生物学、医学、地球科学等多个学科,模型规模从1亿到1000亿参数不等,涉及语言、图像、图谱等多种模态。
该项目是研究人员发表的综述论文《A Comprehensive Survey of Scientific Large Language Models and Their Applications in Scientific Discovery》的配套资源,并会持续更新。截至目前,项目已收录了263篇相关论文,涵盖了科学领域语言模型的各个方面。
Awesome-Scientific-Language-Models项目采用清晰的分类结构,将模型按照不同的科学领域和模态进行归类:
通用科学领域