Awesome-LLM4IE-Papers

Awesome papers about generative Information extraction using LLMs

The organization of papers is discussed in our survey: Large Language Models for Generative Information Extraction: A Survey.

If you find any relevant academic papers that have not been included in our research, please submit a request for an update. We welcome contributions from everyone.

If any suggestions or mistakes, please feel free to let us know via email at derongxu@mail.ustc.edu.cn and chenweicw@mail.ustc.edu.cn. We appreciate your feedback and help in improving our work.

If you find our survey useful for your research, please cite the following paper:

@misc{xu2023large,
    title={Large Language Models for Generative Information Extraction: A Survey}, 
    author={Derong Xu and Wei Chen and Wenjun Peng and Chao Zhang and Tong Xu and Xiangyu Zhao and Xian Wu and Yefeng Zheng and Enhong Chen},
    year={2023},
    eprint={2312.17617},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

💡 News

Update Logs
- The details can be find in <code>./update_new_papers_list</code>.
- 2024/06/06 Add 41 papers
- 2024/03/30 Add 27 papers
- 2024/03/29 Add 20 papers

Information Extraction tasks

A taxonomy by various tasks.

Named Entity Recognition

Models targeting only ner tasks.

Entity Typing

Paper	Venue	Date	Code
Calibrated Seq2seq Models for Efficient and Generalizable Ultra-fine Entity Typing	EMNLP Findings	2023-12	GitHub
Generative Entity Typing with Curriculum Learning	EMNLP	2022-12	GitHub

Entity Identification & Typing

Paper	Venue	Date	Code
RT: a Retrieving and Chain-of-Thought framework for few-shot medical named entity recognition	Others	2024-05	GitHub
P-ICL: Point In-Context Learning for Named Entity Recognition with Large Language Models	Arxiv	2024-05
Astro-NER -- Astronomy Named Entity Recognition: Is GPT a Good Domain Expert Annotator?	Arxiv	2024-05
Know-Adapter: Towards Knowledge-Aware Parameter-Efficient Transfer Learning for Few-shot Named Entity Recognition	COLING	2024-05
Astronomical Knowledge Entity Extraction in Astrophysics Journal Articles via Large Language Models	Others	2024-04
LLMs as Bridges: Reformulating Grounded Multimodal Named Entity Recognition	ACL Findings	2024-05	GitHub
LTNER: Large Language Model Tagging for Named Entity Recognition with Contextualized Entity Marking	Arxiv	2024-04	GitHub
ToNER: Type-oriented Named Entity Recognition with Generative Language Model	COLING	2024-04
Enhancing Software-Related Information Extraction via Single-Choice Question Answering with Large Language Models	Others	2024-04
Knowledge-Enriched Prompt for Low-Resource Named Entity Recognition	TALLIP	2024-04
VANER: Leveraging Large Language Model for Versatile and Adaptive Biomedical Named Entity Recognition	Arxiv	2024-04	GitHub
LLMs in Biomedicine: A study on clinical Named Entity Recognition	Arxiv	2024-04
Out of Sesame Street: A Study of Portuguese Legal Named Entity Recognition Through In-Context Learning	ResearchGate	2024-04
Mining experimental data from Materials Science literature with Large Language Models: an evaluation study	Arxiv	2024-04	GitHub
LinkNER: Linking Local Named Entity Recognition Models to Large Language Models using Uncertainty	WWW	2024
Self-Improving for Zero-Shot Named Entity Recognition with Large Language Models	NAACL	2024	GitHub
MetaIE: Distilling a Meta Model from LLM for All Kinds of Information Extraction Tasks	Arxiv	2024-03	GitHub
On-the-fly Definition Augmentation of LLMs for Biomedical NER	NAACL	2024-03	GitHub
Distilling Named Entity Recognition Models for Endangered Species from Large Language Models	Arxiv	2024-03
CHisIEC: An Information Extraction Corpus for Ancient Chinese History	COLING	2024-03	GitHub
Augmenting NER Datasets with LLMs: Towards Automated and Refined Annotation	Arxiv	2024-03
ConsistNER: Towards Instructive NER Demonstrations for LLMs with the Consistency of Ontology and Context	AAAI	2024-03
Embedded Named Entity Recognition using Probing Classifiers	Arxiv	2024-03	GitHub
ProgGen: Generating Named Entity Recognition Datasets Step-by-step with Self-Reflexive Large Language Models	Arxiv	2024-03	GitHub
In-Context Learning for Few-Shot Nested Named Entity Recognition	Arxiv	2024-02
LLM-DA: Data Augmentation via Large Language Models for Few-Shot Named Entity Recognition	Arxiv	2024-02
Structured information extraction from scientific text with large language models	Nature Communications	2024-02	GitHub
Rethinking Negative Instances for Generative Named Entity Recognition	Arxiv	2024-02	GitHub
NuNER: Entity Recognition Encoder Pre-training via LLM-Annotated Data	Arxiv	2024-02
VerifiNER: Verification-augmented NER via Knowledge-grounded Reasoning with Large Language Models	Arxiv	2024-02
A Simple but Effective Approach to Improve Structured Language Model Output for Information Extraction	Arxiv	2024-02
PaDeLLM-NER: Parallel Decoding in Large Language Models for Named Entity Recognition	Arxiv	2024-02
Small Language Model Is a Good Guide for Large Language Model in Chinese Entity Relation Extraction	Arxiv	2024-02
C-ICL: Contrastive In-context Learning for Information Extraction	Arxiv	2024-02
UniversalNER: Targeted Distillation from Large Language Models for Open Named Entity Recognition	ICLR	2024-01	GitHub
Improving Large Language Models for Clinical Named Entity Recognition via Prompt Engineering	Arxiv	2024-01	GitHub
2INER: Instructive and In-Context Learning on Few-Shot Named Entity Recognition	EMNLP Findings	2023-12
In-context Learning for Few-shot Multimodal Named Entity Recognition	EMNLP Findings	2023-12
Large Language Model Is Not a Good Few-shot Information Extractor, but a Good Reranker for Hard Samples!	EMNLP Findings	2023-12	GitHub
Learning to Rank Context for Named Entity Recognition Using a Synthetic Dataset	EMNLP	2023-12	GitHub
LLMaAA: Making Large Language Models as Active Annotators	EMNLP Findings	2023-12	GitHub
Prompting ChatGPT in MNER: Enhanced Multimodal Named Entity Recognition with Auxiliary Refined Knowledge	EMNLP Findings	2023-12	GitHub
GLiNER: Generalist Model for Named Entity Recognition using Bidirectional Transformer	Arxiv	2023-11	GitHub
GPT Struct Me: Probing GPT Models on Narrative Entity Extraction	WI-IAT	2023-10	GitHub
GPT-NER: Named Entity Recognition via Large Language Models	Arxiv	2023-10	GitHub
Prompt-NER: Zero-shot Named Entity Recognition in Astronomy Literature via Large Language Models	Arxiv	2023-10
Inspire the Large Language Model by External Knowledge on BioMedical Named Entity Recognition	Arxiv	2023-09
One Model for All Domains: Collaborative Domain-Prefx Tuning for Cross-Domain NER	IJCAI	2023-09	GitHub
Chain-of-Thought Prompt Distillation for Multimodal Named Entity Recognition and Multimodal Relation Extraction	Arxiv	2023-08
Learning In-context Learning for Named Entity Recognition	ACL	2023-07	GitHub
Debiasing Generative Named Entity Recognition by Calibrating Sequence Likelihood	ACL Short	2023-07
Entity-to-Text based Data Augmentation for various Named Entity Recognition Tasks	ACL Findings	2023-07
Large Language Models as Instructors: A Study on Multilingual Clinical Entity Extraction	BioNLP	2023-07	GitHub
NAG-NER: a Unified Non-Autoregressive Generation Framework for Various NER Tasks	ACL Industry	2023-07
Unified Named Entity Recognition as Multi-Label Sequence Generation	IJCNN	2023-06
PromptNER : Prompting For Named Entity Recognition	Arxiv	2023-06