语言模型工具集锦:AI工具、网站、应用与开源项目精选

tessdata

tessdata

Tesseract.js训练数据

Tesseract.js OCR语言数据集综合指南

Chain-of-ThoughtsPapers

Chain-of-ThoughtsPapers

Chain-of-Thought语言模型

大型语言模型推理能力研究与应用进展

build-nanogpt

build-nanogpt

nanoGPTGPT-2

从零构建GPT-2模型的开源教学项目

DeepSeek-LLM

DeepSeek-LLM

DeepSeek LLM语言模型

多语言大模型展现卓越编码与数学能力

sqlcoder

sqlcoder

SQLCoder自然语言转SQL

自然语言转SQL查询的开源AI模型

OmniTokenizer

OmniTokenizer

OmniTokenizer视觉生成

联合图像视频标记器实现高效视觉生成

audio-flamingo

audio-flamingo

Audio Flamingo音频理解

新型音频语言模型实现音频理解和多轮对话

functionary

functionary

Functionary语言模型

具备函数执行和代码解释能力的智能语言模型

gpt-2

gpt-2

GPT-2语言模型

GPT-2模型展现自然语言处理新境界

Phi-3CookBook

Phi-3CookBook

Phi-3微软

Microsoft Phi-3模型家族实践指南

calvin

calvin

CALVIN机器人操控

机器人长时间操作任务中基于语言条件的策略学习

dialoqbase

dialoqbase

Dialoqbase聊天机器人

简化自定义聊天机器人的创建的开源应用

langsmith-sdk

langsmith-sdk

LangSmithLangChain

提供语言模型调试、评估和监控的综合SDK

Phi2-mini-Chinese

Phi2-mini-Chinese

Phi2-Chinese-0.2B中文小模型

从零开始训练0.2B参数的中文语言模型,支持Flash Attention加速

ice

ice

PythonICE

用于语言模型程序的 Python 库和跟踪可视化工具

CTCWordBeamSearch

CTCWordBeamSearch

CTCWord Beam Search

CTC解码器提升文本和语音识别的性能

machine-learning-list

machine-learning-list

Elicit机器学习

机器学习入门与语言模型学习指南

BERTweet

BERTweet

BERTweetRoBERTa

专为英语推文预训练的大规模语言模型,助力自然语言处理

mixture-of-experts

mixture-of-experts

Sparsely Gated Mixture of ExpertsPytorch

稀疏门控专家混合模型的Pytorch实现

pixel

pixel

PIXEL语言模型

像素编码语言模型,无需固定词汇表实现多语言处理