最佳Github AI工具与开源项目集锦

大型语言模型的长文本建模技术:挑战与进展

大型语言模型的长文本建模技术:挑战与进展

本文全面介绍了大型语言模型在处理长文本时面临的挑战,以及学术界和工业界在提升模型长文本建模能力方面的最新进展和技术方案,包括高效注意力机制、长度外推、长期记忆等多个方向的研究成果。

大语言模型长文本处理信息检索Transformer优化自然语言处理Github开源项目
LanceDB的vectordb-recipes:构建GenAI应用的高质量资源与示例

LanceDB的vectordb-recipes:构建GenAI应用的高质量资源与示例

vectordb-recipes是LanceDB提供的一个开源项目,包含了大量构建生成式AI应用的示例代码、教程和应用。本文将详细介绍该项目的主要内容和特点,帮助开发者快速上手GenAI应用开发。

LanceDB向量数据库GenAIPythonJavaScriptGithub开源项目
Contrastors: 高效的对比学习工具包

Contrastors: 高效的对比学习工具包

Contrastors是一个强大的对比学习工具包,为研究人员和工程师提供了高效训练和评估对比模型的能力。它基于Flash Attention构建,支持多GPU训练、大批量训练、常见模型加载等功能,是进行对比学习研究的理想选择。

contrastors对比学习Nomic EmbedFlash AttentionBERTGithub开源项目
Talk2Arxiv:与任何ArXiv论文对话的开源RAG系统

Talk2Arxiv:与任何ArXiv论文对话的开源RAG系统

Talk2Arxiv是一个创新的开源RAG(检索增强生成)系统,专门设计用于理解学术论文PDF并与之进行交互式对话。本文将详细介绍该项目的功能、技术实现和使用方法。

Talk2ArxivPDF解析文本嵌入向量数据库集成GROBIDGithub开源项目
Play-with-LLMs: 探索大型语言模型的训练、评估与应用

Play-with-LLMs: 探索大型语言模型的训练、评估与应用

本文深入介绍了Play-with-LLMs项目,该项目旨在分享如何训练、评估大型语言模型(LLMs),以及如何基于RAG、Agent、Chain等技术构建有趣的LLMs应用。文章详细讲解了项目的主要内容、特点和案例,为读者提供了丰富的LLMs实践指南。

LLM应用大型语言模型Mistral-8x7b-Instruct中文实现模型微调Github开源项目
LazyLLM: 简单而强大的多智能体LLM应用开发工具

LazyLLM: 简单而强大的多智能体LLM应用开发工具

LazyLLM是一个低代码开发工具,旨在简化多智能体大语言模型应用的构建过程。它为开发者提供了便捷的工作流程和丰富的标准组件,使得即使不熟悉大模型的开发者也能轻松创建复杂的AI应用。

LazyLLM多智能体应用低代码开发AI应用模型微调Github开源项目
从零开始构建大语言模型:深入理解LLM原理与实现

从零开始构建大语言模型:深入理解LLM原理与实现

本文详细介绍了如何从头开始实现类似ChatGPT的大语言模型(LLM),包括基础知识、核心架构和实践指南,帮助读者深入理解LLM的工作原理并掌握构建技能。

LLMs From ScratchDatawhale大语言模型深度学习人工智能Github开源项目
Claude非官方API:探索人工智能对话的新可能

Claude非官方API:探索人工智能对话的新可能

本文深入介绍了Claude非官方API项目,探讨了其功能特性、使用方法以及对AI对话应用开发的影响,为开发者提供了与Claude AI交互的新途径。

claude-unofficial-apiJavaScript会话文件上传API使用Github开源项目
大型语言模型(LLM)入门指南:从零开始成为专家的完整路线图

大型语言模型(LLM)入门指南:从零开始成为专家的完整路线图

本文为您提供了一份全面的大型语言模型(LLM)学习指南,无需高深的背景知识,即可从零开始掌握LLM技能,并紧跟该领域的最新进展和前沿技术。

大型语言模型在线课程人工智能编程实践机器学习Github开源项目
Nucleoid:革新性的神经符号人工智能框架

Nucleoid:革新性的神经符号人工智能框架

Nucleoid是一个创新的神经符号人工智能框架,它通过结合神经网络和符号人工智能的优势,为复杂决策任务提供了一个全面的AI系统。本文深入探讨了Nucleoid的核心概念、技术特点及其在AI领域的重要意义。

Nucleoid神经符号AI知识图谱声明性逻辑逻辑图Github开源项目
ArXiv ChatGuru:革新科研文献交互体验的智能工具

ArXiv ChatGuru:革新科研文献交互体验的智能工具

ArXiv ChatGuru是一款创新的人工智能应用,它结合了LangChain、OpenAI、Streamlit和Redis等先进技术,为研究人员提供了一种全新的方式来探索和理解ArXiv上的科研文献。本文深入介绍了这个工具的工作原理、主要组件和潜在的学习价值。

ArXiv ChatGuruLangChainRedis科学论文检索增强生成Github开源项目
掌握Azure和LangChain.js的无服务器聊天机器人:构建企业级AI应用的综合指南

掌握Azure和LangChain.js的无服务器聊天机器人:构建企业级AI应用的综合指南

本文全面介绍了如何使用Azure和LangChain.js构建无服务器的AI聊天应用。通过结合Azure的无服务器技术和LangChain.js的强大功能,开发者可以快速构建具有检索增强生成(RAG)能力的企业级聊天机器人,实现基于企业文档的智能问答。

LangChain.jsAzure无服务器架构AI聊天增强检索生成Github开源项目
ChatPDF: 革新文档交互的AI助手

ChatPDF: 革新文档交互的AI助手

ChatPDF是一款基于人工智能的文档交互工具,能够让用户与PDF等各类文档进行自然语言对话,大幅提升信息获取和理解效率。它支持多种开源语言模型,可本地部署,并针对中文进行了优化,是学习、研究和工作中的得力助手。

ChatPDFLLMRAGgradio中英文混合文档Github开源项目
BM25S: 基于稀疏矩阵的超快速文本检索库

BM25S: 基于稀疏矩阵的超快速文本检索库

BM25S是一个基于Python和SciPy稀疏矩阵实现的高效BM25文本检索库,相比其他实现可以实现数百倍的性能提升,为大规模文本检索任务提供了一个简单易用的解决方案。

BM25文本检索PythonScipyElasticsearchGithub开源项目
Amazon Bedrock を活用した生成AI活用ソリューション「GenU」の紹介

Amazon Bedrock を活用した生成AI活用ソリューション「GenU」の紹介

AWSが提供する生成AI活用ソリューション「GenU」の特徴や機能、アーキテクチャ、デプロイ方法、ユースケースなどを詳しく解説します。企業における安全な生成AI活用を支援するGenUの全容に迫ります。

生成AILLMGenUAmazon Kendra多言語モデルGithub开源项目
KG-RAG: 知识图谱增强的检索增强生成技术

KG-RAG: 知识图谱增强的检索增强生成技术

KG-RAG是一种结合知识图谱和大型语言模型的创新框架,旨在提高AI系统在知识密集型任务中的表现。它通过从生物医学知识图谱中提取'提示感知上下文',为通用大语言模型提供优化的领域特定知识,从而增强其回答能力。

KG-RAG知识图谱大型语言模型生物医学GPTGithub开源项目
Album AI: 智能相册的革新之作

Album AI: 智能相册的革新之作

Album AI是一个创新的AI驱动相册项目,它利用先进的人工智能技术,让用户能够通过自然语言与照片进行交互,为照片管理和欣赏带来全新体验。

Album AIAI聊天相册GPT-4-o-mini元数据自动生成OpenAIGithub开源项目
MyScaleDB:为AI应用打造的开源SQL向量数据库

MyScaleDB:为AI应用打造的开源SQL向量数据库

MyScaleDB是一个基于ClickHouse构建的开源SQL向量数据库,旨在让每个开发者都能使用熟悉的SQL构建生产级别的AI应用。它结合了SQL数据库、向量数据库和全文搜索引擎的优势,为AI应用提供高性能、可扩展的数据管理解决方案。

MyScaleDBSQL vector databaseAI应用ClickHouse向量搜索Github开源项目
Ax: 构建强大的LLM驱动智能代理和工作流

Ax: 构建强大的LLM驱动智能代理和工作流

Ax是一个基于Stanford DSP论文的开源框架,用于快速构建LLM驱动的智能代理和'代理工作流'。本文深入介绍了Ax的主要特性、使用方法和应用场景,展示了其在构建复杂AI系统中的强大能力。

AxVectorDBsLLMsprompt签名多模态DSPyGithub开源项目
VectorDB:高性能向量数据库管理系统

VectorDB:高性能向量数据库管理系统

VectorDB是一款开源的高性能向量数据库,专注于实现可扩展、高效且经济的向量搜索。它为大型语言模型中的信息检索和记忆保留搭建了桥梁,为AI应用提供了强大的向量存储和检索能力。

Epsilla向量数据库性能优化自然语言搜索云原生架构Github开源项目