lnx

lnx

基于 tantivy 的高性能可定制搜索引擎

lnx 是一个基于 tantivy 搜索引擎的高性能 REST 部署方案。它结合了 tokio-rs 运行时和 hyper 网络框架,实现毫秒级索引和高效搜索。lnx 支持复杂查询解析、模糊查询和 More-Like-This 查询等功能,并提供性能调优选项。该项目适用于处理大规模数据集,能够提供快速、准确的搜索服务。

lnx搜索引擎全文检索高性能开源项目Github
<p align="center"> <img width="30%" src="https://yellow-cdn.veclightyear.com/0a4dffa0/1c667012-0f3f-4151-b680-10fa18bc043a.png" alt="lnx 标志"> </p>

<p align="center"> <a href="https://github.com/lnx-search/lnx/stargazers"><img src="https://img.shields.io/github/stars/lnx-search/lnx"/></a> <a href="hhttps://github.com/lnx-search/lnx/issues"><img src="https://img.shields.io/github/issues/lnx-search/lnx"/></a> <a href="https://github.com/lnx-search/lnx/blob/master/LICENSE"><img src="https://img.shields.io/github/license/lnx-search/lnx"/></a> <a href="https://docs.lnx.rs"><img src="https://img.shields.io/badge/Docs-alive-sucess"/></a> </p> <p align="center"><a href="https://lnx.rs">✨ 功能丰富 | ⚡ 极速快捷</a></p> <p align="center">通过REST实现tantivy搜索引擎的超快速、可适应性强的部署。</p> <p align="center"> 加入我们的社区以获得支持、更新和更多信息: </p> <p align="center"> <a href="https://discord.gg/hPr7BQGgb4"><img src="https://img.shields.io/badge/Discord-7289DA?style=for-the-badge&logo=discord&logoColor=white"/></a> </p>

🌟 站在巨人的肩膀上

lnx的设计理念是不重复造轮子,它建立在tokio-rs工作窃取运行时、hyperweb框架以及tantivy搜索引擎的原始计算能力之上。

这些组合让lnx能够在同时插入数万个文档时提供毫秒级的索引速度(不再需要等待索引完成!),支持每个索引的事务处理,并且能够像查找哈希表一样处理搜索请求 😲

✨ 特性

尽管lnx相对较新,但得益于其所依赖的生态系统,它提供了广泛的功能。

  • 🤓 复杂的查询解析器。
  • ❤️ 容错模糊查询。
  • ⚡️ 容错快速模糊查询。(预计算的拼写纠正)
  • 🔥 相似项查询。
  • 按字段排序。
  • 快速索引。
  • 快速搜索。
  • 多种选项用于精细的性能调优。
  • 多种可用的存储后端,用于测试和开发。
  • 基于权限的授权访问令牌。
<p align="center"> <img src="https://i.imgur.com/QovtWlc.gif" alt="演示视频"/> </p>

在这里,你可以看到lnx在一个包含2700万文档的数据集上进行即时搜索,索引后的大小约为18GB,在我的i7-8700k上运行,使用约3GB的RAM,采用我们的快速模糊系统 有更大的数据集供我们尝试吗?请提出问题!

性能

lnx提供了根据特定用例进行精细调优的能力。你可以自定义异步运行时线程、并发线程池、每个读取器的线程数和写入器线程数,所有这些都可以针对每个索引进行设置。

这使你能够详细控制计算资源的分配。有大型数据集但并发读取量较低?可以增加读取器线程,以换取较低的最大并发数。

以下数据是通过我们的lnx-cli在小型movies.json数据集上获得的。我们没有尝试更高的数据量,因为Meilisearch在索引数百万文档时需要非常长的时间,尽管新的Meilisearch引擎在某种程度上改善了这一点。

<p align="center"> <img width="45%" src="https://yellow-cdn.veclightyear.com/0a4dffa0/6ad6e8bf-daa1-48eb-9baa-e156f26f89db.png"/> <img width="45%" src="https://yellow-cdn.veclightyear.com/0a4dffa0/188a1e98-b833-42dd-a0c0-164fa2163c24.png"/> </p>

💔 局限性

尽管lnx提供了广泛的功能,但作为一个年轻的系统,它还不能做到一切。自然地,它有一些限制:

  • lnx目前不是分布式的(尚未实现),所以它只能进行垂直扩展。
  • 简单但不过于简单,由于其基于模式的特性和广泛的调优选项,lnx无法提供与MeiliSearch相同级别的易用性。不幸的是,更多的调优选项意味着更多的设置。
  • 尚未提供指标(metrics)。

编辑推荐精选

堆友

堆友

多风格AI绘画神器

堆友平台由阿里巴巴设计团队创建,作为一款AI驱动的设计工具,专为设计师提供一站式增长服务。功能覆盖海量3D素材、AI绘画、实时渲染以及专业抠图,显著提升设计品质和效率。平台不仅提供工具,还是一个促进创意交流和个人发展的空间,界面友好,适合所有级别的设计师和创意工作者。

图像生成热门AI工具AI图像AI反应堆AI工具箱AI绘画GOAI艺术字堆友相机
码上飞

码上飞

零代码AI应用开发平台

零代码AI应用开发平台,用户只需一句话简单描述需求,AI能自动生成小程序、APP或H5网页应用,无需编写代码。

Vora

Vora

免费创建高清无水印Sora视频

Vora是一个免费创建高清无水印Sora视频的AI工具

Refly.AI

Refly.AI

最适合小白的AI自动化工作流平台

无需编码,轻松生成可复用、可变现的AI自动化工作流

酷表ChatExcel

酷表ChatExcel

大模型驱动的Excel数据处理工具

基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。

AI工具使用教程AI营销产品酷表ChatExcelAI智能客服
TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

热门AI工具生产力协作转型TraeAI IDE
AIWritePaper论文写作

AIWritePaper论文写作

AI论文写作指导平台

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

数据安全AI助手热门AI工具AI辅助写作AI论文工具论文写作智能生成大纲
博思AIPPT

博思AIPPT

AI一键生成PPT,就用博思AIPPT!

博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。

热门AI工具AI办公办公工具智能排版AI生成PPT博思AIPPT海量精品模板AI创作
潮际好麦

潮际好麦

AI赋能电商视觉革命,一站式智能商拍平台

潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。

iTerms

iTerms

企业专属的AI法律顾问

iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。

下拉加载更多