FastEmbed是一个由Qdrant开发的轻量级、快速、准确的Python嵌入生成库。它支持多种流行的文本模型,可以生成高质量的文本嵌入向量,广泛应用于信息检索、推荐系统等场景。
FastEmbed的主要特点包括:
使用pip安装FastEmbed:
pip install fastembed
如需GPU支持:
pip install fastembed-gpu
from fastembed import TextEmbedding documents = [ "This is a sample document.", "FastEmbed is easy to use." ] embedding_model = TextEmbedding() embeddings = list(embedding_model.embed(documents))
from fastembed import SparseTextEmbedding model = SparseTextEmbedding(model_name="prithivida/Splade_PP_en_v1") embeddings = list(model.embed(documents))
from fastembed import ImageEmbedding images = [ "./path/to/image1.jpg", "./path/to/image2.jpg" ] model = ImageEmbedding(model_name="Qdrant/clip-ViT-B-32-vision") embeddings = list(model.embed(images))
FastEmbed可以与Qdrant向量数据库无缝集成:
from qdrant_client import QdrantClient client = QdrantClient("localhost", port=6333) docs = ["Qdrant has Langchain integrations", "Qdrant also has Llama Index integrations"] metadata = [ {"source": "Langchain-docs"}, {"source": "Llama-index-docs"}, ] ids = [42, 2] client.add( collection_name="demo_collection", documents=docs, metadata=metadata, ids=ids ) search_result = client.query( collection_name="demo_collection", query_text="This is a query document" ) print(search_result)
FastEmbed作为一个高效、准确的嵌入生成库,为开发者提供了强大的工具来处理文本和图像数据。通过本文的介绍和资源汇总,相信读者可以快速上手FastEmbed,并在实际项目中充分发挥其优势。如果您在使用过程中遇到任何问题,欢迎在GitHub Issues上提出,或加入Qdrant Discord社区寻求帮助。
一键生成PPT和Word,让学习生活更轻松
讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。
深度推理能力全新升级,全面对标OpenAI o1
科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。