Presidio是一个开源的数据保护和匿名化SDK,旨在帮助组织更好地管理和保护敏感数据。它提供了快速识别和匿名化文本和图像中私密实体的模块,如信用卡号码、姓名、地址等。
NeMo-Aligner是NVIDIA推出的一个可扩展的大模型对齐工具包,支持包括SteerLM、DPO和RLHF在内的多种先进对齐算法,能够帮助开发者高效地将语言模型调整得更安全、无害和有帮助。
AutoRAG是一个开源的RAG(检索增强生成)自动化工具,可以帮助开发者快速找到最适合自己数据和应用场景的RAG管道。通过自动化评估各种RAG模块组合,AutoRAG大大简化了RAG系统的开发和优化过程。
Quarkus LangChain4j是一个强大的扩展,它可以帮助开发者轻松地将大语言模型(LLMs)集成到Quarkus应用中。这个扩展提供了声明式的AI服务、多种LLM的集成、工 具支持、嵌入支持等丰富功能,让开发者能够快速构建智能应用。
AlphaFold是由DeepMind开发的人工智能系统,能够以前所未有的准确度预测蛋白质的三维结构,为生物学和医学研究带来重大突破。
CIM(CROSS-IM)是一款面向开发者的开源即时通讯系统,提供了构建可扩展IM应用所需的核心组件和功能。它支持群聊、私聊、消息推送等特性,适用于IM系统、APP消息推送、IoT设备通信等多种场景。
本文详细介绍了多种先进的RAG(检索增强生成)技术,旨在提高RAG系统的检索精度、生成质量和整体性能。文章涵盖了从索引、检索到生成的RAG全流程,为研究人员和开发者提供了丰富的技术选择和实践指南。
InstaGraph是一款创新的应用程序,能够将文本或URL转换成富有洞察力的知识图谱。本文深入介绍了InstaGraph的功能特性、使用方法以及未来发展方向,为读者呈现了这一强大工具的全貌。
MedAlpaca项目通过微调大型语言模型,为医疗领域带来了开源的问答AI解决方案。本文详细介绍了该项目的背景、技术细节、数据集构建以及性能评估等方面,展示了其在医疗AI领域的创新贡献。
Ring Attention是一种新型的注意力机制,通过环形数据传输和并行计算,可以大幅提升Transformer模型处理的上下文长度,为处理超长序列数据带来新的可能。
本文深入探讨了一个用纯C++/CUDA实现的UNet扩散模型训练项目。文章详细介绍了项目的背景、实现细节以及性能优化过程,为读者提供了一个学习CUDA编程和深度学习模型实现的宝贵案例。
emotion2vec是首个通用语音情感表征模型,通过自监督预训练,能够跨任务、语言和场景提取情感表征。它在主流IEMOCAP数据集上仅使用线性层就达到了SOTA水平,并在多语言情感识别任务上显著超越现有方法。
本文全面综述了LEGO积木在机器学习领域的应用研究,涵盖零件分类、自动分拣、模型生成等多个方向,展示了这一经典玩具与人工智能的创新融合。
ChatDoctor是一个基于LLaMA大语言模型并使用医学领域知识进行微调的医疗聊天模型。它旨在为患者提供智能可靠的医疗咨询服务,能够理解患者需求并提供准确的医疗建议。
探索ChatGPT各种开源和闭源前端GUI客户端,包括网页、浏览器扩展、桌面应用等多种形式,为开发者和用户提供丰富的ChatGPT使用选择。
TensorFlow Federated (TFF) 是一个用于分布式数据上进行机器学习和其他计算的开源框架,旨在促进联邦学习的开放研究和实验。
WeCMDB是一个源自微众银行实践的开源CMDB系统,提供IT基础设施和应用系统的配置管理能力,支持大规模复杂IT环境的资产管理和运维自动化。
Ezno是一个用Rust编写的创新型JavaScript编译器和TypeScript检查器,它通过深度静态分析和类型推断,致力于提高JavaScript程序的安全性、正确性和性能。
LineaPy是一个开源工具,能够帮助数据科学家快速地将凌乱的notebook代码转换为可部署的数据流水线,自动清理和重构代码,加速价值实现。
jetson_stats是一个用于监控和控制NVIDIA Jetson系列(包括Orin、Xavier、Nano、TX等)的强大工具包。它提供了丰富的功能,可以让用户轻松分析和管理Jetson设备。
最新AI工具、AI资讯
独家AI资源、AI项目落地
微信扫一扫关注公众号