OmniEvent是一个功能强大的开源事件抽取工具包,支持事件检测和事件论元抽取任务,覆盖多种范式和模型,提供统一的评估框架,适用于中英文数据集。
OPUS-MT-train是一个用于训练开放神经机器翻译模型的工具包,基于MarianNMT和OPUS数据,提供了从数据准备到模型训练、评估和发布的全流程支持。
EMA-PyTorch 是一个简单易用的 PyTorch 库,用于跟踪模型参数的指数移动平均。本文详细介绍了 EMA-PyTorch 的使用方法、特性及其在深度学习中的重要应用。
TD-MPC2是一种创新的模型基强化学习算法,在多个领 域的104个连续控制任务中表现出色,无需调参即可实现优异性能。本文深入介绍TD-MPC2的关键技术、应用场景及未来发展。
探讨大语言模型系统研究的最新进展,涵盖预训练、推理服务、微调系统等多个方面,为研究人员和开发者提供全面的文献综述和技术洞察。
本文深入介绍了GitHub上备受关注的Kaggle Pipeline项目,该项目为Kaggle的表格数据竞赛提供了一套完整的解决方案。我们将探讨其主要功能、使用方法以及对数据科学实践的重要意义。
SuperGradients是一个开源的深度学习训练库,专注于计算机视觉任务。它提供了易于使用的API来训练和微调SOTA(State-of-the-Art)模型,包括图像分类、目标检测、语义分割等任务。
本文全面介绍PyTorch深度学习框架,从基础概念到高级应用,帮助读者快速掌握PyTorch进行深度学习模型开发与训练。
探索aiXcoder-7B如何通过创新的预训练任务和数据处理方法,在代码补全和生成等任务中实现卓越性能,为软件开发带来革命性变革。
MLJAR Supervised是一个功能强大的自动化机器学习Python库,专门用于处理表格数据。它能够帮 助数据科学家节省时间,自动完成数据预处理、模型构建和超参数调优等工作,同时提供详细的解释性报告。
Poutyne是一个基于PyTorch的简化深度学习框架,它能够帮助研究人员和开发者更高效地构建和训练神经网络模型。本文将深入介绍Poutyne的特性、使用方法及其在深度学习开发中的优势。
ORPO是一种新型的语言模型微调技术,它将传统的监督微调和偏好对齐阶段合并为单一过程,降低了训练所需的计算资源和时间。本文深入介绍ORPO的原理、实现和效果,并探讨其在自然语言处理领域的应用前景。
AI Toolkit是一个功能强大的人工智能开发工具集,包含了模型训练、推理、部署等多个方面的工具和脚本。它可以帮助开发者更高效地进行AI项目开发,是一个非常实用的开源项目。
CookBook是一个面向深度学习初学者的实用指南,涵盖了使用真实模型进行工作的所有实际细节和有用工具。
CodeFuse-DevOps-Model是一系列业界首个开源的中文开发运维大模型,致力于在DevOps领域发挥实际价值,帮助工程师解决DevOps生命周期中遇到的各种问题。
TorchLM 是一个高级的人 脸关键点检测流水线,支持训练、评估、导出、推理(Python/C++)以及 100 多种数据增强,可以通过 pip 轻松安装。本文将全面介绍 TorchLM 的功能特性、使用方法以及在人脸关键点检测领域的应用。
TextGen是一个开源项目,实现了包括LLaMA、ChatGLM、GPT-2、BART、T5等多种文本生成模型,支持模型训练和推理,可用于对话生成、文本翻译、摘要生成等多种自然语言处理任务。
CoreNet是苹果公司开发的深度神经网络工具包,旨在帮助研究人员和工程师训练各种标准和新颖的小型和大规模模型,包括基础模型(如CLIP和LLM)、对象分类、对象检测和语义分割等多种任务。
Diffusion Forcing是一种创新的机器学习方法,结合了下一个token预测和全序列扩散模型的优势,为序列生成任务带来了新的可能性。本文详细介绍了Diffusion Forcing的原理、应用和潜力。
DataComp-LM (DCLM)是一个全面的框架,旨在通过优化数据集构建策略来提升大型语言模型的性能。它提供了标准化的语料库、有效的预训练方法和广泛的评估套件,为研究人员探索不同规模的数据集构建策略提供了便利。
最新AI工具、AI资讯
独家AI资源、AI项目落地
微信扫一扫关注公众号