ChineseWebText是目前最大规模的高质量中文网络文本数据集,总容量达1.42TB,每条文本都有质量评分。该项目还提供了一套完整的工具链EvalWeb,用于从原始网页数据中提取高质量中文文本。
AVDC是一个通过密集对应关系从无动作视频中学习行动的开创性项目。它利用先进的计算机视觉和机器学习技术,实现了从观察到行动的跨越,为机器人学习和人工智能领域带来了新的可能性。
LIBERO是一个创新的机器人学习基准测试平台,旨在推动多任务和终身机器人学习研究的进展。它提供了一个程序生成管道和130个精心设计的操作任务,为研究人员提供了探索知识迁移和终身学习算法的理想环境。
Crafter是一款开源的2D生存游戏,旨在为强化学习和人工智能研究提供一个全面的测试平台。它结合 了多种挑战,可以评估AI代理在探索、规划、资源管理等方面的能力。
Duck2api是一个开源项目,旨在为开发者提供免费、高效的API接口服务。它支持多种AI模型,并提供简单易用的部署方式,是构建AI应用的理想选择。
本文全面介绍了机器学习的基础知识和常用算法,包括线性回归、逻辑回归、决策树、支持向量机等,并提供了丰富的代码示例和实践项目,是机器学习初学者的理想学习资源。
Chat2API是一个简单而强大的代理服务,可以将ChatGPT网页版转换为OpenAI API格式,支持免费使用GPT-3.5和付费使用GPT-4等高级功能,适配几乎所有客户端。
本文介绍了Whisper Streaming项目,该项目基于OpenAI的Whisper模型,实现了实时语音转录和翻译功能。文章详细解释了项目的背景、安装方法、使用方式以及技术实现,为读者提供了全面的了解。
pyChatGPT是一个非官方的Python封装库,为开发者提供了便捷的方式与OpenAI的ChatGPT API进行交互。本文将详细介绍pyChatGPT的功能特性、安装使用方法以及一些常见问题的解决方案。
Mephisto是一套用于管理众包任务的开源工具,涵盖了从任务创建到数据收集的全流程。它提供了灵活的接 口和丰富的功能,可以帮助研究人员和开发者更高效地开展众包项目。
Schej 是一款革新性的团队会议时间协调工具,它结合了 When2meet 的简洁操作和 Google Calendar 的便捷集成,帮助用户快速找到最佳的团队会议时间,提高工作效率。
NL4DV是一个强大的Python工具包,可以将自然语言查询转换为数据可视化的分析规范。它为开发者提供了一种便捷的方式来创建自然语言驱动的可视化系统。
Supermaven-nvim是一款专为Neovim设计的强大AI代码补全插件,它利用超大上下文窗口和先进的AI模型,为开发者提供快速、准确的代码建议,显著提高编码效率。