最佳Github AI工具与开源项目集锦

AIAS: 一套强大的人工智能加速器套件

AIAS: 一套强大的人工智能加速器套件

AIAS(AI Acceleration Suite)是一个包含100多个项目的人工智能加速器套件,提供了从SDK、平台引擎到场景套件的全方位解决方案,涵盖了图像识别、自然语言处理等多个AI领域。

AIAS图像识别OCR自然语言处理机器学习Github开源项目
Fantasia3D: 革新性的文本到3D内容生成技术

Fantasia3D: 革新性的文本到3D内容生成技术

Fantasia3D是一种新颖的文本到3D内容生成方法,通过解耦几何和外观建模,实现了高质量3D资产的自动创建。本文深入探讨了Fantasia3D的核心原理、关键技术和应用前景。

Fantasia3D3D内容生成几何建模外观建模ICCV2023Github开源项目
DisCo: 突破性的人类舞蹈生成技术

DisCo: 突破性的人类舞蹈生成技术

DisCo是一种创新的基于深度学习的人类舞蹈生成技术,能够根据参考图像和姿势控制生成自然流畅的舞蹈视频,在真实世界场景下表现出色。本文详细介绍了DisCo的技术原理、训练流程和应用案例。

DisCo舞蹈生成深度学习CVPR视频合成Github开源项目
One-2-3-45: 从单张图像到3D模型的革命性技术

One-2-3-45: 从单张图像到3D模型的革命性技术

One-2-3-45是一项突破性的技术,能够在45秒内将任何单张图像转换为高质量的3D网格模型,无需每个形状的优化过程。这项创新方法重新思考了如何利用2D扩散模型进行3D人工智能生成内容(AIGC),引入了一种全新的仅前向范式,避免了耗时的优化过程。

One-2-3-453D建模NeurIPS 2023深度学习HuggingFaceGithub开源项目
FollowYourPose: 基于无姿势视频的姿势引导文本到视频生成

FollowYourPose: 基于无姿势视频的姿势引导文本到视频生成

FollowYourPose是一个创新的两阶段训练方案,可以利用易获得的图像-姿势对和无姿势视频数据集,以及预训练的文本到图像模型,来生成可姿势控制的角色视频。该方法成功实现了连续可控的姿势引导视频生成,同时保留了预训练文本到图像模型的编辑和概念组合能力。

Follow-Your-Pose文本生成视频姿态控制AI生成AAAI 2024Github开源项目
Lobe UI: 一个开源的 AIGC 网页应用 UI 组件库

Lobe UI: 一个开源的 AIGC 网页应用 UI 组件库

Lobe UI 是由 Lobehub 开发的开源 UI 组件库,专为构建 AIGC 网页应用而设计。它基于 Ant Design 开发,提供了丰富的组件和样式解决方案,帮助开发者快速构建美观实用的 AI 生成内容应用界面。

Lobe UI开源UI组件库AIGCNextJSGithub开源项目
VirtualHome: 模拟家庭活动的多智能体平台

VirtualHome: 模拟家庭活动的多智能体平台

VirtualHome是一个创新的多智能体平台,通过程序模拟复杂的家庭活动。它将日常活动表示为高级指令序列,并在逼真的3D家庭环境中执行这些指令。VirtualHome不仅可以生成活动视频,还可以训练AI代理完成复杂任务,为家庭活动研究和AI应用开发提供了强大的工具。

VirtualHomePython API家居活动模拟Evolving GraphUnity SimulatorGithub开源项目
DreamCraft3D: 革命性的层次化3D内容生成技术

DreamCraft3D: 革命性的层次化3D内容生成技术

DreamCraft3D是一种创新的3D内容生成方法,通过利用2D参考图像和分层生成策略,实现了高保真度和一致性的3D对象创建。该技术解决了现有方法中的一致性问题,为游戏开发、虚拟现实等领域带来了新的可能性。

DreamCraft3D3D内容生成分层结构纹理增强几何雕刻Github开源项目
Zero123++: 从单张图像到一致多视角的扩散基础模型

Zero123++: 从单张图像到一致多视角的扩散基础模型

Zero123++是一个创新的AI模型,能够从单张输入图像生成高质量、一致的多视角3D内容,为3D内容创作和理解开辟了新的可能性。

Zero123++多视图生成控制网络深度学习图像处理Github开源项目
MimicBrush: 零样本图像编辑的参考模仿技术

MimicBrush: 零样本图像编辑的参考模仿技术

MimicBrush是一种创新的零样本图像编辑技术,通过参考模仿实现灵活多样的图像编辑效果。用户只需提供源图像、编辑区域和参考图像,就能实现局部区域编辑、纹理迁移等多种编辑任务,无需复杂的提示词描述。

零样本图片编辑MimicBrush模型下载Gradio演示依赖环境安装Github开源项目
AutoDev: 智能驱动的全自动软件开发框架

AutoDev: 智能驱动的全自动软件开发框架

AutoDev是一个革命性的AI驱动软件开发框架,旨在实现自主规划和代码生成。它集成了多语言支持、自动代码生成、智能bug修复等功能,为开发者提供全方位的智能辅助,大幅提高开发效率。

AutoDevAIIntellij自动代码生成多语言支持Github开源项目
HMS ML Demo:华为机器学习服务的强大示例

HMS ML Demo:华为机器学习服务的强大示例

HMS ML Demo 展示了如何将华为机器学习套件 (ML Kit) 集成到应用程序中,提供了人脸检测、文本识别、图像分割等多种机器学习能力的实际应用案例。

HMS CoreHUAWEI ML KitMLKit-SampleApplicationCases技术支持Github开源项目
FastDiff: 一种快速高质量的条件扩散模型用于语音合成

FastDiff: 一种快速高质量的条件扩散模型用于语音合成

FastDiff是一种新型的条件扩散概率模型,能够高效生成高保真度语音。本文介绍了FastDiff的原理、特点和应用,展示了其在语音合成领域的优越性能。

FastDiff高保真语音合成条件扩散模型PyTorch语音合成Github开源项目
Curses: 强大的语音转文字和字幕工具

Curses: 强大的语音转文字和字幕工具

Curses是一款功能丰富的开源软件,可将语音转换为文字并生成自定义字幕,支持OBS、VRChat、Twitch和Discord等多个平台,是直播主和内容创作者的得力助手。

OBSMicrosoft AzureSpeech to TextVRChatTwitchGithub开源项目
Podcast Maker: 从创意到成品的全流程自动化工具

Podcast Maker: 从创意到成品的全流程自动化工具

Podcast Maker是一款功能强大的播客制作工具,可以自动化从内容创作到发布的全过程。它利用人工智能和自动化技术,帮助创作者轻松制作高质量的播客内容。

FelippeChemellopodcast-makerNodeJSReactJSTypescriptGithub开源项目
Unique3D: 从单一图像高效生成高质量3D网格模型

Unique3D: 从单一图像高效生成高质量3D网格模型

Unique3D是一种创新的图像到3D框架,能够从单视图图像高效生成高质量3D网格模型,具有最先进的生成保真度和强大的通用性。本文详细介绍了Unique3D的工作原理、特点及使用方法。

Unique3D3D网格生成高保真单视图快速实现Github开源项目
Voicebox-Pytorch:MetaAI最新文本转语音技术的开源实现

Voicebox-Pytorch:MetaAI最新文本转语音技术的开源实现

深入探讨MetaAI最新发布的Voicebox文本转语音模型,以及其在PyTorch中的开源实现。本文将介绍Voicebox的创新之处、性能优势,以及如何使用voicebox-pytorch库来训练和使用这一先进的语音生成模型。

VoiceboxPytorchText-to-SpeechMetaAISpear-TTSGithub开源项目
Botium Speech Processing: 开源语音处理服务的统一API

Botium Speech Processing: 开源语音处理服务的统一API

Botium Speech Processing是一个开源项目,为开发者提供了一个统一的API来访问多种免费和开源的语音转文本和文本转语音服务,让语音处理变得简单高效。

Botium Speech Processing开源语音识别语音合成DockerGithub开源项目
深入解析Bark与HuBERT:打造高质量AI语音克隆系统

深入解析Bark与HuBERT:打造高质量AI语音克隆系统

Bark和HuBERT的结合为AI语音克隆技术带来了重大突破。本文深入剖析这一强大组合的工作原理,并提供实用指南助您掌握这一前沿技术。

Barkvoice cloningHuBERTquantizerpythonGithub开源项目
nnmnkwii: 快速构建语音合成系统的开源工具库

nnmnkwii: 快速构建语音合成系统的开源工具库

nnmnkwii是一个用于快速构建和原型化语音合成系统的Python库,为研究人员和开发者提供了丰富的功能和易用的接口。

Python库PyTorchMerlinGithub开源项目nnmnkwii语音合成