值得探索的AI开源项目:工具、网站与应用合集

对话情感识别研究综述:从基础到前沿

对话情感识别研究综述:从基础到前沿

本文全面介绍了对话情感识别(Emotion Recognition in Conversations, ERC)的研究现状,包括任务定义、数据集、方法模型以及最新进展,为该领域的研究者提供了系统的参考。

情感识别对话系统自然语言处理机器学习深度学习Github开源项目
TransformerPrograms: 一种新型可解释的Transformer架构

TransformerPrograms: 一种新型可解释的Transformer架构

TransformerPrograms是一种创新的Transformer架构,通过对传统Transformer进行修改,使其能够轻松转换为人类可读的程序,从而实现了更好的可解释性。本文将深入探讨这一突破性技术的原理、优势以及潜在应用。

Transformer Programs机器学习自然语言处理代码生成程序合成Github开源项目
TADA: 文本到可动画数字化头像的革命性技术

TADA: 文本到可动画数字化头像的革命性技术

TADA (Text to Animatable Digital Avatars) 是一项突破性的技术,能够从文本描述生成高质量的3D数字化人物头像,并支持动画制作。本文将详细介绍TADA的工作原理、主要特点以及在数字内容创作领域的潜在应用。

TADA3D头像生成文本到3D模型动画化角色人工智能Github开源项目
OpenSphere: 革新性的开源人脸识别库

OpenSphere: 革新性的开源人脸识别库

OpenSphere是一个基于PyTorch的开源超球面人脸识别库,提供了统一的训练和评估框架,支持多种先进的损失函数和网络架构,旨在推动超球面人脸识别研究的发展。

OpenSphere人脸识别深度学习超球面PyTorchGithub开源项目
LLM数据创建:使用大型语言模型生成高质量合成数据

LLM数据创建:使用大型语言模型生成高质量合成数据

本文详细介绍了Microsoft的LLM数据创建框架,该框架可以利用大型语言模型仅通过一个格式示例就生成大量高质量的合成数据,用于训练和评估下游任务的小型模型。

大语言模型数据创建微调评估EMNLPGithub开源项目
SecretFlow:隐私计算领域的开源统一框架

SecretFlow:隐私计算领域的开源统一框架

SecretFlow是一个用于隐私保护数据分析和机器学习的开源统一框架,旨在帮助多方在保护数据隐私的前提下进行协作分析。

SecretFlow隐私计算数据智能机器学习密码学协议Github开源项目
Vid2Player3D: 从广播视频中学习物理模拟的网球技能

Vid2Player3D: 从广播视频中学习物理模拟的网球技能

Vid2Player3D是一个创新的项目,旨在从广播的网球比赛视频中学习并模拟专业网球选手的物理技能。该系统结合了计算机视觉、机器学习和物理模拟技术,能够生成逼真的3D网球动作和比赛场景。

物理模拟网球技能机器学习视频分析SIGGRAPHGithub开源项目
SKEL: 从皮肤到骨骼 - 迈向生物力学精确的3D数字人类模型

SKEL: 从皮肤到骨骼 - 迈向生物力学精确的3D数字人类模型

SKEL是一个创新的参数化人体形状和骨骼模型,可以实现解剖学上精确的人体姿态和形状变化。本文详细介绍了SKEL模型的特点、用法以及在计算机图形学和生物力学研究中的应用前景。

SKEL3D人体模型骨骼模型姿态参数体型参数Github开源项目
PoseGPT: 革新3D人体姿态生成与预测的量化方法

PoseGPT: 革新3D人体姿态生成与预测的量化方法

PoseGPT是一种基于量化的创新方法,用于3D人体运动生成和预测。它采用自回归transformer架构,内部将人体运动压缩为量化的潜在序列,实现了灵活的动作生成和预测。

ChatPose3D人体姿势多模态大语言模型SMPL人工智能对话Github开源项目
ImageDream: 革新2D到3D的图像生成技术

ImageDream: 革新2D到3D的图像生成技术

ImageDream是一种创新的图像提示多视图扩散模型,用于高质量3D对象生成。它利用规范相机坐标和多层次图像提示控制器,实现了几何和纹理的精确重建,在单图3D重建领域达到了新的高度。

ImageDream三维生成图像提示多视图扩散人工智能Github开源项目
Multi-HMR: 突破性的单次多人全身3D人体网格重建技术

Multi-HMR: 突破性的单次多人全身3D人体网格重建技术

Multi-HMR是一种创新的计算机视觉模型,可以从单张RGB图像中重建多个人的3D全身网格,包括手部和面部表情。这项技术在3D人体姿态估计和重建领域取得了重大突破,为虚拟现实、动画制作等领域带来了新的可能性。

人体网格重建多人检测计算机视觉深度学习Multi-HMRGithub开源项目
Flare:快速学习可动画化和可重光照的网格化身

Flare:快速学习可动画化和可重光照的网格化身

Flare是一个创新的人体建模技术,能够快速生成高质量的可动画化和可重光照的3D人体模型,为计算机图形学和计算机视觉领域带来了新的突破。

FLARE可动画化可重光照网格头像神经渲染Github开源项目
SMPLer-X: 革命性的3D人体建模与姿态估计技术

SMPLer-X: 革命性的3D人体建模与姿态估计技术

SMPLer-X是一种创新的3D人体建模和姿态估计技术,由韩国科学技术院(KAIST)的研究人员开发。它能够准确捕捉人体形态、面部表情和复杂姿势,为计算机视觉和人机交互等领域带来了突破性进展。

SMPLer-X人体姿态估计3D人体重建计算机视觉深度学习Github开源项目
LipSync: Unity中基于MFCC的高性能唇形同步插件

LipSync: Unity中基于MFCC的高性能唇形同步插件

uLipSync是一款为Unity开发的高效唇形同步插件,利用Job System和Burst Compiler实现基于MFCC的实时唇形同步。本文将详细介绍uLipSync的特性、工作原理及使用方法,帮助开发者快速上手这一强大工具。

Unity唇形同步音频分析动画实时渲染Github开源项目
gsplat: 高效的3D高斯体渲染库

gsplat: 高效的3D高斯体渲染库

gsplat是一个开源的CUDA加速3D高斯体渲染库,具有Python绑定。它在原始3D高斯体渲染算法的基础上进行了优化,提供更快的速度、更低的内存占用和更多新功能。

gsplat高斯散射CUDA加速3D渲染图形库Github开源项目
WHAM: 从80年代流行偶像到AI时代的人体动作模型

WHAM: 从80年代流行偶像到AI时代的人体动作模型

本文深入探讨了WHAM项目,从80年代流行音乐组合Wham!到如今的人工智能人体动作模型,全方位解析这一名称背后的演变与创新。

WHAM3D人体重建人体姿态估计计算机视觉深度学习Github开源项目
TRAM: 从真实场景视频中捕捉3D人体全局轨迹与运动

TRAM: 从真实场景视频中捕捉3D人体全局轨迹与运动

本文介绍了一种名为TRAM的新方法,可以从普通视频中重建3D人体的全局轨迹和运动。TRAM集成了多个先进技术,能够在复杂的真实场景中准确捕捉人体运动,为计算机视觉和人机交互等领域带来新的可能。

TRAM3D人体捕捉视频处理计算机视觉深度学习Github开源项目
StableVITON: 利用潜在扩散模型实现虚拟试穿的语义对应学习

StableVITON: 利用潜在扩散模型实现虚拟试穿的语义对应学习

StableVITON是一种创新的虚拟试穿技术,通过学习服装和人体之间的语义对应关系,在预训练扩散模型的潜在空间中实现高质量的虚拟试穿效果。该方法不仅能保留服装细节,还能生成自然逼真的试穿图像,为在线购物体验带来革命性的提升。

StableVITON虚拟试衣语义对应潜在扩散模型CVPR2024Github开源项目
TokenHMR: 突破性人体网格重建技术的诞生与应用

TokenHMR: 突破性人体网格重建技术的诞生与应用

TokenHMR是一种创新的3D人体姿态和形状估计方法,通过引入令牌化姿态表示和阈值自适应损失缩放技术,在保持良好图像对齐的同时显著提高了3D精度,为人体网格重建领域带来了突破性进展。

TokenHMR人体网格恢复计算机视觉姿态表示深度学习Github开源项目
ThunderSVM: 高效的GPU和CPU支持的SVM库

ThunderSVM: 高效的GPU和CPU支持的SVM库

ThunderSVM是一个开源的高性能支持向量机(SVM)库,可在GPU和多核CPU上高效运行,大幅提升SVM的训练和预测速度。本文全面介绍ThunderSVM的特性、安装使用方法及其在机器学习领域的广泛应用。

ThunderSVM机器学习GPU加速支持向量机并行计算Github开源项目