最佳Github AI工具与开源项目集锦

ETSformer-pytorch

ETSformer-pytorch

ETSformer时间序列预测

基于PyTorch的先进时间序列Transformer模型

MeMOTR

MeMOTR

MeMOTR多目标跟踪

基于长期记忆的Transformer多目标跟踪方法

CamLiFlow

CamLiFlow

CamLiRAFT光流估计

双向相机LiDAR融合实现光流和场景流联合估计

lamini

lamini

Lamini生成式AI

创建个性化生成式AI的Python工具包

OMG

OMG

OMG多人物生成

优化多角色图像生成框架,支持个性化和样式控制

DiffSketcher

DiffSketcher

DiffSketcher向量草图合成

基于文本生成高质量矢量草图的新方法

OpenTAD

OpenTAD

OpenTAD时序动作检测

多功能时序动作检测工具箱支持多数据集和前沿方法

SVGDreamer

SVGDreamer

SVGDreamerSVG生成

文本驱动的SVG图形生成工具

PixArt-sigma

PixArt-sigma

PixArt-Σ文生图

Diffusion Transformer模型实现4K文本到图像生成

AsyncDiff

AsyncDiff

AsyncDiff扩散模型

通过异步去噪实现扩散模型并行加速

ELLA

ELLA

ELLAEMMA

大语言模型辅助扩散模型实现增强语义对齐

T2I-CompBench

T2I-CompBench

T2I-CompBench++文本生成图像

组合式文本到图像生成的全面评估基准

RestoreFormerPlusPlus

RestoreFormerPlusPlus

人脸修复RestoreFormer++

先进的高质量人脸图像修复技术

ad-rss-lib

ad-rss-lib

RSS自动驾驶

开源C++库实现自动驾驶责任敏感安全模型

4DGen

4DGen

4DGen4D内容生成

基于视频的动态3D内容生成,实现空间-时间一致性

common_metrics_on_video_quality

common_metrics_on_video_quality

视频质量评估FVD

多指标视频质量评估工具包

AI-Playground

AI-Playground

AI Playground英特尔

英特尔GPU驱动的AI创作平台 提供图像生成和对话功能

acat

acat

ACAT辅助工具

开源平台助力言语障碍人士沟通

VideoSwap

VideoSwap

VideoSwap视频主体替换

通过语义点对应技术实现自定义主体替换的新型视频编辑框架

video_features

video_features

视频特征提取深度学习模型

多模态视频特征提取框架 支持多种深度学习模型