精选人工智能工具与开源项目大全

人工智能(AI)是计算机科学的一个分支,致力于创建能够执行通常需要人类智能的任务的系统。这些任务包括但不限于理解自然语言、识别图像和模式、进行决策和解决复杂问题。AI可以分为弱AI和强AI,前者针对特定任务设计,如语音助手和推荐系统,后者则旨在实现与人类相仿的智能。目前,AI技术广泛运用于医疗诊断、自动驾驶、金融分析和个性化推荐等领域。通过机器学习和深度学习等技术,AI能够从大量数据中学习和改进其功能。尽管AI带来了显著的技术进步,但也引发了对伦理、隐私和就业影响的持续讨论。总体而言,人工智能正在重塑各行各业,并不断改变我们的日常生活方式。

airunner

airunner

AI Runner人工智能

本地运行的多模态AI界面:语言模型与图像生成集成

WeBank-all-Project

WeBank-all-Project

微众银行开源项目

微众银行开源项目集合 涵盖AI区块链云计算大数据四大领域

XTTS-RVC-UI

XTTS-RVC-UI

XTTS-RVC-UI语音合成

开源AI语音合成与转换界面

AudioLDM2

AudioLDM2

AudioLDM 2文本生成音频

多功能文本到音频生成开源项目

FFMPerative

FFMPerative

FFMPerative视频编辑

基于自然语言的智能视频编辑工具

VisionLLM

VisionLLM

VisionLLM多模态大语言模型

面向视觉任务的开放式多模态大语言模型

ImageDream

ImageDream

ImageDream三维生成

利用图像提示的多视角扩散方法实现创新3D内容生成

TADA

TADA

TADA3D头像生成

基于文本生成高品质可动画3D数字角色

syn-rep-learn

syn-rep-learn

合成数据学习图像生成模型

探索合成图像在视觉表示学习中的应用

robotic-transformer-pytorch

robotic-transformer-pytorch

RT1机器人变形金刚

RT1机器人控制Transformer模型的PyTorch实现

GenerativeModels

GenerativeModels

MONAI生成模型

MONAI医学影像生成模型库推动AI医疗研究

DiffusionGPT

DiffusionGPT

DiffusionGPT文本生成图像

LLM驱动的多功能文本转图像生成系统

MotionLLM

MotionLLM

MotionLLM人工智能

融合视频和动作数据的人类行为理解先进AI模型

HumanArt

HumanArt

Human-Art人体姿态估计

多场景人体数据集助力计算机视觉研究

s2client-proto

s2client-proto

StarCraft II API人工智能

StarCraft II API接口 助力AI开发与游戏分析

LLM-Agent-Survey

LLM-Agent-Survey

LLM自主代理

大语言模型驱动智能体的构建应用与评估综述

IMAGDressing

IMAGDressing

IMAGDressing虚拟试衣

虚拟试衣新技术 实现交互式个性化服装生成

CVPR2022-DaGAN

CVPR2022-DaGAN

DaGAN人工智能

基于深度感知的说话头像视频生成技术

SegVol

SegVol

SegVol医学图像分割

突破性的通用交互式三维医学影像分割模型

MMStar

MMStar

MMStar多模态评估

大型视觉语言模型评估的新标准