优质AI图像处理工具合集:软件、应用及项目推荐

stallion-dreams-pony-realistic-v1-sdxl

stallion-dreams-pony-realistic-v1-sdxl

Stallion Dreams文本生成图像

文字到图像的真实感小马生成模型

Llama-3.2-11b-vision-uncensored

Llama-3.2-11b-vision-uncensored

AI助手图像处理

图像处理与自然语言生成的先进集成工具

zero123plus-v1.1

zero123plus-v1.1

pipelineDiffusers

高效的图像转换与创意生成

Ovis1.6-Gemma2-9B

Ovis1.6-Gemma2-9B

图像处理Github

Ovis1.6-Gemma2-9B开源多模态大语言模型的嵌入对齐解决方案

segformer-b4-finetuned-ade-512-512

segformer-b4-finetuned-ade-512-512

图像处理ADE20k

512x512分辨率下SegFormer的高效Transformer语义分割实现

bakLlava-v1-hf

bakLlava-v1-hf

AI绘图BakLLaVA

基于Mistral-7B的视觉到文本生成模型

control_v11p_sd15_lineart

control_v11p_sd15_lineart

Stable DiffusionGithub

基于ControlNet的Stable Diffusion线稿生成控制模型

controlnet-depth-sdxl-1.0

controlnet-depth-sdxl-1.0

开源项目模型

ControlNet Depth与Stable Diffusion XL结合提升图像生成质量

Emu3-Gen

Emu3-Gen

Emu3图像处理

统一模型驱动的AI系统实现图像文本与视频的生成与理解

vilt-b32-mlm

vilt-b32-mlm

语言建模Github

探索无卷积技术在ViLT模型中的应用

TTPLanet_SDXL_Controlnet_Tile_Realistic

TTPLanet_SDXL_Controlnet_Tile_Realistic

HuggingfaceSDXL

SDXL Controlnet Tile模型:实现真实风格图像细节增强与重构

control_v11f1p_sd15_depth

control_v11f1p_sd15_depth

Stable DiffusionGithub

基于深度图的ControlNet模型为Stable Diffusion提供精准深度控制

blip2-flan-t5-xxl

blip2-flan-t5-xxl

图像处理Huggingface

整合CLIP和Flan T5的多模态模型实现图像理解与语言生成

swin2SR-realworld-sr-x4-64-bsrgan-psnr

swin2SR-realworld-sr-x4-64-bsrgan-psnr

Swin2SR图像处理

基于SwinV2的实景图像4倍超分辨率模型

nomic-embed-vision-v1.5

nomic-embed-vision-v1.5

模型训练开源项目

高性能视觉嵌入模型实现多模态共享空间

deit-tiny-patch16-224

deit-tiny-patch16-224

ImageNet图像处理

高效小型视觉Transformer模型用于图像分类

DUSt3R_ViTLarge_BaseDecoder_512_dpt

DUSt3R_ViTLarge_BaseDecoder_512_dpt

计算机视觉Github

ViT架构的多分辨率3D几何视觉模型用于深度估计

Flux.1-dev-Controlnet-Upscaler

Flux.1-dev-Controlnet-Upscaler

图像超分辨率图像处理

基于ControlNet的Flux.1-dev兼容图像超分辨率模型

qinglong_controlnet-lllite

qinglong_controlnet-lllite

ControlNet-LLLite深度学习

轻量级动漫图像控制模型集成多种处理功能

depth_anything_vits14

depth_anything_vits14

图像处理计算机视觉

大规模无标签数据训练的开源深度估计工具