#图像生成

Canopus-LoRA-Flux-UltraRealism-2.0 - 超高真实感图像生成的创新提升
Github开源项目图像生成模型LoRAHuggingface超现实主义面部真实感Canopus-LoRA-Flux-UltraRealism-2.0
这个项目在图像生成领域通过使用LoRA技术在超高真实感方面展现了进步。其特别专注于人脸的真实感生成,并能够与多种模型如Flux和Stable Diffusion兼容使用。使用关键字'Ultra realistic',可以实现更逼真的图像生成体验。虽然模型仍在训练阶段,但已经展示了很好的细节处理能力,特别适合对高分辨率图像处理有要求的用户,可免费下载模型权重。
365 - 基于ReVAnimated和Liberte Redmond模型的高级文图生成技术
人工智能Github开源项目图像生成模型动画Huggingfacediffusers稳态扩散
项目结合ReVAnimated和Liberte Redmond模型,拓展文图生成技术。支持多种风格如写实、动漫和卡通,适合多样创意应用。采用diffusers库及Incredible World VAE,保障高质量输出,为创意表达提供新动力。
STRANGER-ANIME - 利用Huggingface API的数字艺术创作工具
人工智能Github开源项目深度学习AI绘图图像生成模型Huggingface
项目使用Huggingface API生成逼真的数字艺术图像,通过关键词组合生成细致且富有情感的视觉效果。用户可以根据需要调整诸如头发颜色、眼睛颜色和雨天等图像细节,实现个性化艺术创作,适用于艺术设计和视觉表达等领域,展示出现代AI在视觉艺术中的应用能力。
realistic-vision-v12 - 基于文本生成逼真图像的新技术
Github开源项目AI绘图图像生成模型Huggingfacestable-diffusiondiffusersRealistic Vision
Realistic Vision 1.2结合稳定扩散技术和diffusers库,从文本生成高质量的逼真图像。采用CreativeML-OpenRAIL-M许可证,项目为数字创作提供了灵活性和创新性。通过简单的文本提示,用户可以生成多种符合视觉需求的图像,适用于多个创意领域。
Memento - 结合现实生活V2和高保真模型的特点,生成个性化纪念图像
人工智能Github开源项目图像生成模型稳定扩散HuggingfaceMemento
Memento结合Real Life v2和高保真模型,通过MementoVAE模块实现逼真的个性化图像生成。其text-to-image功能允许创作各类虚拟纪念品,从肖像到艺术作品。支持多种风格与场景,满足不同的创作需求。
controlnet-scribble-sdxl-1.0 - 支持多种线条样式的高分辨率图像生成模型
Github开源项目图像生成模型高分辨率Huggingface线稿视觉美感ControlNet_SDXL
该模型能够生成与Midjourney效果相近的高分辨率图像。其通过超过千万张高质量图像数据的训练,采用多重分辨率和数据增强技术,支持各种类型和宽度的线条。用户可利用简单的草图和提示词生成视觉效果突出的图像。在美学表现上,该模型优于Controlnet-Canny-Sdxl-1.0。但需注意,线条的厚薄会影响控制能力,适合从粗略到精细的逐步创作。
Timeless - 突破性AI图像生成,无需依赖负面提示
Github开源项目Stable Diffusion图像生成模型Huggingface模型合并FabulousAlphaTimeless Diffusion
Timeless项目结合了Timeless Diffusion和FabulousAlpha模型,通过fennPhoto和Incredible World 2等模块,打造出不依赖负面提示的图像生成工具。即使提示中不含“timeless style”,也能生成多样风格的图像。它综合利用IncredibleWorld2、FennPhoto与Stable Diffusion 1.5,实现从经典肖像到未来派风格的图像创作,拓展了创作可能性。
CLIP-ViT-B-16-DataComp.XL-s13B-b90K - 多模态模型CLIP ViT-B/16的零样本图像分类解析
Github开源项目图像生成模型数据集CLIPHuggingface零样本图像分类训练数据
CLIP ViT-B/16模采用DataComp-1B数据集训练,并结合OpenCLIP工具,旨在促进研究者对零样本图像分类的理解。该模型在ImageNet-1k数据集上实现了73.5%的零样本准确率,展示了其在多领域研究中的潜力和挑战。由于数据集仍未完全筛选,建议仅限于学术研究使用。
lyrielv16 - 超写实赛博朋克人像生成AI模型 支持多种编程语言接入
Github开源项目图像生成API接口模型Huggingface人工智能绘画Stable Diffusion APIlyrielv16
lyrielv16是一款基于StableDiffusion的超写实人像生成AI模型。该模型专注于创建电影级品质的赛博朋克风格人像,允许调整面部特征、光效和场景氛围等细节。开发者可通过免费API密钥使用该服务,支持多种编程语言接入,并能自定义图像尺寸、采样步数等参数。lyrielv16适用于需要生成高质量人像的各类项目。
RetroRetro - 像素艺术生成模型,提升电影风格表现
Github开源项目图像生成模型Huggingfacestable-diffusion复古风格Pixel ArtDucHaitenRetro
RetroRetro项目通过融合多种影像模型,引入DucHaitenRetro、Retro Diffusion和Stable Diffusion 1.5,提升像素艺术和电影风格图像的生成效果。在促发像素艺术风格时能高效生成,并在其他风格上亦有出色表现。用户可运用多样化提示语创作,展现热带岛屿或怀旧汽车等主题,平衡游戏与电影视觉效果。该项目为图像生成注入新活力,适合需高质量图形再现的用户。
scoresdeve-ema-celeba-64 - 无条件图像生成的高效DiffusionPipeline
Github开源项目AI绘图图像生成模型推理模型DiffusersHuggingfaceunconditional-image-generation
该项目通过diffusers库的DiffusionPipeline实现无条件图像生成,使用eurecom-ds/celeba数据集,并兼容CUDA设备,提供了加载预训练模型和生成图像的高效方案。模型通过固定种子实现一致的推理输出,适用于AI研究和开发。用户可以自定义推理步骤,满足不同场景下的图像生成需求,拓展计算机视觉应用。
flux-lora-uncensored - Flux LoRA模型的图像生成,探索多种图像可能
Github开源项目图像生成模型ComfyUIFluxHuggingface漏洞性内容
项目通过Fluxgym在本地计算机上训练的Flux LoRA模型,可以使用特定触发词进行图像生成。模型可在ComfyUI、AUTOMATIC1111、SD.Next、Invoke AI、Forge等工具中使用,权重以Safetensors格式提供,并按照非商业许可使用。
amused-256 - 轻量且高效的文本到图像生成工具
Github开源项目图像生成模型文本到图像Huggingface训练优化Amused轻量模型
amused-256是一款基于muse架构的轻量级文本到图像模型,适用于快速大量生成图像的应用。通过并行解码和简化的采样步骤,提高了生成效率。模型使用优化的CLIP文本编码器,共803M参数,较原有的3B参数模型更为小巧。尽管模型体积小,生成图像质量略为降低,但在快速迭代和特定应用场景中仍有出色表现。amused-256允许在简单数据集上进行快速微调,利用最小计算资源来优化训练效果,非常适合资源有限的快速验证任务。
ip_adapter_sdxl_image_encoder - SDXL IP Adapter模型的图像编码器,确保兼容Invoke AI
Github开源项目图像生成模型HuggingfaceImage Encoder社区版IP AdapterInvoke AI
该图像编码器是SDXL IP Adapter模型的必要组件,确保其在Invoke AI 3.2+版本中正常运行。用户可以通过输入图像提示来影响生成过程,并且该项目在invoke.ai和GitHub上均有Community Edition的访问途径。
Cine-Aesthetic - 沉浸式梦幻电影风格,探索超现实氛围
Github开源项目图像生成模型Huggingface超现实电影风格MGWR_Cine氛围光影
此LoRA模型专为创作情感丰富的电影风格图像而设计,融合了梦幻和超现实元素。使用触发词'mgwr/cine',可以生成具有电影感的视觉效果,尤为突出柔和光线、温暖色调以及宁静氛围,适合图像创作者和艺术摄影爱好者探索。模型以Safetensors格式提供下载,是激发创意灵感的推荐工具。
stable-diffusion-2-1-unclip - 基于文本和图像嵌入的Stable Diffusion 2.1增强版
Github开源项目Stable Diffusion图像生成模型Huggingface训练数据模型卡限制与偏见
Stable Diffusion 2.1的增强版可接受CLIP图像嵌入并生成图像变体,通过噪声水平调节控制。适用于艺术创作、设计和研究用途,探索生成模型的偏见和局限。开发者为Robin Rombach和Patrick Esser,使用CreativeML Open RAIL++-M开放许可,但需注意生成的内容可能存在偏见或不当风险。
RealVisXL_V4.0_Lightning - 探索新一代现实风图像生成技术
Github开源项目模型训练Mage图像生成模型HuggingfaceCivitAI真实感
模型正在不断优化中,专注于生成逼真的高质量图像,包括SFW和NSFW内容。模型现阶段尚未定型,可能存在一定的制约。建议用户采用特定的负提示词和生成参数以提升效果。该工具支持多种采样方法和高分辨率增强,现已上线于Mage.Space。有关详细说明可以访问CivitAI,实时更新和支持则通过Boosty获得。
LogoRedmond-LogoLoraForSDXL-V2 - 增强图像生成能力,支持多样化Logo设计
Github开源项目图像生成模型HuggingfaceLORALogo.RedmondRedmond.AI
此LORA模型基于SD XL 1.0进行微调,旨在高效生成多主题的Logo图像,是多样化视觉设计的理想选择。用户可以通过简单的提示词及标签控制,如详细、极简、色彩丰富与黑白等方式调整生成效果。建议以1024x1024分辨率生成以确保最佳图像质量。虽然该LORA模型尚需优化,有时需要多次尝试以获取理想图像,但其灵活性和高生成能力为设计任务提供了有力支持。喜爱此模型的用户可以选择通过Patreon或Ko-fi进行资助。
Rubii AI - 深入体验二次元世界的角色创作与互动
语音合成图像生成AI工具AI创作Rubii AI二次元角色
Rubii AI平台支持个性化二次元角色的创作和互动,拥有先进的模型、长期记忆功能、卓越语音合成及图像生成技术。平台提供探索、瞬间捕捉、角色创作及记忆管理功能,让用户畅享丰富的社区体验。
makeitdoubleplz - 个性化人物写实图像生成工具,兼容稳定扩散模型
Github开源项目图像生成模型Huggingfacestable-diffusion维多利亚人像模型摄影作品
本项目通过diffusers库的文本到图像功能生成个性化的人物写实图像,兼容稳定扩散模型。用户可以根据服装细节和背景环境进行图像定制,使结果更具真实感,为设计师和艺术家提供了广阔的创作空间,是一个实用的视觉创作工具。
control_v11f1e_sd15_tile - 基于ControlNet的高精度图像超分辨率与细节增强模型
Github开源项目深度学习ControlNetStable Diffusion图像生成模型扩散模型Huggingface
control_v11f1e_sd15_tile是ControlNet v1.1系列中专注于图像细节增强的模型。通过与Stable Diffusion结合,该模型能将低分辨率或模糊图像转换为清晰度更高的图像。这个开源项目不仅支持图像超分辨率处理,还可用于生成与输入图像大小相同但细节更丰富的图像,为数字图像处理提供了新的解决方案。
Askrobi - WhatsApp多功能助手,支持艺术创作与文字撰写
AI助手WhatsApp图像生成AI工具Askrobi文章写作
Askrobi是一款可通过WhatsApp互动的智能助手,支持生成艺术作品、撰写内容及多语言翻译。它具有编程和数学运算辅助能力,数据隐私符合WhatsApp标准,用户信息安全有保障。
stable-zero123-diffusers - 将单一图像智能转换为精确三维模型的AI技术
人工智能Github开源项目图像生成模型HuggingfaceZero-1-to-3模型安全内容审核
这是一个基于Stable Diffusion技术的开源项目,通过AI将2D图像自动转换为3D模型。项目采用Objaverse数据集训练,主要应用于研究领域,可用于艺术创作、教育和产品设计。该技术虽在文字渲染和人像生成方面存在限制,但为计算机视觉领域带来突破性进展。
OmniGen-v1 - 多模态图像生成模型特点与能力
人工智能Github开源项目图像生成模型多模态模型优化HuggingfaceOmniGen
OmniGen是一个多模态图像生成模型,支持通过灵活的多模态指令生成多种图像,无需额外插件或操作。安装简便,界面友好,具备从文本生成图像的功能。其设计注重易用性和灵活性,支持用户自定义和微调,满足多样的图像生成需求。
vhs-box - 基于LoRA技术重现80年代和90年代经典VHS封面艺术
Github开源项目图像生成模型Huggingface复古风格VHS Box电影艺术文化创意
该项目利用LoRA技术训练图像模型,复刻80年代和90年代科幻及恐怖电影的VHS封面艺术。通过使用触发词'vhs_box',用户可生成相关图像,并可与diffusers库集成。模型以轻量化的Safetensors格式提供,便于用户进行艺术创作。
NextPhoton - AI图像生成模型以摄影级真实感著称
Github开源项目图像生成AI绘画艺术创作模型Huggingfacestable-diffusion照片风格
NextPhoton通过融合Next Photo 2与Photon两个模型,利用SuperMerger Weight Sum技术实现了高质量的图像生成效果。该模型在人物场景、街拍写真、废弃建筑等场景下表现出较好的真实感,适用于摄影作品创作、场景模拟等应用场景。
karlo-v1-alpha - 文本驱动的超分辨率图像生成
Github开源项目图像生成模型文本到图像高分辨率Huggingface超分辨率Karlo
Karlo v1 alpha利用OpenAI的unCLIP架构实现文本条件下的图像生成。通过改进的超分辨率模块,该模型在有限的去噪步骤中将图像分辨率从64px提升至256px。Karlo在COYO-100M、CC3M和CC12M等数据集上训练,具备优良的图像生成效果,并采用前置、解码及超分辨率模块实现高效处理。还支持生成图像变化,丰富视觉体验。
photoMovieX - 基于Stable Diffusion的电影级AI图像生成模型
Github开源项目AI绘图Stable Diffusion图像生成模型Huggingface科幻风格MagicArt35
photoMovieX是一个基于Stable Diffusion的AI图像生成模型,专注于创造电影级画面。该模型能够融合科幻、复古和超现实主义元素,通过文本提示词生成未来感建筑、复古人物肖像和奇幻场景等独特视觉作品。photoMovieX在创造具有电影感和艺术性的图像方面表现出色,为创意工作者提供了丰富的创作素材。
FLUX.1-dev-Controlnet-Union - 多控制模式文本到图像生成技术
Github开源项目模型训练图像生成开源社区模型HuggingfaceFLUX.1-dev控制模式
FLUX.1-dev-Controlnet-Union是一个整合多种控制模式的文本到图像生成工具,支持canny、tile、depth等模式。当前已经发布beta版本,旨在推动开源社区及Flux生态系统的发展。尽管模型仍在训练中,但在多ControlNets集成方面已展示出优异性能。使用FluxMultiControlNetModel,可以在特定条件下实现高效图像生成。推荐从GitHub获取最新版本以获得最佳支持。
Sudachi_diffusers - 改进文本到图像生成的稳定扩散模型
Github开源项目Stable Diffusion图像生成模型文本生成图像Huggingfacediffusers
Sudachi_diffusers是一种强调稳定扩散的模型,适用于文本到图像的转换,为用户提供高质量的生成效果。
sd-controlnet-depth - 结合深度估计的文本到图像扩散模型
Github开源项目ControlNet图像生成模型稳定扩散深度估计Huggingface条件控制
ControlNet通过深度估计条件增强了Stable Diffusion等模型,允许在个人设备和高性能集群上进行快速训练,即使数据集较小。开发者Lvmin Zhang与Maneesh Agrawala提出的模型具有灵活性,加强了扩散模型的控制方式,推进应用实现。其多种检查点以不同条件训练,提供精细的生成控制。
karlo-v1-alpha-image-variations - 基于unCLIP的文本条件图像生成模型
Github开源项目模型架构图像生成模型文本到图像Huggingface超分辨率Karlo
Karlo v1 alpha通过优化的unCLIP架构提供了文本条件图像生成方案,提升了图像超分辨率性能。该模型在7个降噪步骤中将图像从64px扩展到256px,增强了高频细节表现。项目使用diffusers库,便于高性能GPU上的简便实现。模型在115M图像文本对上进行从头训练,并应用DDPM目标与VQ-GAN风格损失进行优化。
control_v11p_sd15_scribble - ControlNet v1.1 涂鸦版本的图像生成条件控制方法
Github开源项目ControlNetStable Diffusion图像生成模型扩散模型Huggingface条件控制
ControlNet v1.1 引入涂鸦条件以增强图像生成,修复了先前版本的数据问题,并优化了厚涂鸦处理。通过条件控制,该模型可在Stable Diffusion v1-5上实现多样输入条件,如边缘检测和分割,无需高配置硬件即可便捷地进行快速训练。
sdxl-ip-adapter - 探索SDXL中的多IP适配器和图像编码器
Github开源项目Stable Diffusion图像生成模型Huggingface高搜索量多图组合噪声影响
这个开源项目基于SDXL vit-h模型,支持多IP适配器和图像编码器,允许更丰富的图像生成。通过最近更新的功能,与Image Artisan XL无缝集成,项目中包含不同噪声级别的实验结果,展示该工具在文本到图像转换中的多样化应用场景和扩展功能。
sd-controlnet-scribble - 控制扩散模型增强:利用涂鸦图像实现条件控制
Github开源项目神经网络ControlNetStable Diffusion图像生成模型Huggingface条件控制
ControlNet通过引入涂鸦图像等额外输入条件,为预训练的扩散模型提供条件控制,提升其生成能力。即使在训练数据集较少的情况下,该网络仍能保持良好的学习效果。模型支持在个人设备上训练,并可借助计算集群扩展到大规模数据集。此外,Stable Diffusion等扩散模型可与ControlNet结合,增强条件输入灵活性并拓展其应用领域。
visualglm-6b - 中英文图像交互的多模态对话模型
Github开源项目多模态对话语言模型预训练图像生成模型HuggingfaceVisualGLM-6B
VisualGLM-6B是一个多模态对话模型,支持中文、英文和图像交互。基于ChatGLM-6B,有78亿参数,通过BLIP2-Qformer桥接视觉和语言模型。此模型使用CogView数据集进行预训练,并在长视觉问答数据上微调,以生成符合人类偏好的回答。用户可用Python代码简便调用模型,同时提供命令行、网页示例及模型量化的详细说明。