mpv-upscale-2x_animejanai

mpv-upscale-2x_animejanai

实时动漫视频超分辨率增强工具

mpv-upscale-2x_animejanai是一个基于mpv播放器的动漫视频实时超分辨率工具。它采用2x_AnimeJaNai模型,可将1080p内容实时提升至4K分辨率。该工具兼容NVIDIA、AMD和Intel Arc显卡,提供多种预设配置以平衡性能和画质,同时支持自定义设置。除了提高视频清晰度,它还能修复缩放和模糊问题,使动漫画面呈现出近似原生4K的效果。该工具集成了多种2x_AnimeJaNai模型,包括针对HD和SD动漫源的特定优化版本。用户可根据硬件性能选择不同的处理模式,实现从性能到画质的灵活平衡。此外,该项目还提供了一个配置编辑器,方便用户进行个性化调整。

Real-ESRGANmpv视频上采样AI增强ONNX模型Github开源项目

在 mpv 中使用 2x_AnimeJaNai V3 放大动画

Discord

<a href="./demov3.webp?raw=1"><img src="https://yellow-cdn.veclightyear.com/0a4dffa0/d0988f67-cd46-4536-8949-8ab2b15a38e1.webp"/></a>

<p align="center"><sup>(点击图片放大)</sup></p>

概述

本项目提供了一系列 Real-ESRGAN Compact ONNX 放大模型,以及一个定制版的 mpv 视频播放器。该视频播放器(目前仅支持 Windows)能够使用 TensorRT(仅限 NVIDIA)或 DirectML(适用于 AMD 或 Intel Arc)实时将 1080p 内容放大到 4K。虽然默认配置使用 2x_AnimeJaNai 模型进行放大,但可以轻松自定义以使用任何 Real-ESRGAN Compact ONNX 模型。

加入 JaNai Discord 服务器 获取最新消息、下载预发布和实验性模型、获得支持和提问、分享您的截图(在 mpv 中使用 s 键),或分享您的反馈。日本語も大丈夫です。

使用说明

确保您的 NVIDIA 显卡驱动已更新。下载并解压 mpv-upscale-2x_animejanai 的最新发布版本。打开位于 mpvnet.exe 的视频播放器。

首次播放视频时,将为选定的 ONNX 模型创建 TensorRT 引擎文件。播放将暂停,并会打开一个命令提示符窗口。请等待引擎创建完成。每个模型只需创建一次引擎。完成后,播放将自动恢复。

要确认放大状态,请按 ctrl+J 查看放大统计信息。这将显示当前配置文件和正在运行的放大模型(如果有)。

播放器预先配置为使用 2x_AnimeJaNai 模型进行放大,默认提供 3 个放大配置文件。可用的配置文件在下面有更详细的描述。可以使用下列快捷键随时选择这些配置文件。

配置文件描述快捷键将 1080p 放大到 4k 的最低推荐 GPU
质量最高质量模型Shift+1RTX 4090
平衡高质量模型,以轻微的质量损失换取显著的性能提升Shift+2RTX 3080
性能最快速的性能模型,牺牲更多质量Shift+3RTX 3060

默认放大配置文件是平衡配置,推荐使用 NVIDIA RTX 3080 或更高级别显卡的用户使用。

自定义配置文件和其他设置

可以通过 AnimeJaNaiConfEditor 进一步自定义放大设置,在 mpvnet 中按 ctrl+E 即可启动编辑器。该编辑器允许设置多达 9 个自定义插槽,还可以使用自定义链、基于视频分辨率和帧率的条件设置、降低分辨率以提高性能等。默认放大配置文件也可以使用配置编辑器设置。

image

所有其他 mpv 设置可以通过编辑 mpv-upscale-2x_animejanai/portable_config/mpv.conf(查看 mpv 手册 了解所有选项)进行 mpv 选项配置,或编辑 mpv-upscale-2x_animejanai/portable_config/input.conf 进行 mpv 快捷键绑定配置。

默认情况下,可以使用 s 键截图,截图保存在 mpv-upscale-2x_animejanai/portable_config/screenshots 目录下。

AMD 或 Intel Arc 用户设置

mpv-upscale-2x_animejanai 默认配置为使用 TensorRT 以获得最佳性能,但 TensorRT 需要 NVIDIA GPU。AMD 或 Intel Arc GPU 用户可以使用 DirectML 替代。详细说明请参阅 wiki 页面

2x_AnimeJaNai 模型

2x_AnimeJaNai 模型是一系列专门设计用于将 HD 和 SD 模型分辨率翻倍的实时 2x Real-ESRGAN Compact、UltraCompact 和 SuperUltraCompact 模型。

2x_AnimeJaNai HD V3 模型

大多数 HD 动画并非原生 1080p 分辨率,而是在 720p 到 1080p 之间的制作分辨率。当动画通过电视广播、网络流媒体或家庭视频分发给消费者时,视频会被放大到 1080p,导致源视频出现缩放伪影和图像清晰度损失。这些模型的目标是在放大过程中解决这些缩放和模糊相关的问题,以呈现出动画原本就是 4K 分辨率制作的效果。 V3模型的开发历时7个多月,期间训练并精心改进了100多个候选版本。与V2相比,V3模型有以下几个显著改进:

  • 更忠实地还原原始画面
  • 改善了过度锐化、振铃和锯齿等问题
  • 更好地保留了场景中有意为之的模糊效果
  • 线条颜色、深浅和粗细更加准确
  • 更好地保留了柔和阴影边缘

总的来说,V3模型相比V2能产生更自然、更忠实的结果。

2x_AnimeJaNai SD V1模型

2x_AnimeJaNai SD V1模型正在开发中。mpv-upscale-2x_animejanai的最新版本包含了2x_AnimeJaNai SD V1的早期测试版模型。虽然2xAnimeJaNai HD模型对某些SD源也有不错的效果,但这些模型专门针对HD动画进行训练,不一定适用于所有SD源。SD模型旨在将SD动画放大,使其看起来像是以HD分辨率制作的。在硬件条件允许的情况下,这些模型可以与HD模型叠加使用,将SD动画放大到4K分辨率。

性能测试

wiki上提供了针对不同硬件配置和不同放大设置的性能测试结果。

对其他媒体播放器的支持

任何支持外部DirectShow过滤器的媒体播放器都应该能运行这些模型,只需使用avisynth_filter在视频播放器中运行VapourSynth即可。

使用其他显卡预渲染视频

2x_AnimeJaNai_V2 ONNX模型可以在任何显卡的PC上用于渲染放大后的视频,即使在无法实时播放的显卡上也可以。Windows用户可以使用AnimeJaNaiConverterGui项目创建放大后的视频文件。其他选择还包括chaiNNer或VSGAN-tensorrt-docker,这些是适用于Windows和非Windows用户的多平台选项。

相关项目

  • MangaJaNai:使用ESRGAN模型放大漫画
  • VideoJaNai:用于高性能放大视频的Windows图形界面
  • traiNNer-redux:用于训练放大模型的软件

致谢

  • Upscale Wiki及其Discord服务器
  • 422415在数据集准备和V2模型开发过程中提供的重要帮助和持续反馈
  • 社区对V1模型的反馈
  • MPV_lazy和vs-mlrt
  • traiNNer-redux
  • Dataset Destroyer
  • Real-ESRGAN
  • OpenModelDB
  • getnative和anibin

编辑推荐精选

TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

热门AI工具生产力协作转型TraeAI IDE
蛙蛙写作

蛙蛙写作

AI小说写作助手,一站式润色、改写、扩写

蛙蛙写作—国内先进的AI写作平台,涵盖小说、学术、社交媒体等多场景。提供续写、改写、润色等功能,助力创作者高效优化写作流程。界面简洁,功能全面,适合各类写作者提升内容品质和工作效率。

AI助手AI工具AI写作工具AI辅助写作蛙蛙写作学术助手办公助手营销助手
问小白

问小白

全能AI智能助手,随时解答生活与工作的多样问题

问小白,由元石科技研发的AI智能助手,快速准确地解答各种生活和工作问题,包括但不限于搜索、规划和社交互动,帮助用户在日常生活中提高效率,轻松管理个人事务。

聊天机器人AI助手热门AI工具AI对话
Transly

Transly

实时语音翻译/同声传译工具

Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

热门AI工具AI办公办公工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

模型训练热门AI工具内容创作智能问答AI开发讯飞星火大模型多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

AI助手热门AI工具AI创作AI辅助写作讯飞绘文内容运营个性化文章多平台分发
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

下拉加载更多