windows
和macos
下解压。原链接仅支持windows
。)如果您在研究中使用了此数据,请引用我们的论文 LLVIP: A Visible-infrared Paired Dataset for Low-light Vision:
@inproceedings{jia2021llvip,
title={LLVIP: A visible-infrared paired dataset for low-light vision},
author={Jia, Xinyu and Zhu, Chuang and Li, Minzhen and Tang, Wenqi and Zhou, Wenli},
booktitle={Proceedings of the IEEE/CVF International Conference on Computer Vision},
pages={3496--3504},
year={2021}
}
或
@misc{https://doi.org/10.48550/arxiv.2108.10831,
doi = {10.48550/ARXIV.2108.10831},
url = {https://arxiv.org/abs/2108.10831},
author = {Jia, Xinyu and Zhu, Chuang and Li, Minzhen and Tang, Wenqi and Liu, Shengjie and Zhou, Wenli},
keywords = {Computer Vision and Pattern Recognition (cs.CV), Artificial Intelligence (cs.AI), FOS: Computer and information sciences, FOS: Computer and information sciences},
title = {LLVIP: A Visible-infrared Paired Dataset for Low-light Vision},
publisher = {arXiv},
year = {2021},
copyright = {arXiv.org perpetual, non-exclusive license}
}
<h2> <p align="center"> 图像融合 </p> </h2>
基线方法
git clone https://github.com/bupt-ai-cz/LLVIP.git cd LLVIP/FusionGAN # 使用anaconda创建虚拟环境 conda create -n FusionGAN python=3.7 conda activate FusionGAN conda install matplotlib scipy==1.2.1 tensorflow-gpu==1.14.0 pip install opencv-python sudo apt install libgl1-mesa-glx
FusionGAN
├── ...
├── Test_LLVIP_ir
| ├── 190001.jpg
| ├── 190002.jpg
| └── ...
├── Test_LLVIP_vi
| ├── 190001.jpg
| ├── 190002.jpg
| └── ...
├── Train_LLVIP_ir
| ├── 010001.jpg
| ├── 010002.jpg
| └── ...
└── Train_LLVIP_vi
├── 010001.jpg
├── 010002.jpg
└── ...
python main.py --epoch 10 --batch_size 32
更多训练选项请参见main.py
。
python test_one_image.py
请记得将预训练模型放在checkpoint
文件夹中,并在test_one_image.py
中更改相应的模型名称。
如需获取完整的LLVIP数据集,请访问https://bupt-ai-cz.github.io/LLVIP/。
git clone https://github.com/bupt-ai-cz/LLVIP cd LLVIP/imagefusion_densefuse # 使用anaconda创建虚拟环境 conda create -n Densefuse python=3.7 conda activate Densefuse conda install scikit-image scipy==1.2.1 tensorflow-gpu==1.14.0
imagefusion_densefuse
├── ...
├──datasets
| ├──010001_ir.jpg
| ├──010001_vi.jpg
| └── ...
├──test
| ├──190001_ir.jpg
| ├──190001_vi.jpg
| └── ...
└──LLVIP
├── infrared
| ├──train
| | ├── 010001.jpg
| | ├── 010002.jpg
| | └── ...
| └──test
| ├── 190001.jpg
| ├── 190002.jpg
| └── ...
└── visible
├──train
| ├── 010001.jpg
| ├── 010002.jpg
| └── ...
└── test
├── 190001.jpg
├── 190002.jpg
└── ...
python main.py
请在main.py
中检查并修改训练/测试选项。在训练/测试之前,您需要重命名LLVIP数据集中的图像并将它们放在指定的文件夹中。我们提供了一个名为rename.py
的脚本,用于重命名图像并将它们保存在datasets
或test
文件夹中。检查点保存在./models/densefuse_gray/
中。如需获取完整的LLVIP数据集,请访问https://bupt-ai-cz.github.io/LLVIP/。
请访问https://github.com/uzeful/IFCNN。
<h2> <p align="center"> 行人检测 </p> </h2>基准模型
安装依赖
git clone https://github.com/bupt-ai-cz/LLVIP.git cd LLVIP/yolov5 pip install -r requirements.txt
文件结构
LLVIP的训练集用于训练yolov5模型,测试集用于验证yolov5模型。
yolov5
├── ...
└──LLVIP
├── labels
| ├──train
| | ├── 010001.txt
| | ├── 010002.txt
| | └── ...
| └──val
| ├── 190001.txt
| ├── 190002.txt
| └── ...
└── images
├──train
| ├── 010001.jpg
| ├── 010002.jpg
| └── ...
└── val
├── 190001.jpg
├── 190002.jpg
└── ...
我们提供了一个工具箱,用于将注释文件转换为yolov5格式的txt文件。
python train.py --img 1280 --batch 8 --epochs 200 --data LLVIP.yaml --weights yolov5l.pt --name LLVIP_export
更多训练选项请参见train.py
。预训练模型yolov5l.pt
可以从这里下载。训练好的模型将保存在./runs/train/LLVIP_export/weights
文件夹中。
python val.py --data --img 1280 --weights last.pt --data LLVIP.yaml
请记得将训练好的模型放在与val.py
相同的文件夹中。
我们训练好的模型可以从以下链接下载:Google-Drive-Yolov5-model或百度网盘-Yolov5-model(提取码:qepr)
我们在更新后的数据集(30976张图像)上重新训练并测试了Yolov5l和Yolov3。
<div align="center"> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/ebc3a4cd-53d1-44ce-a90d-4fc3eadfc1b2.jpg" height="130" width="700"> </div> 其中AP表示IoU阈值从0.5到0.95(间隔为0.05)的平均精度。 <div align="center"> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/b0fa749d-79df-4843-89a6-1b54bbcd47bc.png" height="510" width="700"> </div>上图显示了不同IoU阈值下AP的变化。当IoU阈值高于0.7时,AP值迅速下降。此外,红外图像突出显示行人,在检测任务中取得了比可见光图像更好的效果,这不仅证明了红外图像的必要性,还表明在低光照条件下可见光图像行人检测算法的性能不够理想。
我们还根据测试结果计算了对数平均漏检率,并绘制了漏检率-FPPI曲线。
<div align="center"> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/a9669bda-e3a6-4da3-8d98-6e7211dc4c28.jpeg" height="110" width="700"> </div> <div align="center"> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/de506fb7-c3d3-405a-938e-2154dfaf634d.png" height="510" width="700"> </div> <h2> <p align="center"> 图像到图像转换 </p> </h2>基准
cd pix2pixGAN pip install -r requirements.txt
pix2pixGAN
├── ...
└──datasets
├── ...
└──LLVIP
├── train
| ├── 010001.jpg
| ├── 010002.jpg
| ├── 010003.jpg
| └── ...
└── test
├── 190001.jpg
├── 190002.jpg
├── 190003.jpg
└── ...
python train.py --dataroot ./datasets/LLVIP --name LLVIP --model pix2pix --direction AtoB --batch_size 8 --preprocess scale_width_and_crop --load_size 320 --crop_size 256 --gpu_ids 0 --n_epochs 100 --n_epochs_decay 100
python test.py --dataroot ./datasets/LLVIP --name LLVIP --model pix2pix --direction AtoB --gpu_ids 0 --preprocess scale_width_and_crop --load_size 320 --crop_size 256
更多训练和测试选项请参见 ./pix2pixGAN/options
。
我们在更新后的数据集(30976张图像)上重新训练和测试了pix2pixGAN。生成器的结构是unet256,判别器的结构是默认的基本PatchGAN。
<div align="center"> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/cb38f2ff-c157-4474-abf8-e3fd51327f75.jpeg" height="100" width="700"> </div> <div align="center"> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/755e9a23-a4f7-4e23-a197-a6c0d29f0593.png" height="610" width="700"> </div>LLVIP数据集免费提供给学术和非学术实体用于非商业目的,如学术研究、教学、科学出版或个人实验。在您同意我们的许可条款的情况下,允许使用该数据。
欢迎指出数据标注中的错误。如果您想修改标签,请参考标注教程,并将修正后的标签文件发送给我们。
我们也欢迎更多的标注形式(如分割),请与我们联系。
感谢XueZ-phd对LLVIP数据集的贡献。他纠正了数据集中不完善的标注。
电子邮件:shengjie.Liu@bupt.edu.cn, czhu@bupt.edu.cn, jiaxinyujxy@qq.com, tangwenqi@bupt.edu.cn
AI辅助编程,代码自动修复
Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。
AI小说写作助手,一站式润色、改写、扩写
蛙蛙写作—国内先进的AI写作平台,涵盖小说、学术、社交媒体等多场景。提供续写、改写、润色等功能,助力创作者高效优化写作流程。界面简洁,功能全面,适合各类写作者提升内容品质和工作效率。
全能AI智能助手,随时解答生活与工作的多样问题
问小白,由元石科技研发的AI智能助手,快速准确地解答各种生活和工作问题,包括但不限于搜索、规划和社交互动,帮助用户在日常生活中提高效率,轻松管理个人事务。
实时语音翻译/同声传译工具
Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。
一键生成PPT和Word,让学习生活更轻松
讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。
深度推理能力全新升级,全面对标OpenAI o1
科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。
一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型
Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。
AI助力,做PPT更简单!
咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。
选题、配图、成文,一站式创作,让内容运营更高效
讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。
专业的AI公文写作平台,公文写作神器
AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。
最新AI工具、AI资讯
独家AI资源、AI项目落地
微信扫一扫关注公众号