ECCV 2024论文开源项目全面汇总:前沿研究一览无遗

RayRay
ECCV 2024计算机视觉深度学习自动驾驶AIGCGithub开源项目

ECCV2024-Papers-with-Code

ECCV 2024论文开源项目全面汇总:前沿研究一览无遗

欧洲计算机视觉会议(ECCV)作为计算机视觉领域的顶级学术会议之一,每两年举办一次。ECCV 2024将于今年9月在苏黎世举行,目前录用结果已经公布。本文全面整理了ECCV 2024录用的开源论文及代码,涵盖了计算机视觉各大热门研究方向,为广大研究人员提供了最新最全的学术资源。

3D高斯散射(3D Gaussian Splatting)

3D高斯散射是近期兴起的一种新颖的3D场景表示和渲染方法,在ECCV 2024中有多篇相关论文被录用:

  1. MVSplat: Efficient 3D Gaussian Splatting from Sparse Multi-View Images 这篇论文提出了一种从稀疏多视图图像高效重建3D高斯场景的方法。 项目主页 | 论文 | 代码

  2. CityGaussian: Real-time High-quality Large-Scale Scene Rendering with Gaussians 该工作实现了大规模城市场景的实时高质量渲染。 论文 | 代码

  3. FSGS: Real-Time Few-shot View Synthesis using Gaussian Splatting 这篇论文探索了基于高斯散射的少样本视图合成方法。 项目主页 | 论文 | 代码

Mamba / 状态空间模型(SSM)

Mamba是一种新兴的序列建模架构,在计算机视觉领域也开始有所应用:

  1. VideoMamba: State Space Model for Efficient Video Understanding 这篇论文将Mamba应用于视频理解任务。 论文 | 代码

  2. ZIGMA: A DiT-style Zigzag Mamba Diffusion Model 该工作提出了一种基于Mamba的图像生成扩散模型。 论文 | 项目主页

多模态大语言模型(MLLM)

多模态大语言模型是近期人工智能领域的研究热点,ECCV 2024也有多篇相关工作:

  1. SQ-LLaVA: Self-Questioning for Large Vision-Language Assistant 这篇论文提出了一种自问自答的视觉语言助手模型。 论文 | 代码

  2. ControlCap: Controllable Region-level Captioning 该工作实现了可控的区域级图像描述生成。 论文 | 代码

扩散模型(Diffusion Models)

扩散模型在图像生成领域持续发力,ECCV 2024中也有多项相关研究:

  1. ZIGMA: A DiT-style Zigzag Mamba Diffusion Model 这篇论文将Mamba架构引入扩散模型。 论文 | 项目主页

  2. Skews in the Phenomenon Space Hinder Generalization in Text-to-Image Generation 该工作探讨了文本到图像生成中的泛化问题。 论文 | 代码

  3. The Lottery Ticket Hypothesis in Denoising: Towards Semantic-Driven Initialization 这篇论文研究了扩散模型去噪过程中的彩票假说。 项目主页 | 论文 | 代码

Vision Transformer

Transformer在计算机视觉领域的应用持续深入:

GiT: Towards Generalist Vision Transformer through Universal Language Interface 这篇论文提出了一种通用语言接口的通用视觉Transformer模型。 论文 | 代码

目标检测(Object Detection)

目标检测作为计算机视觉的基础任务,在ECCV 2024中也有新的突破:

  1. Relation DETR: Exploring Explicit Position Relation Prior for Object Detection 这篇论文探索了显式位置关系先验在目标检测中的应用。 论文 | 代码 | 数据集

  2. Cross-Domain Few-Shot Object Detection via Enhanced Open-Set Object Detector 该工作研究了跨域少样本目标检测问题。 项目主页 | 论文 | 代码

语义分割(Semantic Segmentation)

语义分割是计算机视觉的另一个重要任务,ECCV 2024也有相关创新:

Context-Guided Spatial Feature Reconstruction for Efficient Semantic Segmentation 这篇论文提出了一种基于上下文引导的空间特征重建方法,用于高效语义分割。 论文 | 代码

医学图像(Medical Image)

医学图像分析是计算机视觉在医疗领域的重要应用,ECCV 2024中有多项相关研究:

  1. Brain-ID: Learning Contrast-agnostic Anatomical Representations for Brain Imaging 这篇论文研究了脑成像的对比度无关解剖表征学习。 论文 | 代码

  2. FairDomain: Achieving Fairness in Cross-Domain Medical Image Segmentation and Classification 该工作探讨了跨域医学图像分割和分类中的公平性问题。 项目主页 | 论文 | 数据集 | 代码

  3. ScribblePrompt: Fast and Flexible Interactive Segmentation for Any Biomedical Image 这篇论文提出了一种快速灵活的生物医学图像交互式分割方法。 项目主页 | 论文 | 代码

视频目标分割(Video Object Segmentation)

视频目标分割是视频理解的重要任务之一:

DVIS-DAQ: Improving Video Segmentation via Dynamic Anchor Queries 这篇论文提出了一种基于动态锚点查询的视频分割改进方法。 项目主页 | 论文 | 代码

自动驾驶(Autonomous Driving)

自动驾驶是计算机视觉的重要应用领域,ECCV 2024中有多项相关研究:

  1. Fully Sparse 3D Occupancy Prediction 这篇论文提出了一种全稀疏3D占据预测方法。 论文 | 代码

  2. milliFlow: Scene Flow Estimation on mmWave Radar Point Cloud for Human Motion Sensing 该工作研究了毫米波雷达点云上的场景流估计,用于人体运动感知。 论文 | 代码

  3. 4D Contrastive Superflows are Dense 3D Representation Learners 这篇论文提出了一种基于4D对比超流的密集3D表征学习方法。 论文 | 代码

3D目标检测(3D Object Detection)

3D目标检测在自动驾驶等领域有重要应用:

  1. 3D Small Object Detection with Dynamic Spatial Pruning 这篇论文提出了一种动态空间剪枝的3D小目标检测方法。 项目主页 | 论文 | 代码

  2. Ray Denoising: Depth-aware Hard Negative Sampling for Multi-view 3D Object Detection 该工作提出了一种深度感知的硬负样本采样方法,用于多视图3D目标检测。 论文 | 代码

图像编辑(Image Editing)

图像编辑是计算机视觉的重要应用之一:

BrushNet: A Plug-and-Play Image Inpainting Model with Decomposed Dual-Branch Diffusion 这篇论文提出了一种即插即用的图像修复模型,基于分解的双分支扩散。 项目主页 | 论文 | 代码

Low-level Vision

低层视觉任务在计算机视觉中具有基础性作用:

  1. Restoring Images in Adverse Weather Conditions via Histogram Transformer 这篇论文提出了一种基于直方图Transformer的恶劣天气图像恢复方法。 论文 | 代码

  2. OneRestore: A Universal Restoration Framework for Composite Degradation 该工作提出了一种通用的复合退化图像恢复框架。 项目主页 | 论文 | 代码

图像生成(Image Generation)

图像生成是近年来计算机视觉和人工智能的热门研究方向:

  1. Object-Conditioned Energy-Based Attention Map Alignment in Text-to-Image Diffusion Models 这篇论文研究了文本到图像扩散模型中的对象条件能量基注意力图对齐。 论文 | 代码

  2. Every Pixel Has its Moments: Ultra-High-Resolution Unpaired Image-to-Image Translation via Dense Normalization 该工作提出了一种基于密集归一化的超高分辨率无配对图像到图像翻译方法。 项目主页 | 论文 | 代码

视频生成(Video Generation)

视频生成是图像生成的自然延伸,也是当前的研究热点:

VideoStudio: Generating Consistent-Content and Multi-Scene Videos 这篇论文提出了一种生成内容一致和多场景视频的方法。

编辑推荐精选

Vora

Vora

免费创建高清无水印Sora视频

Vora是一个免费创建高清无水印Sora视频的AI工具

Refly.AI

Refly.AI

最适合小白的AI自动化工作流平台

无需编码,轻松生成可复用、可变现的AI自动化工作流

酷表ChatExcel

酷表ChatExcel

大模型驱动的Excel数据处理工具

基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。

AI工具酷表ChatExcelAI智能客服AI营销产品使用教程
TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
AIWritePaper论文写作

AIWritePaper论文写作

AI论文写作指导平台

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

AI辅助写作AI工具AI论文工具论文写作智能生成大纲数据安全AI助手热门
博思AIPPT

博思AIPPT

AI一键生成PPT,就用博思AIPPT!

博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。

AI办公办公工具AI工具博思AIPPTAI生成PPT智能排版海量精品模板AI创作热门
潮际好麦

潮际好麦

AI赋能电商视觉革命,一站式智能商拍平台

潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。

iTerms

iTerms

企业专属的AI法律顾问

iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。

SimilarWeb流量提升

SimilarWeb流量提升

稳定高效的流量提升解决方案,助力品牌曝光

稳定高效的流量提升解决方案,助力品牌曝光

Sora2视频免费生成

Sora2视频免费生成

最新版Sora2模型免费使用,一键生成无水印视频

最新版Sora2模型免费使用,一键生成无水印视频

下拉加载更多