视觉语言模型工具集合：应用、网站与开源项目一览

相关项目相关文章

colpali

colpali

ColPali文档检索

基于视觉语言模型的高效文档检索系统

LLaVA-NeXT

LLaVA-NeXT

LLaVA-NeXT多模态模型

大规模开源多模态模型提升视觉语言能力

MiniGPT-4

MiniGPT-4

MiniGPT-v2视觉语言模型

视觉语言多任务学习的统一接口

VILA

VILA

VILA视觉语言模型

创新的视觉语言模型预训练方法

CLIP-ReID

CLIP-ReID

CLIP-ReID图像重识别

基于CLIP的无标签图像重识别新方法

florence2-finetuning

florence2-finetuning

Florence-2微软

视觉语言模型的高效微调实现

cambrian

cambrian

Cambrian-1多模态LLM

开创性视觉为中心的多模态AI模型研究

LLaMA-VID

LLaMA-VID

LLaMA-VID大语言模型

支持长视频处理的多模态大语言模型

gRefCOCO

gRefCOCO

泛化指代表达分割的创新数据集与评估基准

DeepSeek-VL

DeepSeek-VL

DeepSeek-VL视觉语言模型

高性能开源视觉语言模型多模态理解与复杂场景应用

Video-LLaVA

Video-LLaVA

Video-LLaVA视觉语言模型

统一视觉表示学习的新方法增强跨模态交互能力

Awesome-Multimodal-Large-Language-Models

Awesome-Multimodal-Large-Language-Models

多模态大语言模型视觉语言模型

多模态大语言模型研究资源与最新进展汇总

SEED

SEED

SEED-LLaMA多模态

融合视觉与语言的多模态AI框架

daclip-uir

daclip-uir

DA-CLIP视觉语言模型

利用视觉语言模型控制实现通用图像修复

探索AI的无限可能

访问

AI工具导航精选AI信息

推荐工具精选

TRAE编程

TRAE编程

AI辅助编程，代码自动修复

扣子-AI办公

扣子-AI办公

职场AI，就用扣子

码上飞

码上飞

零代码AI应用开发平台

商汤小浣熊

商汤小浣熊

最强AI数据分析助手

讯飞绘文

讯飞绘文

选题、配图、成文，一站式创作，让内容运营更高效

讯飞绘镜

讯飞绘镜

描述即创作，短视频轻松生成

iTerms

iTerms

企业专属的AI法律顾问

AI云服务特惠

懂AI专属折扣

关注微信公众号

最新AI工具、AI资讯
独家AI资源、AI项目落地

微信公众号二维码

微信扫一扫关注公众号

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号