懂AI
首页AI导航显卡排名AI云厂商折扣优惠
发现
🔥热门推荐🧭AI导航
分类
🤖AI助手🖼️AI图像🎬AI视频📊AI办公🎵AI音频💻AI开发🎨AI创意

视觉语言模型工具集合:应用、网站与开源项目一览

相关项目相关文章
colpali

colpali

ColPali文档检索

基于视觉语言模型的高效文档检索系统

LLaVA-NeXT

LLaVA-NeXT

LLaVA-NeXT多模态模型

大规模开源多模态模型提升视觉语言能力

MiniGPT-4

MiniGPT-4

MiniGPT-v2视觉语言模型

视觉语言多任务学习的统一接口

VILA

VILA

VILA视觉语言模型

创新的视觉语言模型预训练方法

CLIP-ReID

CLIP-ReID

CLIP-ReID图像重识别

基于CLIP的无标签图像重识别新方法

florence2-finetuning

florence2-finetuning

Florence-2微软

视觉语言模型的高效微调实现

cambrian

cambrian

Cambrian-1多模态LLM

开创性视觉为中心的多模态AI模型研究

LLaMA-VID

LLaMA-VID

LLaMA-VID大语言模型

支持长视频处理的多模态大语言模型

gRefCOCO

gRefCOCO

GRESgRefCOCO

泛化指代表达分割的创新数据集与评估基准

DeepSeek-VL

DeepSeek-VL

DeepSeek-VL视觉语言模型

高性能开源视觉语言模型 多模态理解与复杂场景应用

Video-LLaVA

Video-LLaVA

Video-LLaVA视觉语言模型

统一视觉表示学习的新方法 增强跨模态交互能力

Awesome-Multimodal-Large-Language-Models

Awesome-Multimodal-Large-Language-Models

多模态大语言模型视觉语言模型

多模态大语言模型研究资源与最新进展汇总

SEED

SEED

SEED-LLaMA多模态

融合视觉与语言的多模态AI框架

daclip-uir

daclip-uir

DA-CLIP视觉语言模型

利用视觉语言模型控制实现通用图像修复

上一页
234
下一页

探索AI的无限可能

访问

AI工具导航精选AI信息

推荐工具精选

TRAE编程

TRAE编程

推荐

AI辅助编程,代码自动修复

扣子-AI办公

扣子-AI办公

推荐

职场AI,就用扣子

码上飞

码上飞

推荐

零代码AI应用开发平台

商汤小浣熊

商汤小浣熊

最强AI数据分析助手

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘镜

讯飞绘镜

描述即创作,短视频轻松生成

iTerms

iTerms

企业专属的AI法律顾问

AI云服务特惠

懂AI专属折扣

关注微信公众号

最新AI工具、AI资讯
独家AI资源、AI项目落地

微信公众号二维码

微信扫一扫关注公众号

使用协议隐私政策广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号