food

food

基于Vision Transformer的101种美食图像分类模型

该模型是基于google/vit-base-patch16-224-in21k预训练模型在food101数据集上微调的图像分类模型。采用Vision Transformer架构,经5轮训练后在评估集上达到89.13%的准确率。模型能识别101种不同类型的美食,可应用于餐饮行业的图像自动分类和识别。训练过程使用Adam优化器和线性学习率调度器,batch size为128。

ViTHuggingface图像分类模型迁移学习深度学习Github开源项目食物识别

I-live-well-foodai

I-live-well-foodai

GithubHuggingface

视觉transformer食品图像智能分类系统

food-category-classification-v2.0

food-category-classification-v2.0

12类食品图像分类模型准确率达96%

pretrained-xlmR-food

pretrained-xlmR-food

GithubHuggingface

XLM-RoBERTa多语言食品文本分类模型

rorshark-vit-base

rorshark-vit-base

GithubHuggingface

ViT架构图像分类模型实现99.23%精度

vit-base-cats-vs-dogs

vit-base-cats-vs-dogs

GithubHugging Face

基于Vision Transformer的猫狗图像分类模型

vit_small_r26_s32_384.augreg_in21k_ft_in1k

vit_small_r26_s32_384.augreg_in21k_ft_in1k

GithubHuggingface

ResNet与Vision Transformer结合的图像分类模型解析

vit_small_patch14_reg4_dinov2.lvd142m

vit_small_patch14_reg4_dinov2.lvd142m

GithubHuggingface

基于自监督学习的视觉Transformer用于图像特征提取和分类

vit-base-patch32-384

vit-base-patch32-384

GithubHuggingface

Vision Transformer图像分类模型支持大规模数据训练

vit_base_r50_s16_384.orig_in21k_ft_in1k

vit_base_r50_s16_384.orig_in21k_ft_in1k

GithubHuggingface

ResNet-Vision Transformer混合模型用于高精度图像分类

ml-fastvit

ml-fastvit

高效混合视觉Transformer模型用于图像分类

探索AI的无限可能

访问

AI工具导航精选AI信息

推荐工具精选

TRAE编程

TRAE编程

AI辅助编程，代码自动修复

扣子-AI办公

扣子-AI办公

职场AI，就用扣子

码上飞

码上飞

零代码AI应用开发平台

商汤小浣熊

商汤小浣熊

最强AI数据分析助手

讯飞绘文

讯飞绘文

选题、配图、成文，一站式创作，让内容运营更高效

讯飞绘镜

讯飞绘镜

描述即创作，短视频轻松生成

iTerms

iTerms

企业专属的AI法律顾问

AI云服务特惠

懂AI专属折扣

关注微信公众号

最新AI工具、AI资讯
独家AI资源、AI项目落地

微信公众号二维码

微信扫一扫关注公众号

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号