图像识别

大型视觉Transformer模型实现高效图像识别与特征提取

轻量级视觉语言模型 强大性能与高效结构的完美结合

集成图像理解与语言生成的视觉语言模型

基于CLIP模型的图像安全检查工具

Meta开发的多模态语言模型 提供图像理解与文本生成

基于ImageNet-21k预训练的视觉Transformer模型

视觉智能搜索,让世界触手可及

基于 Tesseract 的 Android OCR 库 支持多线程识别

实时视频流分析工具,基于OpenAI视觉API

将多模态嵌入到大语言模型的开源框架

PyTorch实现LeNet-5识别MNIST数据集

基于OpenCV和NumPy的轻量级Python OCR工具

基于PaddleOCR的跨平台离线文字识别组件

Android机器学习开发的高效工具库

基于tesseract-ocr的开源图像文字识别工具 支持多格式处理

Python封装的OCR引擎简化技术集成

Go语言OCR解决方案 利用Tesseract C++库

用于PHP的Tesseract OCR封装库

将动漫截图精准溯源的开源搜索引擎

跨平台的图像识别自动化工具
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号