深度学习最佳AI工具集合:网站、应用和开源项目

dict-guided

dict-guided

场景文字识别VinText数据集

词典指导场景文字识别方法及VinText数据集

blur-kernel-space-exploring

blur-kernel-space-exploring

图像去模糊模糊内核空间

基于编码模糊核空间的图像去模糊新方法

ISBNet

ISBNet

3D点云实例分割

高效准确的3D点云实例分割网络实现先进场景理解

tuning_playbook

tuning_playbook

深度学习超参数调优

深度学习模型性能调优指南

hlb-CIFAR10

hlb-CIFAR10

CIFAR10神经网络

单GPU上CIFAR-10数据集训练的世界纪录级深度学习模型

GPU-Puzzles

GPU-Puzzles

GPU编程CUDA

实践驱动的GPU编程教程 掌握深度学习核心技能

diffusion-forcing

diffusion-forcing

Diffusion Forcing深度学习

创新机器学习方法结合下一步预测和全序列扩散技术

LLM-Workshop

LLM-Workshop

LLM人工智能

大语言模型实践与应用工作坊

Awesome-Foundation-Models

Awesome-Foundation-Models

基础模型多模态

视觉语言基础模型精选资源库

Time-Series-Works-Conferences

Time-Series-Works-Conferences

时间序列预测

全面的时间序列研究与预测资源集合

MetaTransformer

MetaTransformer

Meta-Transformer多模态学习

统一12种模态的多模态学习框架

LLM-Reading-List

LLM-Reading-List

LLMTransformer

大语言模型技术与优化方法的综合阅读列表

RWKV-infctx-trainer

RWKV-infctx-trainer

RWKV深度学习

突破序列长度限制的RWKV模型训练工具

nxtp

nxtp

Object RecognitionAI视觉

基于下一标记预测的创新物体识别技术

InstructUIE

InstructUIE

InstructUIE信息提取

基于Flan T5的统一信息抽取指令微调框架

MixFormer

MixFormer

MixFormer目标追踪

基于迭代混合注意力的端到端目标跟踪框架

RestoreFormerPlusPlus

RestoreFormerPlusPlus

人脸修复RestoreFormer++

先进的高质量人脸图像修复技术

Kaggle-PANDA-1st-place-solution

Kaggle-PANDA-1st-place-solution

PANDA竞赛前列腺癌分级

Kaggle冠军前列腺癌诊断AI模型准确率达94%

prov-gigapath

prov-gigapath

Prov-GigaPath数字病理学

数字病理学全切片基础模型

HAT

HAT

图像超分辨率HAT

激活更多像素的图像超分辨率转换器