
高效视觉模型展示简洁架构卓越性能

优化GPU训练技术 加速大规模Transformer模型

BABILong基准测试长文本处理能力 评估大语言模型极限

长文本LLM推理的查询感知稀疏化框架

激活感知权重量化技术实现大语言模型高效压缩与加速

全面评估AI模型人类认知能力的基准测试

优化大语言模型长链推理的高效方案

探索百万级token长文本处理的前沿基准

动态稀疏注意力加速长上下文语言模型

大语言模型和视觉语言模型高效服务框架

快速向量搜索与聚类库

基于测试时训练的高表达能力RNN模型

高效2比特KV缓存量化算法提升大型语言模型性能

高效经济的大语言模型微调开源项目

思维链微调数据集提升语言模型少样本学习能力

Transformer模型在单细胞组学分析中的应用概览

PyTorch实现的E(n)等变图神经网络

融合等变图神经网络与Transformer的创新架构

GPU和Apple芯片在LLaMA 3推理性能基准对比

语音识别模型的高效微调与加速
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号