Go语言实现的LLaMA-2本地推理引擎
通俗易懂的大语言模型推理代码解析
中文大语言模型全面资源汇总 数据处理到评估应有尽有
基于重写规则的概率编程语言
面向大型语言模型的高效4位量化框架
批量处理多个LoRA模型以提升GPU利用率
加性量化技术实现大型语言模型高效压缩
人工通用智能研究前沿及未来发展路线图概览
机器人和人工智能融合的前沿研究资源汇编
GPU和Apple芯片在LLaMA 3推理性能基准对比
图上大语言模型研究进展及资源汇总
C语言开发的机器学习张量库 支持多种AI模型推理
Transformer模型推理加速引擎
ChatGLM模型微调教程
优化PyTorch工作流,实现高性能和内存占用减少
一套集成的AI库、工具和技术
LLaMa和RWKV模型的ONNX实现及独立演示,支持多设备部署
构建和优化语言代理的认知架构和实践
支持大语言模型开发与部署的开源套件
使用RAG-Retrieval全面提升信息检索效率与精度
最新AI工具、AI资讯
独家AI资源、AI项目落地
微信扫一扫关注公众号