llm-engine是Scale AI开发的开源大语言模型微调和服务引擎,旨在简化LLM的定制化和部署过程。它提供了Python客户端库、CLI工具和Helm chart,可以在Scale的托管基础设施或自己的Kubernetes集群上运行模型推理和微调。
pip install scale-llm-engine
访问Scale Spellbook创建账号并获取API密钥。
export SCALE_API_KEY="[Your API key]"
from llmengine import Completion response = Completion.create( model="llama-2-7b", prompt="给我一个独特的煎饼店名字", max_new_tokens=100, temperature=0.2, ) print(response.output.text)
llm-engine为开发者提供了强大而灵活的LLM定制化和部署工具,欢迎探索使用并为项目做出贡献!