
Starling-LM-7B-beta提升语言模型生成质量与安全性
Starling-LM-7B-beta是一款基于AI反馈优化并从Openchat-3.5-0106微调的大型语言模型。通过升级后的奖励模型和策略优化,增强了语言生成质量和安全性,并在GPT-4评测中取得了8.12的高分。适用于多种对话场景,用户可在LMSYS Chatbot Arena免费测试,非常适合关注交互体验的开发者和研究人员。
Starling-LM-7B-beta 是由 Nexusflow 团队开发的开源大语言模型。该团队成员分别是 Banghua Zhu、Evan Frick、Tianhao Wu、Hanlin Zhu、Karthik Ganesan、Wei-Lin Chiang、Jian Zhang 和 Jiantao Jiao。该项目在 Openchat-3.5-0106 的基础上进行微调,并结合使用来自 AI 反馈的强化学习(RLAIF)技术进行训练。Starling-LM-7B-beta 受 Apache-2.0 许可证保护,但不可用于与 OpenAI 的竞品开发。
Starling-LM-7B-beta 是一种语言模型,源自 Openchat-3.5-0106,此基础模型上结合了新的奖励模型 Nexusflow/Starling-RM-34B 和策略优化方法(指南语言模型的偏好微调)。这些优化提高了模型的性能,在使用 GPT-4 作为评审官的 MT Bench 中获得了 8.12 的高分。
Starling-LM-7B-beta 的设计与 Openchat-3.5-0106 的使用方法保持一致,用户可以参考该模型的详细使用说明。此外,Starling-LM-7B-beta 还被托管在 LMSYS Chatbot Arena 平台上,供用户免费进行测试。
在执行对话时,建议用户严格按照给定的聊天模板,以避免性能下降。为了确保输出不冗长,可以将温度参数设置为0。
以下是模型使用的模板格式:
import transformers tokenizer = transformers.AutoTokenizer.from_pretrained("openchat/openchat-3.5-0106") # 单轮对话 tokens = tokenizer("GPT4 Correct User: Hello<|end_of_turn|>GPT4 Correct Assistant:").input_ids
以下是使用 Starling-LM-7B-beta 进行文本生成的示例代码:
import transformers tokenizer = transformers.AutoTokenizer.from_pretrained("Nexusflow/Starling-LM-7B-beta") model = transformers.AutoModelForCausalLM.from_pretrained("Nexusflow/Starling-LM-7B-beta") def generate_response(prompt): input_ids = tokenizer(prompt, return_tensors="pt").input_ids outputs = model.generate( input_ids, max_length=256, pad_token_id=tokenizer.pad_token_id, eos_token_id=tokenizer.eos_token_id, ) response_ids = outputs[0] response_text = tokenizer.decode(response_ids, skip_special_tokens=True) return response_text # 单轮对话 prompt = "Hello, how are you?" single_turn_prompt = f"GPT4 Correct User: {prompt}<|end_of_turn|>GPT4 Correct Assistant:" response_text = generate_response(single_turn_prompt) print("Response:", response_text)
模型的使用受 OpenAI 的数据生成使用条款和 ShareGPT 的隐私实践的约束。如果发现任何潜在的违规行为,请联系我们。
Nexusflow 团队感谢来自 UC Berkeley 的 Tianle Li 对这个测试版的详细反馈和评估,同时感谢 LMSYS 组织对数据集、评估和在线演示的大力支持。Starling-LM-7B-beta 项目的开发依托于开源社区所提供的数据集和基础模型,包括(但不限于)Anthropic、Llama、Mistral、Hugging Face H4、LMSYS、OpenChat、OpenBMB、Flan 和 ShareGPT。
这个项目致力于提升语言模型的有用性和安 全性,为用户提供更稳定和有效的自然语言处理工具。欢迎大家积极参与使用及反馈,以推动模型优化和进步。

一站式AI短剧创作平台
Pixmax专注打造下一代“ AI 视觉创作引擎”,整合行业顶尖 AI 大模型、工工业级精准控制及企业级协同管理功能,是全方位的 AI 内容创作平台。


字节跳动旗下 AI 智能助手
字节跳动旗下 AI 智能助手


GPT充值
支持 ChatGPT Plus / Pro 充值服务,支付便捷,自动发货,售后可查。


AI 图片生成平台
GPT Image 2 是面向用户的 AI 图片生成平台,支持文生图、图生图及多模型创意工作流。


你的AI Agent团队
Vecbase 是专为 AI 团队打造的智能工作空间,将数据管理、模型协作与知识沉淀整合于一处。算法、产品与业务在同一平台无缝协同,让从数据到 AI 应用的落地更快一步。


全球首个AI音乐社区
音述AI是全球首个AI音乐社区,致力让每个人都能用音乐表达自我。音述AI提供零门槛AI创作工具,独创GETI法则帮助用户精准定义音乐风格,AI润色功能支持自动优化作品质感。音述AI支持交流讨论、二次创作与价值变现。针对中文用户的语言习惯与文化背景进行专门优化,支持国风融合、C-pop等本土音乐标签,让技术更好地承载人文表达。


阿里Qoder团队推出的桌面端AI智能体
QoderWork 是阿里推出的本地优先桌面 AI 智能体,适配 macOS14+/Windows10+,以自然语言交互实现文件管理、数据分析、AI 视觉生成、浏览器自动化等办公任务,自主拆解执行复杂工作流,数据本地运行零上传,技能市场可无限扩展,是高效的 Agentic 生产力办公助手。


一站式搞定所有学习需求
不再被海量信息淹没,开始真正理解知识。Lynote 可摘要 YouTube 视频、PDF、文章等内容。即时创建笔记,检测 AI 内容并下载资料,将您的学习效率提升 10 倍。


为AI短剧协作而生
专为AI短剧协作而生的AniShort正式发布,深度重构AI短剧全流程生产模式,整合创意策划、制作执行、实时协作、在线审片、资产复用等全链路功能,独创无限画布、双轨并行工业化工作流与Ani智能体助手,集成多款主流AI大模型,破解素材零散、版本混乱、沟通低效等行业痛点,助力3人团队效率提升800%,打造标准化、可追溯的AI短剧量产体系,是AI短剧团队协同创作、提升制作效率的核心工具。


能听懂你表达的视频模型
Seedance two是基于seedance2.0的中国大模型,支持图像、视频、音频、文本四种模态输入,表达方式更丰富,生成也更可控。
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号