trainable-agents

trainable-agents

可训练的角色扮演AI,实现动态个性化互动

Character-LLMs是一款专为角色扮演设计的可训练智能体,利用经验重建技术生成丰富的角色体验数据,无需额外提示即可模拟特定角色,如贝多芬或埃及艳后。项目提供九个角色的模型和数据集,支持角色个性化构建与互动。详情请见论文和代码仓库。

Character-LLM角色扮演数据集训练LLMGithub开源项目

trainable-agents 项目介绍

项目背景

trainable-agents 项目中的 Character-LLM 提出了可以角色扮演的可训练智能体,其特别之处在于能够从实际经验、特征和情感中学习。这种智能体不同于需要额外提示的传统智能体模型,Character-LLM 专门针对角色扮演进行了训练,无需任何额外的提示或参考文档就能够以详细的角色知识和代表性性格特征模拟特定人物。Character-LLM 可以扮演像贝多芬、克娄巴特拉女王、尤利乌斯·凯撒等历史或虚构人物。

核心概念

Character-LLM 的关键在于经验重建,这个数据生成过程用于产生特定角色的详细和多样化的经验数据,从而进行模型的训练。此技术能帮助智能体在不同场景中生动模拟特定人物角色,呈现出类似真实人物的表现。

数据集与模型

  • 模型权重:项目发布了九个角色的模型权重,包括克娄巴特拉女王、伏地魔、斯巴达克斯、赫敏·格兰杰、艾萨克·牛顿、尤利乌斯·凯撒、路德维希·范·贝多芬、苏格拉底和马丁·路德·金。这些模型均基于 Llama 1,通过运行命令恢复权重,可使用模型作为聊天机器人:

    cd FastChat python3 -m fastchat.model.apply_delta \ --base-model-path /path/to/hf-model/llama-7b \ --target-model-path /path/to/hf-model/character-llm-beethoven-7b \ --delta-path fnlp/character-llm-beethoven-7b-wdiff
  • 训练数据集:训练所需的数据集可以通过链接下载,包含九个角色的经验数据。

角色创建流程

  1. 角色资料建设:选择需要扮演的角色(如贝多芬),搜集角色的相关资料。
  2. 场景提取:使用 gpt-3.5-turbo 生成基于资料的场景。
  3. 经验完成:生成角色之间的互动。
  4. 保护场景:生成保护场景,降低角色幻觉的产生。
  5. 转换为训练格式:将数据转化为模型可训练格式。

模型训练与推理

训练基于 FastChat,需要准备基础模型和训练数据。使用适当的超参数进行模型训练,需要大约 30-45 分钟的时间。完成后即可加载模型进行推理。

cd FastChat export CHARACTER=Beethoven torchrun --nproc_per_node=8 --master_port=20031 fastchat/train/train_mem.py \ --model_name_or_path /path/hf_model/llama-7b \ --data_path /path/to/prompted_agent_dialogue_$CHARACTER.json \ --already_preprocess True \ --bf16 True \ --output_dir /path/to/ckpt/${CHARACTER}_7b \ --num_train_epochs 10 \ --per_device_train_batch_size 2 \ --per_device_eval_batch_size 16 \ --gradient_accumulation_steps 4 \ --evaluation_strategy epoch \ --save_strategy epoch \ --save_total_limit 10 \ --learning_rate 2e-5 \ --weight_decay 0.1 \ --warmup_ratio 0.04 \ --lr_scheduler_type cosine \ --logging_steps 1 \ --fsdp 'full_shard auto_wrap' \ --fsdp_transformer_layer_cls_to_wrap LlamaDecoderLayer \ --tf32 True \ --model_max_length 2048 \ --gradient_checkpointing True

示例生成

项目展示了基于 Character-LLM 的生成样例,单轮对话和多轮对话模拟了不同时期、不同背景的角色对话,充分表现了模型的角色扮演能力。

引用与感谢

如果你在学术研究中使用了此项目的资源,请遵循引用规范。此外,项目团队特别感谢对论文校对及建议做出贡献人员的支持以及相关的科研资助项目。

注意事项

所生成的数据、代码和模型仅限学术研究用途,禁止用于商业用途。此外,由于不可控因素影响,Character-LLM 生成的内容无法完全保证其准确性和质量,项目作者不对使用该项目资源可能产生的任何后果负责。

编辑推荐精选

博思AIPPT

博思AIPPT

AI一键生成PPT,就用博思AIPPT!

博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。

热门AI工具AI办公办公工具智能排版AI生成PPT博思AIPPT海量精品模板AI创作
潮际好麦

潮际好麦

AI赋能电商视觉革命,一站式智能商拍平台

潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。

iTerms

iTerms

企业专属的AI法律顾问

iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。

SimilarWeb流量提升

SimilarWeb流量提升

稳定高效的流量提升解决方案,助力品牌曝光

稳定高效的流量提升解决方案,助力品牌曝光

Sora2视频免费生成

Sora2视频免费生成

最新版Sora2模型免费使用,一键生成无水印视频

最新版Sora2模型免费使用,一键生成无水印视频

Transly

Transly

实时语音翻译/同声传译工具

Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

AI助手热门AI工具AI创作AI辅助写作讯飞绘文内容运营个性化文章多平台分发
TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

热门AI工具生产力协作转型TraeAI IDE
商汤小浣熊

商汤小浣熊

最强AI数据分析助手

小浣熊家族Raccoon,您的AI智能助手,致力于通过先进的人工智能技术,为用户提供高效、便捷的智能服务。无论是日常咨询还是专业问题解答,小浣熊都能以快速、准确的响应满足您的需求,让您的生活更加智能便捷。

imini AI

imini AI

像人一样思考的AI智能体

imini 是一款超级AI智能体,能根据人类指令,自主思考、自主完成、并且交付结果的AI智能体。

下拉加载更多