Tianji

Tianji

开源人情世故AI系统 助力提升社交技能

天机是一个开源的人工智能系统,专注于人情世故领域的应用开发。该项目涵盖敬酒、说话技巧等传统社交场景,通过prompt工程、AI游戏、智能体和知识库等多种技术路线,为用户提供全面的社交能力提升方案。天机项目还包括从数据收集到模型微调的全流程开发经验,旨在推动人情世故在AI领域的应用研究。作为开源项目,天机提供了从数据收集、模型训练到应用部署的完整技术路线,为研究人员和开发者提供了宝贵的实践资源。

天机人工智能人情世故开源项目大语言模型Github

天机

<p align="center"> <img src="https://yellow-cdn.veclightyear.com/835a84d5/498e1585-b311-4b04-ac16-9f3bce01fbd7.jpg" width="100"/> <br> <p align="center"> &nbsp<a href="README.md">中文</a>&nbsp | &nbsp<a href="README_en.md">English</a>&nbsp | &nbsp<a href="README_jp.md">日本語</a> <p align="center"> <a href="https://python.org/" target="_blank"><img alt="PyPI - Python Version" src="https://img.shields.io/pypi/pyversions/moelib?logo=python&style=flat-square"></a> <a href="https://github.com/tatsu-lab/stanford_alpaca/blob/main/LICENSE"><img alt="LICENSE" src="https://camo.githubusercontent.com/ff42248868bc1387751598955e573b397851d947f13ddd7618c0ba9e66aacdf6/68747470733a2f2f696d672e736869656c64732e696f2f62616467652f436f64652532304c6963656e73652d4170616368655f322e302d677265656e2e737667"></a> <br/> </p>

天机是SocialAI(来事儿AI)制作的一款免费使用、非商业用途的人工智能系统。您可以利用它进行涉及传统人情世故的任务,如"如何敬酒、如何说好话、如何会来事儿"等,以提升您的情商和核心竞争能力。我们坚信,只有人情世故才是未来AI的核心技术,只有会来事儿的AI才有机会走向AGI,让我们携手见证通用人工智能的来临。 —— "天机不可泄漏。"

</p> </br> </p>

你将在天机中学会 🍉

  • 构建prompt对话大模型应用

  • 制作AI游戏(类似哄哄模拟器)应用

  • 基于metagpt构建智能体应用(即将重构)

  • 从零构建一个知识库对话应用(即将重构)

  • 从零制作数据、微调属于自己的大语言模型

学完全部内容后,你将获得大语言模型入门级全栈应用开发能力。🕶️

</p> </br> </p>

SocialAI(来事儿AI)是设立于中国的非营利组织,我们完全开源了Tianji(天机)系列工作,当前开源系统技术路线涉及为Prompt、AI游戏、Agent、知识库、模型训练。具体内容,请查看文档与对应仓库。

基于整理后的人情世故数据,人情世故大模型系统-天机包括了常见人际交往中的七大领域(具体可以参考场景分类中的场景细化细节),其中大体可分为:

1.敬酒礼仪文化
  不惧碰杯,酒席桌上一条龙
2.请客礼仪文化
  友好地展示你的友好
3.送礼礼仪文化
  此礼非礼,直击人心
4.送祝福
  承包你的所有祝福语
5.如何说对话
  据说是低情商救星
6.化解"尴尬"场合
  没心没肺,找回自我
7.矛盾&冲突应对
  《能屈能伸》  

结合这些领域,Tianji涉及到的技术路线共有四种:

  • 纯prompt(包括AI游戏):内置system prompt基于大模型自身能力对话。
  • Agent(MetaGPT等):利用Agent架构得到更丰富、更定制化详细的回答。
  • 知识库:直接检索人情世故法则(比如餐桌上一般怎么喝酒)。
  • 模型训练:基于不同优秀的模型基座,在积累大量数据的情况下进行Lora微调或全量微调。

您可以在tianji目录下找到四种路线的对应源码,如果您想参考"Tianji"的项目架构、数据管理、技术路线复刻出属于自己的垂直领域AI应用,欢迎fork或者直接参考,我们将会开源所有包括从"项目的起步、数据的方向探索、数据构建与管理、AI应用从0制作、领域(比如人情世故)与技术路线的深入结合"的全过程;我们希望看到AI原生应用在生活中进一步的加速推进。

如果您想提建议 / 参与这个项目的开发流程,欢迎加入社区群!

image

目录

📰新闻

路线图

  • 释放最简初版(涉及prompt、aigame、agent、知识库、模型微调)
  • 完成人情世故大模型-送祝福的模型微调数据收集到微调过程的可复现文档
  • 开源人情世故语料-送祝福至huggingface
  • 迭代更好的数据制造工具与清洗方案,开源数据清洗脚本
  • 完成知识库部分迭代
  • 完成Agent部分文档
  • 开放知识库语料获取细节至huggingface
  • 补充文档(如何参考本项目构建自己的应用prompt、agent、知识库、微调应用)
  • 整理多维度数据,开源较完整人情世故语料
  • 收集 & 开源人情世故语料-2w并训练给出结果和全过程

运行环境

环境安装

在本项目中,执行下列指令即可安装项目的完整环境

pip install -r requirements.txt
pip install .

密钥配置

为确保项目正常运行,请在项目内新建.env文件,并在其中设置你的API密钥,你可以根据下列例子写入对应的密钥,即可成功运行调用,目前默认使用zhipuai,你可以仅写入ZHIPUAI_API_KEY即可使用。

如果在从Hugging Face下载模型时遇到速度极慢或无法下载的问题,请在.env文件中设置HF_ENDPOINT的值为https://hf-mirror.com。请注意,某些Hugging Face仓库可能需要访问权限(例如Jina Ai)。为此,请注册一个Hugging Face账号,并在.env文件中添加HF_TOKEN。你可以在这里找到并获取你的token。

OPENAI_API_KEY=
OPENAI_API_BASE=
ZHIPUAI_API_KEY=
BAIDU_API_KEY=
OPENAI_API_MODEL=
HF_HOME='./cache/'
HF_ENDPOINT = 'https://hf-mirror.com'
HF_TOKEN=

文件目录说明

assets/:静态图片文件 
run/: 包括了各类演示用前端
test/:这里存放了各类功能的测试文件,包括核心模块以及llm运行的单元测试
tianji/:源代码目录,包含主要逻辑与算法实现
tools/:帮助收集数据、整理数据清洗语料的工具

文档说明

TODO,待覆盖全文档

🍺运行方式

以下给出prompt以及agent的相关应用方式,在运行前请确保你已经新建.env文件:

# 运行prompt webui前端 python3 run/tianji_prompt_webui.py # 运行agent前端 streamlit run run/metagpt_webui.py

示例

微调 - 祝福模块

当前祝福模块支持三种模式触发:

  1. 普通风格,直接写祝福对象,符合常见对话规律。
  2. 小红书风格,在祝福对象指定后加上小红书风格,可触发;自带emoji以及可爱对话风格。
  3. 严肃风格,在祝福对象指定后加上严肃风格,可触发;文书风格。

prompt - 如何敬酒

以下给出特斯拉创始人Elon Musk向OpenAI创始人Sam Altman敬酒的对话示例(基于内置提示词生成):

埃隆·马斯克:山姆,你的OpenAI不如改名叫CloseAI
山姆·奥特曼:你先管好你的Grok吧,罚你三杯!
埃隆·马斯克:你这话说的,是要我喝完这瓶白酒吗?
山姆·奥特曼:哈哈,埃隆,你可是以星辰大海为目标的男人,一瓶白酒算什么?我可是听说你在SpaceX的派对上连火箭燃料都敢喝呢!来,这杯我干了,你随意,但别有损世界首富的风度啊!
埃隆·马斯克:你这是在激我啊,山姆老兄!那我就不客气了,我喝掉,你半杯。不过说回来,OpenAI的成果可不只是靠吹牛,你得好好看着,别让它真的变成了"CloseAI"。
山姆·奥特曼:嘿,我这CEO的帽子随时准备摘下来给你戴戴的,马斯克老兄。不过今晚,让我们先忘了这些,来,为我们的友谊干杯!我喝掉,你随意,但记住,明天还得继续改变世界呢!
埃隆·马斯克:好,就为你这句"改变世界",我干了这杯!不过别以为我会轻易放过你,等我下次带上我的特斯拉充电桩,看你怎么应对!
山姆·奥特曼:哈哈,我等着那一天!不过现在,让我们先享受今晚。来,最后一杯,我干了,你随意,喝得开心,别忘了,OpenAI的AI们还在等着我们回去继续训练呢!

### 知识库 - xxx
待办

## 如何参与本项目

### 问题看板

[这里](https://github.com/SocialAI-tianji/Tianji/issues/31)记录了该项目存在的一些问题(欢迎领取解决),以及未来的一些路线图需要完成,当前还没时间写,如果您有时间想一起来玩儿,请在issue提出或者直接邮箱联系我:physicoada@gmail.com

### 提交第一个PR 

得益于良好的CI设施,你只需要参考[示例PR](https://github.com/SocialAI-tianji/Tianji/pull/27),就可以很快提出自己的第一个prompt PR!
提交PR后,新的prompt将自动合并于`tianji/prompt`下的json文件中,方便一键调用。如果你不知道写什么,可以参考[场景分类](test/场景分类)中的各类场景细化细节,写出不同人情世故领域的prompt。

## 如何复刻本项目

该项目的初衷,第一是为了让"AI学会核心技术",第二是让更多人(领域/行业)可以构建属于自己的AI系统,加速AI对每一个领域的渗透。你可以通过以下方式来学习该项目:

你可以参考本项目创造出新的垂直领域应用:
- 租房助手(agent)
- 带娃助手(数据收集与知识库)
- 生活指南(数据收集与知识库)
......

## 贡献者

<a href="https://github.com/eryajf/learn-github/graphs/contributors">
  <img src="https://contrib.rocks/image?repo=SocialAI-tianji/Tianji" />
</a>

[有些贡献者没有GitHub,我们感谢其中的每一位贡献者!](docs/contributor.md),也欢迎你一起加入!

## 鸣谢

感谢下列所有人对本项目的帮助:

- 所有贡献者
- 强大的[智谱AI](https://open.bigmodel.cn/)的token支持!(除微调外,目前基座皆基于智谱AI)
- 上海人工智能实验室 [InternLM(书生·浦语) 模型](https://github.com/InternLM/InternLM),以及提供的A100显卡资源!
- [InternLM(书生·浦语) 系列开源教程(目前最好的LLM实战全栈教程之一)](https://github.com/InternLM/tutorial)
- [Datawhale 开源学习社区](https://github.com/datawhalechina)
- [奇想星球](https://1aigc.cn/)

## Star History

![Star History Chart](https://api.star-history.com/svg?repos=SocialAI-tianji/Tianji&type=Date)

编辑推荐精选

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

AI办公办公工具AI工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图热门
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

热门AI开发模型训练AI工具讯飞星火大模型智能问答内容创作多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

热门AI辅助写作AI工具讯飞绘文内容运营AI创作个性化文章多平台分发AI助手
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

openai-agents-python

openai-agents-python

OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。

openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。

Hunyuan3D-2

Hunyuan3D-2

高分辨率纹理 3D 资产生成

Hunyuan3D-2 是腾讯开发的用于 3D 资产生成的强大工具,支持从文本描述、单张图片或多视角图片生成 3D 模型,具备快速形状生成能力,可生成带纹理的高质量 3D 模型,适用于多个领域,为 3D 创作提供了高效解决方案。

3FS

3FS

一个具备存储、管理和客户端操作等多种功能的分布式文件系统相关项目。

3FS 是一个功能强大的分布式文件系统项目,涵盖了存储引擎、元数据管理、客户端工具等多个模块。它支持多种文件操作,如创建文件和目录、设置布局等,同时具备高效的事件循环、节点选择和协程池管理等特性。适用于需要大规模数据存储和管理的场景,能够提高系统的性能和可靠性,是分布式存储领域的优质解决方案。

下拉加载更多