SuperSonic: 下一代融合Chat BI和Headless BI的智能分析平台

SuperSonic: 融合Chat BI和Headless BI的智能分析新范式

在当今数据驱动的商业环境中,企业对快速、精准的数据分析需求日益增长。传统的商业智能(BI)工具虽然功能强大,但往往需要专业技能才能充分发挥其潜力。而新兴的自然语言查询技术又常常面临数据一致性和可靠性的挑战。在这样的背景下,腾讯音乐推出了SuperSonic平台,巧妙地将Chat BI和Headless BI两种范式融为一体,为用户提供了一种全新的智能分析体验。

SuperSonic的核心理念

SuperSonic的核心理念在于将大语言模型(LLM)驱动的Chat BI与语义层驱动的Headless BI有机结合。这种结合不仅确保了Chat BI能够访问与传统BI相同的经过策划和治理的语义数据模型,还通过两种范式的互补优势提升了整体性能:

Chat BI的文本到SQL(Text2SQL)转换能力通过从语义模型中检索上下文得到了增强。
Headless BI的查询接口扩展了自然语言API,使其更易于使用。

用户友好的界面设计

SuperSonic为用户提供了一个直观的Chat BI界面,使他们能够使用自然语言进行数据查询,并通过合适的图表可视化结果。这种体验的实现仅需通过Headless BI接口构建逻辑语义模型,定义指标、维度、标签及其含义和关系。

SuperSonic的技术创新

SuperSonic的创新之处在于其对Text2SQL生成过程的改进:

将数据语义(如业务术语、列值等)纳入提示中,使LLM能更好地理解语义并减少幻觉。
将高级SQL语法(如连接、公式等)的生成从LLM转移到语义层,以降低复杂性。

这种方法不仅提高了查询的准确性,还增强了系统的可靠性和可扩展性。

架构与核心组件

SuperSonic采用模块化设计,主要包含以下核心组件:

知识库:定期从语义模型中提取模式信息,构建词典和索引以促进模式映射。
模式映射器:识别用户查询中对模式元素的引用,并与知识库进行匹配。
语义解析器:理解用户查询并生成语义查询语句,包括基于规则和基于模型的解析器。
语义校正器:检查语义查询语句的有效性,并在需要时进行纠正和优化。
语义转换器:将语义查询语句转换为可针对物理数据模型执行的SQL语句。
聊天插件:通过第三方工具扩展功能,利用LLM选择最合适的插件。
聊天记忆:封装历史查询轨迹,便于进行少样本提示。

丰富的开箱即用功能

SuperSonic提供了一系列开箱即用的功能:

为业务用户提供内置的Chat BI界面,支持自然语言查询
为分析工程师提供内置的Headless BI界面,用于构建语义数据模型
内置基于规则的语义解析器,提高特定场景下的效率
支持输入自动完成、多轮对话以及查询后推荐
支持三级数据访问控制:数据集级、列级和行级

灵活的可扩展性

SuperSonic设计为可扩展和可组合的框架,允许通过Java SPI添加和配置自定义实现。这种灵活性使得SuperSonic能够适应不同组织的特定需求,并随着技术的发展不断进化。

快速上手与部署

SuperSonic提供了多种部署选项,方便用户快速上手:

在线体验:访问http://117.72.46.148:9080注册并体验。
Docker部署:
- 安装Docker和docker-compose
- 下载docker-compose.yml文件
- 执行"docker-compose up -d"
- 访问http://localhost:9080开始探索
本地构建:
- 从release页面下载最新预构建二进制文件
- 运行脚本"assembly/bin/supersonic-daemon.sh start"启动独立Java服务
- 访问http://localhost:9080开始探索