英文 | 中文
DataSphere Studio (简称 DSS) 是由WeBank开发的一个一站式数据应用开发管理门户。
通过可插拔的集成框架设计以及Linkis计算中间件,DSS可以轻松集成各种上层数据应用系统,使数据开发变得简单易用。
DataSphere Studio定位为数据应用开发门户,闭环覆盖数据应用开发的整个流程。通过统一的UI,类工作流的图形化拖拽开发体验满足从数据导入、脱敏清洗、数据分析、数据挖掘、质量检查、可视化、调度到数据输出应用等数据应用开发全生命周期。
借助Linkis的连通、可重用和简化能力,DSS天生具备金融级别的高并发、高可用、多租户隔离和资源管理等能力。
请耐心等待,加载 gif 需要一些时间。
DSS高度集成。当前集成的组件包括(以下各组件与 DSS 版本的兼容性,请访问: 集成数据应用组件兼容列表):
1. 数据开发 IDE 工具 - Scriptis
2. 数据可视化工具 - Visualis (基于信而富开源项目 Davinci 贡献)
3. 数据质量管理工具 - Qualitis
4. 工作流调度工具 - Schedulis
5. 数据交换工具 - Exchangis
6. 数据 Api 服务 - DataApiService
7. 流式应用开发管理工具 - Streamis
8. 一站式机器学习平台 - Prophecis
9. 工作流任务调度工具 - DolphinScheduler (代码合并中)
10. 使用文档和新手指南 - UserGuide (代码合并中)
11. 数据模型中心 - DataModelCenter (开发中)
以上各组件与 DSS 版本的兼容性,请访问: 集成数据应用组件兼容列表。
通过可插拔的框架架构设计,DSS允许用户快速集成新的数据应用工具,或替换DSS已集成的各种工具。例如,用Zeppelin替换Scriptis,用DolphinScheduler替换Schedulis...
AppConn 是使 DSS 能够轻松快速集成各种上层 Web 系统的核心概念。
AppConn,即应用连接器,定义了一套统一的前后端三级集成协议,使外部数据应用系统能够轻松快速成为 DSS 数据应用开发的一部分。
AppConn 的三级规范 分别是:一级 SSO 规范、二级组织架构规范和三级开发流程规范。
DSS 将多个 AppConn 串联成流程,支持实时执行和定时执行。用户可以通过简单的拖拽操作完成整个数据应用的全流程开发。
由于 AppConn 与 Linkis 集成,外部数据应用系统共享了资源管理、并发限制和高性能等能力。AppConn 还允许跨系统级别共享上下文,因此使外部数据应用完全摆脱了应用孤岛。
### 3. 以工作空间作为管理单元
以工作空间作为管理单元,它对各种数据应用系统的业务应用进行组织和管理,为跨数据应用系统的工作空间协同开发制定了一套共同标准,并提供了用户角色管理功能。
DSS通过实施多个AppConns集成了各种上层数据应用系统,基本满足了用户的数据开发需求。
如有需要,也可以轻松集成新的数据应用系统,以替换或充实DSS的数据应用开发流程。 点击了解如何快速集成新的应用系统
组件 | 描述 | DSS0.X兼容版本(推荐使用DSS0.9.1) | DSS1.0兼容版本(推荐使用DSS1.1.0) |
---|---|---|---|
Linkis | Apache Linkis计算中间件,通过提供REST/WebSocket/JDBC/SDK等标准接口,上层应用程序可以轻松连接和访问底层的MySQL/Spark/Hive/Presto/Flink等引擎。 | 推荐使用Linkis0.11.0(已发布) | >=Linkis1.1.1(已发布) |
DataApiService | (DSS内置的第三方应用工具)数据API服务。可以快速将SQL脚本发布为Restful接口,为外部世界提供Rest访问能力。 | 不支持 | 推荐使用DSS1.1.0(已发布) |
Scriptis | (DSS内置的第三方应用工具)支持在线编写SQL、Pyspark、HiveQL等脚本,并提交到Linkis数据分析Web工具。 | 推荐使用DSS0.9.1(已发布) | 推荐使用DSS1.1.0(已发布) |
Schedulis | 基于Azkaban二次开发的工作流任务调度系统,具有金融级的高性能、高可用和多租户资源隔离等特性。 | 推荐使用Schedulis0.6.1(已发布) | >=Schedulis0.7.0(已发布) |
EventCheck | (DSS内置的第三方应用工具)提供跨业务、工程和工作流的信号通信能力。 | 推荐使用DSS0.9.1(已发布) | 推荐使用DSS1.1.0(已发布) |
SendEmail | (DSS内置的第三方应用工具)提供发送数据的能力,可以通过电子邮件发送其他工作流节点的所有结果集。 | 推荐使用DSS0.9.1(已发布) | 推荐使用DSS1.1.0(已发布) |
Qualitis | 数据质量验证工具,提供数据完整性和正确性等数据验证能力。 | 推荐使用Qualitis0.8.0(已发布) | >=Qualitis0.9.2(已发布) |
Streamis | 流应用程序开发 管理工具。它支持Flink Jar和Flink SQL的发布,并提供流应用程序的开发、调试和生产管理能力,如:启停、状态监控、检查点等。 | 不支持 | >=Streamis0.2.0(已发布) |
Prophecis | 一个集成多种开源机器学习框架的一站式机器学习平台。Prophecis的MLFlow可通过AppConn连接到DSS工作流。 | 不支持 | >=Prophecis 0.3.2(已发布) |
Exchangis | 一个数据交换平台,支持在结构化和非结构化异构数据源之间进行数据传输,即将到来的Exchangis1.0将与DSS工作流配合使用。 | 不支持 | =Exchangis1.0.0(已发布) |
Visualis | 一个基于信用卡开源项目Davinci二次开发的数据可视化BI工具,在数据安全性方面为用户提供金融级的数据可视化能力。 | 推荐使用Visualis0.5.0 | >=Visualis1.0.0(已发布) |
DolphinScheduler | Apache DolphinScheduler,一个分布式且易于扩展的可视化工作流任务调度平台,支持一键将DSS工作流发布到DolphinScheduler。 | 不支持 | DolphinScheduler1.3.X(已发布) |
UserGuide | (DSS将内置的第三方应用工具)包含帮助文档、新手指南、黑暗模式皮肤等。 | 不支持 | >=DSS1.1.0(已发布) |
DataModelCenter | (DSS将要建立的第三方应用工具)主要提供数据仓库规划、数据模型开发和数据资产管理能力。数据仓库规划包括主题域、数据仓库层次 、修饰语等;数据模型开发包括指标、维度、度量、基于向导的表构建等;数据资产与Apache Atlas对接提供数据血缘能力。 | 不支持 | 计划在DSS1.2.0中(正在开发) |
UserManager | (DSS内置的第三方应用工具)自动初始化新DSS用户所需的所有用户环境,包括:创建Linux用户、各种用户路径、目录授权等。 | 推荐使用DSS0.9.1(已发布) | 正在计划中 |
Airflow | 支持将DSS工作流发布到Apache Airflow进行定期调度。 | PR尚未合并 | 不支持 |
DataSphere Studio支持脚本执行的功能存在较高的安全风险,WeDataSphere Demo环境的隔离也尚未完成。考虑到很多用户都在询问Demo环境,我们决定先向社区发放邀请码,接受企业和组织的试用申请。
如果您想试用Demo环境,请加入DataSphere Studio社区用户群(请参考文档末尾),并联系WeDataSphere Group Robot获取邀请码。
DataSphereStudio Demo环境登录页面: 点击进入
请前往DSS发布页下载编译好的DSS版本或源代码包。
请按照编译指南从源代码编译DSS。
请参考部署文档进行部署。
您可以在用户手册中找到关于如何使用DSS的示例和指南。
有关DSS1.0的完整文档列表,请参阅DSS-Doc。
以下是DSS相关AppConn插件的安装指南:
DataSphere Studio适用于以下场景:
我们永远欢迎任何形式的贡献,我们需要更多的贡献者一起构建DSS。无论是代码、文档还是其他有助于社区发展的支持,都是非常宝贵的。
对于代码和文档贡献,请遵循贡献指南。
如有任何疑问或建议,欢迎通过issue形式提出。
您可以扫描下方二维码加入我们的微信群,获得更及时的响应。
我们开放了一个issue,供用户反馈并记录谁在使用DSS。
自DSS于2019年首次发布以来,已积累了700多家试用公司和1000多名沙盒试用用户,涉及金融、银行、电信、制造业、互联网等各个行业。
DSS采用Apache 2.0许可证。详情请参见许可证文件。
字节跳动发布的AI编程神器IDE
Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。
全能AI智能助手,随时解答生活与工作的多样问题
问小白,由元石科技研发的AI智能助手,快速准确地解答各种生活和工作问题,包括但不限于搜索、规划和社交互动,帮助用户在日常生活中提高效率,轻松管理个人事务。
实时语音翻译/同声传译工具
Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。
一键生成PPT和Word,让学习生活更轻松
讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。
深度推理能力全新升级,全面对标OpenAI o1
科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。
一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型
Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。
AI助力,做PPT更简单!
咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。
选题、配图、成文,一站式创作,让内容运营更高效
讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。
专业的AI公文写作平台,公文写作神器
AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。
OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。
openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。
最新AI工具、AI资讯
独家AI资源、AI项目落地
微信扫一扫关注公众号