Otto

Otto

智能机器学习助手

Otto是一个面向初学者的智能聊天应用,旨在帮助用户通过自然语言描述轻松理解并实践机器学习。该应用通过智能推荐与样本数据集支持,使用户能够快速利用机器学习模型。支持的模型类型包括回归、分类和自然语言处理等,还提供源码生成和可视化工具,确保每个学习阶段的易理解性。

Otto机器学习自然语言处理Facebook AI ChallengeWit.aiGithub开源项目

Otto:智能机器学习助手

机器学习变得简单自然

Otto 是一个智能聊天应用程序,专为有志成为机器学习工程师的人设计。它帮助用户从想法到实施,不需要具备太多专业知识。在**Otto 的网站** 上,用户能够进行简单的模型选择,查看有启发性的可视化结果,并通过直观的自然语言指导每一步。

最近更新:Otto 在 Facebook AI 挑战赛中获奖!

我们很高兴地分享 Otto 在 2020 年 Facebook AI 挑战系列 hackathon 比赛中获得了**第三名**。这一成就源于 Otto 创新性地利用了 Wit.ai 自然语言处理平台。祝贺其他获奖者及所有参与者!


项目亮点

  • 友好的设计:Otto 针对新手设计,不要求用户对机器学习有太多了解。用户只需描述其最终目标,就能获得智能推荐,或者可以从示例数据集中选择,以便快速使用我们提供的模型。

  • 强大的机器学习工具:支持一系列机器学习能力,包括回归、分类和自然语言处理模型,以及专为用户问题定制的预处理器。用户可以在浏览器中玩转神经网络、探索数据可视化,并生成现成的 Python 代码。

  • 教育体验:整个过程中,Otto 会详细讲解术语,给予用户学习的机会。标注的代码块帮助有心学习的用户理解其端到端流程。


快速入门

要了解 Otto 的核心功能,可以尝试以下操作:

  • 说:“我想根据花瓣长度给花朵种类贴标签”,Otto 会为你预填管道组件,并可视化展示流行的数据集鸢尾花的数据。

  • 选择:“回归 > 示例数据集” 以浏览回归用的示例数据集,并通过不同的最佳拟合线来发现最强的预测因子。

  • 说:“检测信用卡欺诈活动”,并选择自定义数据集选项,可体验 Otto 的模型推荐和交互的神经网络设计。

  • 说:“我想解读一则评论的情绪” 来查询由 Wit 支持的自然语言模型并实时获得结果。

用户可以尽情发挥创造力,提出自己的机器学习目标,看看 Otto 能带你走到哪里。

工作流程

以下是一份关于 Otto 如何工作的分步指南。

任务

刚接触机器学习的用户常面临令人困惑的术语问题,从“损失函数”到“等高线边界”等等,让他们难以选择所需的模型,更不用说从零开始开发模型了。Otto 通过简单的目标语句,推断用户面临的高层任务,并为用户缩小选择范围

任务推断

Otto-Task 使用 Wit 应用进行任务推断,它基于 300 条来自现实世界机器学习研究的语句进行训练。这些语句如“我想检测贷款申请是否为欺诈”或者“帮我预测股价”等。其目的在于将任务意图分类为回归、分类或自然语言处理,并提取主体实体来过滤不必要的词汇。

数据集

用户获得与其主题相匹配的特定示例数据集的推荐,或者可以预览并自己选择一个。示例数据让初学者快速简便地原型化模型,无需为寻找数据集和在众多特征中选出相关特征而烦恼。用户也可以选择使用自己的数据,这些数据可在稍后生成的代码中包含。

数据集预览

模型

如果用户选择了自定义数据,Otto 使用 Wit 选择合适的分类器或回归器。Otto-Model 通过解析用户对其数据的简短描述来确定推荐模型。

支持的模型:

模型名称任务描述
K-近邻分类通过查看周围数据划分类别区域
神经网络分类适用于复杂数据集的深度学习模型
线性回归变量之间的普通线性关系
泊松回归模型计数数据,常常遵循泊松分布
序数回归学习排名(例如“在1-5的范围内”)
情绪分析自然语言检测情感极性、感谢表达以及问候/告别等
实体识别自然语言提取例如人物、时间地点、艺术作品等结构

预处理器

在这个步骤中,Otto 为用户的数据和模型选择提供精选的预处理器,使数据优化以进行高效学习。

支持的预处理器:

预处理器名称描述
主成分分析进行降维和/或特征选择
标准化对数据进行缩放,以使均值为0,方差为1
文本清理去除表情符号、噪声符号以及前后空白

可视化

在神经网络设计或基于示例数据构建的任何模型中激活可视化。

神经网络

通过我们有趣的交互式网络构建器满足你的好奇心!

神经网络

Otto 为标准模型架构进行预配置,但用户可以随意逐层调整。此外,Otto 能够使用专用 Wit 模型(Otto-Net)即时根据用户指令重设架构。

模型可视化(示例)

立即探索参数如何影响 KNN 群集和回归斜率!

线性回归

K-近邻

代码显示

一切完成!数据排序完成,预处理器设置完毕,模型配置完毕后,Otto 为你提供一个优美的视图。为方便起见,我们还提供按钮来复制代码到剪贴板、部署到 Google Colab 笔记本或重新开始流程。

代码生成


Otto 的未来计划

Otto 的模块化设计使其具有良好的可扩展性,并且其使用 Wit 表明其自然语言能力可以延伸至更多领域。以下是 Otto 的一些计划:

  • 更多的模型:逻辑回归、支持向量机、决策树
  • 新的任务:数据生成(如GANs)、语音识别、聚类
  • 更智能的建议:能够请 Otto 解释机器学习概念或描述选项差异

贡献者

欢迎贡献!可以着手上述项目或其他事项。我们会审阅在此仓库中打开的问题和 PR。

关于

创始者

Kartik Chugh 是弗吉尼亚大学的二年级学生,目前在亚马逊 Alexa 团队实习。他是一个热衷于开源贡献的人,对 API 设计和开发酷炫的机器学习工具充满热情。

Sanuj Bhatia 是 Facebook 的一名软件工程师,喜欢构建交互式的基于 React 的应用程序。他喜欢引入并修复 bug 以最大限度地产生影响。

感谢

感谢 Sean Velhagen 设计了 Otto 的图标!

为什么选择 Otto 猫头鹰?

因为有双关语,聪明的猫头鹰形象出现在脑海中,以及对 OttoML 的巧妙运用。

编辑推荐精选

Vora

Vora

免费创建高清无水印Sora视频

Vora是一个免费创建高清无水印Sora视频的AI工具

Refly.AI

Refly.AI

最适合小白的AI自动化工作流平台

无需编码,轻松生成可复用、可变现的AI自动化工作流

酷表ChatExcel

酷表ChatExcel

大模型驱动的Excel数据处理工具

基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。

AI工具酷表ChatExcelAI智能客服AI营销产品使用教程
TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
AIWritePaper论文写作

AIWritePaper论文写作

AI论文写作指导平台

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

AI辅助写作AI工具AI论文工具论文写作智能生成大纲数据安全AI助手热门
博思AIPPT

博思AIPPT

AI一键生成PPT,就用博思AIPPT!

博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。

AI办公办公工具AI工具博思AIPPTAI生成PPT智能排版海量精品模板AI创作热门
潮际好麦

潮际好麦

AI赋能电商视觉革命,一站式智能商拍平台

潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。

iTerms

iTerms

企业专属的AI法律顾问

iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。

SimilarWeb流量提升

SimilarWeb流量提升

稳定高效的流量提升解决方案,助力品牌曝光

稳定高效的流量提升解决方案,助力品牌曝光

Sora2视频免费生成

Sora2视频免费生成

最新版Sora2模型免费使用,一键生成无水印视频

最新版Sora2模型免费使用,一键生成无水印视频

下拉加载更多