mlr

mlr

R语言的综合机器学习工具包

mlr是一个功能丰富的R语言机器学习框架,为分类、回归、聚类和生存分析等任务提供标准化接口。它支持模型重采样、超参数优化和特征选择,并具备可视化和并行计算能力。尽管已停止新功能开发,mlr仍是一个成熟稳定的工具包,适用于多种数据分析场景。

机器学习R语言mlr算法数据分析Github开源项目

mlr <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/5806d7b1-44ae-465a-97ba-ac74da5aff10.png" align="right" />

包网站: 发布版 | 开发版

R语言中的机器学习。

<!-- 徽章: 开始 -->

tic CRAN_Status_Badge cran checks CRAN Downloads StackOverflow lifecycle codecov

<!-- 徽章: 结束 -->

已弃用

{mlr}被mlr-org团队视为已退休。 我们不会再添加新功能,只会修复严重的错误。 我们建议从现在开始并在未来的项目中使用新的mlr3框架。

{mlr}的并非所有功能都已在{mlr3}中实现。 如果您缺少关键功能,请在相应的mlr3扩展包中提出问题,并不要犹豫跟进。

安装

发布版

install.packages("mlr")

开发版

remotes::install_github("mlr-org/mlr")

在出版物中引用{mlr}

请引用我们的JMLR论文 [bibtex]。

包的某些部分是作为其他出版物的一部分创建的。 如果您使用这些部分,请适当引用相关工作。 所有与{mlr}相关的出版物概览可以在这里找到。

简介

R没有为其机器学习算法定义标准化接口。 因此,对于任何非平凡的实验,您需要编写冗长、繁琐且容易出错的包装器来调用不同的算法并统一它们各自的输出。

此外,您还需要实现基础设施来:

  • 重采样您的模型
  • 优化超参数
  • 选择特征
  • 处理数据的预处理和后处理,并以统计学有意义的方式比较模型。

由于这变得计算密集,您可能还想并行化您的实验。这通常迫使用户由于时间限制或缺乏专业编程技能而在实验中做出糟糕的权衡。

{mlr}提供了这种基础设施,让您可以专注于您的实验! 该框架提供了监督方法,如分类、回归和生存分析,以及相应的评估和优化方法,还有非监督方法,如聚类。 它的编写方式使您可以自己扩展它,或者偏离已实现的便利方法,构建自己的复杂实验或算法。

此外,该包与OpenML R包及其在线平台很好地连接,后者旨在支持在线协作机器学习,并允许轻松共享数据集以及机器学习任务、算法和实验,以支持可重复研究。

特性

  • 清晰的S3接口,用于R的分类、回归、聚类和生存分析方法
  • 通过属性抽象描述学习器和任务
  • 机器学习实验的便利方法和通用构建块
  • 重采样方法,如引导、交叉验证和子采样
  • 广泛的可视化(例如ROC曲线、预测和部分预测)
  • 跨数据集和学习器的简化基准测试
  • 使用不同优化策略的轻松超参数调优,包括强大的配置器,如
    • 迭代F-racing (irace)
    • 基于序列模型的优化
  • 使用过滤器和包装器进行变量选择
  • 带有调优和特征选择的模型嵌套重采样
  • 成本敏感学习、阈值调优和不平衡校正
  • 包装器机制,以复杂方式扩展学习器功能
  • 可能结合不同处理步骤形成可联合优化的复杂数据挖掘链
  • OpenML连接器,用于开放机器学习服务器
  • 内置并行化
  • 详细教程

其他

简单的使用问题更适合在Stackoverflow上使用mlr标签提问。

请注意,我们都在学术界工作,并投入大量工作到这个项目中 - 仅仅是因为我们喜欢它,而不是因为我们为此得到报酬。

新的开发工作应该投入到{mlr3}中。 我们有自己的风格指南,可以通过使用styler包中的mlr_style轻松应用。 有关更多信息,请参阅我们的wiki

演讲、工作坊等

mlr-outreach包含所有与{mlr}和{mlr3}相关的外展活动。

编辑推荐精选

Vora

Vora

免费创建高清无水印Sora视频

Vora是一个免费创建高清无水印Sora视频的AI工具

Refly.AI

Refly.AI

最适合小白的AI自动化工作流平台

无需编码,轻松生成可复用、可变现的AI自动化工作流

酷表ChatExcel

酷表ChatExcel

大模型驱动的Excel数据处理工具

基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。

AI工具酷表ChatExcelAI智能客服AI营销产品使用教程
TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
AIWritePaper论文写作

AIWritePaper论文写作

AI论文写作指导平台

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

AI辅助写作AI工具AI论文工具论文写作智能生成大纲数据安全AI助手热门
博思AIPPT

博思AIPPT

AI一键生成PPT,就用博思AIPPT!

博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。

AI办公办公工具AI工具博思AIPPTAI生成PPT智能排版海量精品模板AI创作热门
潮际好麦

潮际好麦

AI赋能电商视觉革命,一站式智能商拍平台

潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。

iTerms

iTerms

企业专属的AI法律顾问

iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。

SimilarWeb流量提升

SimilarWeb流量提升

稳定高效的流量提升解决方案,助力品牌曝光

稳定高效的流量提升解决方案,助力品牌曝光

Sora2视频免费生成

Sora2视频免费生成

最新版Sora2模型免费使用,一键生成无水印视频

最新版Sora2模型免费使用,一键生成无水印视频

下拉加载更多