awesome-imbalanced-learning

awesome-imbalanced-learning

解决分类问题中的类别失衡,精选学习资源与开源工具

项目提供精选的类别失衡学习相关论文、代码和库,旨在解决分类问题中的类别不平衡。资源涵盖多种编程语言和研究领域,按编程语言和研究领域分类。项目持续更新,并引入了新包imbalanced-ensemble,适合从事欺诈检测、稀有副作用预测等研究的人员使用。

ensemble learning代码库文献Github开源项目Class-imbalanceimbalanced learning
<h2 align="center"> 精选的不平衡学习论文、代码和库 </h2> <p align="center"> <img src="https://yellow-cdn.veclightyear.com/35dd4d3f/845885b3-2ab5-4bb4-8de9-53bb7c233cc4.svg"> <img src="https://yellow-cdn.veclightyear.com/35dd4d3f/d00f7860-59e7-465a-9044-c39e2e35a92a.png"> <img src="https://yellow-cdn.veclightyear.com/35dd4d3f/c6279ce2-9876-4cd8-bd80-27253babf745.png"> <a href="https://github.com/ZhiningLiu1998/awesome-imbalanced-learning#contributors-"><img src="https://yellow-cdn.veclightyear.com/35dd4d3f/30ad9704-be3e-416f-9393-d1a11730a206.svg"></a> <img src="https://yellow-cdn.veclightyear.com/35dd4d3f/92017e7e-476d-4b0f-9540-7df95198b5b8.png"> <a href="https://github.com/ZhiningLiu1998/imbalanced-ensemble"> <img src="https://yellow-cdn.veclightyear.com/35dd4d3f/e58bdbb5-22b9-4dee-bc68-e55b9b12955d.png"> </a> </p> <h3 align="center"><b>语言: [<a href="https://github.com/ZhiningLiu1998/awesome-imbalanced-learning">English</a>] [<a href="https://github.com/ZhiningLiu1998/awesome-imbalanced-learning/blob/master/README_CN.md">中文</a>]</b></h3>

类别不平衡(也称为长尾问题) 是指在分类问题中,类别之间的表示不均衡,这在实践中非常常见。例如,欺诈检测、预测罕见的不良药物反应和预测基因家族。未能考虑类别不平衡通常会导致许多分类算法的预测性能不准确和下降。不平衡学习旨在解决类别不平衡问题,从不平衡数据中学习无偏模型。

awesome-machine-learning 的启发。在这个仓库里:

  • 框架编程语言 分组。
  • 研究论文研究领域 分组。

注意:

  • 如果你喜欢这个项目,请给它一个 <font color='orange'>星级</font>
  • 贡献并且你会出现在 贡献者✨
  • 在这个研究领域中有大量的论文,所以这个列表并不打算穷尽所有。
  • 我们的目标是只保留那些 有良好影响 或者已经 *在 知名顶级会议/期刊 上发表的 “精彩”成果。
<h3><font color='red'>有什么新内容:</font></h3>

查看 Zhining 的其他开源项目!

<table style="font-size:15px;"> <tr> <td align="center"><a href="https://github.com/ZhiningLiu1998/imbalanced-ensemble"><img src="https://yellow-cdn.veclightyear.com/35dd4d3f/c03db1eb-03bd-485e-844e-98ee2b581b28.png" height="80px" alt=""/><br /><sub><b>Imbalanced-Ensemble [PythonLib]</b></sub></a><br /> <a href="https://github.com/ZhiningLiu1998/imbalanced-ensemble/stargazers"> <img alt="GitHub stars" src="https://yellow-cdn.veclightyear.com/35dd4d3f/c0763fa9-e73a-4f63-8207-799b4db31608.png"> </a> </td> <td align="center"><a href="https://github.com/ZhiningLiu1998/awesome-awesome-machine-learning"><img src="https://yellow-cdn.veclightyear.com/35dd4d3f/cc9ce30e-4c1f-4bc4-97a1-95bba8b9cf0e.png" height="80px" alt=""/><br /><sub><b>Machine Learning [Awesome]</b></sub></a><br /> <a href="https://github.com/ZhiningLiu1998/awesome-awesome-machine-learning/stargazers"> <img alt="GitHub stars" src="https://yellow-cdn.veclightyear.com/35dd4d3f/aae4e95a-b398-4dbd-8117-e5fe7f757f05.png"> </a> </td> <td align="center"><a href="https://github.com/ZhiningLiu1998/self-paced-ensemble"><img src="https://yellow-cdn.veclightyear.com/35dd4d3f/64dd3c7f-1d7c-43bc-a764-0f6859923583.png" height="80px" alt=""/><br /><sub><b>Self-paced Ensemble [ICDE]</b></sub></a><br /> <a href="https://github.com/ZhiningLiu1998/self-paced-ensemble/stargazers"> <img alt="GitHub stars" src="https://yellow-cdn.veclightyear.com/35dd4d3f/a654f876-e3df-499a-8f29-a6fb3e6bdc41.png"> </a> </td> <td align="center"><a href="https://github.com/ZhiningLiu1998/mesa"><img src="https://yellow-cdn.veclightyear.com/35dd4d3f/d8b5f863-8f40-49ef-9808-ff7a78691904.png" height="80px" alt=""/><br /><sub><b>Meta-Sampler [NeurIPS]</b></sub></a><br /> <a href="https://github.com/ZhiningLiu1998/mesa/stargazers"> <img alt="GitHub stars" src="https://yellow-cdn.veclightyear.com/35dd4d3f/d84ae733-aa8c-4d13-9f49-8a6a8a8c710c.png"> </a> </td> </tr> </table>

目录

1. 框架和库

1.1 Python

  • imbalanced-ensemble [Github][文档][画廊][论文]

    注意: 用 Python 编写,易于使用。

    • imbalanced-ensemble 是一个 Python 工具箱,用于快速实施和部署在类别不平衡数据上进行 集成学习算法。其特点有:
      • (i) 统一、易用的 API,详细的 文档示例
      • (ii) 开箱即用的多类别不平衡学习能力。
      • (iii) 在可能时通过 joblib 进行并行优化性能。
      • (iv) 强大、可定制、互动的训练日志和可视化工具。
      • (v) 与 scikit-learnimbalanced-learn 等其他流行包完全兼容。
    • 当前 (v0.1.4),它包括超过 15 种基于 重采样成本敏感学习 的集成算法(例如,SMOTEBoost/Bagging, RUSBoost/Bagging, AdaCost, EasyEnsemble, BalanceCascade, SelfPacedEnsemble, 等等)。
  • imbalanced-learn [Github][文档][论文]

    注意: 用 Python 编写,易于使用。

    • imbalanced-learn 是一个 Python 包,提供了许多在类别不平衡数据集中常用的 重采样 技术。它兼容 scikit-learn,并且是 scikit-learn-contrib 项目的一部分。
    • 当前 (v0.8.0),它包含21种不同的重采样技术,包括过采样、欠采样和混合技术(例如,SMOTE, ADASYN, TomekLinks, NearMiss, OneSideSelection, SMOTETomek, 等等)
    • 此包还提供许多实用工具,例如,Keras/TensorFlow 的批量生成器,详见 API 参考
  • smote_variants [文档][Github] - 一个用于不平衡学习的 85 种少数类 过采样 技术的集合,具有多类别过采样和模型选择功能(全部用 Python 编写,也支持 R 和 Julia)。

1.2 R

  • smote_variants [文档][Github] - 一个用于不平衡学习的 85 种少数类 过采样 技术的集合,具有多类别过采样和模型选择功能(全部用 Python 编写,也支持 R 和 Julia)。
  • caret [文档][Github] - 包含随机欠/过采样的实现。
  • ROSE [文档] - 包含 ROSE (随机过采样示例) 的实现。
  • DMwR [文档] - 包含 SMOTE (合成少数过采样技术) 的实现。

1.3 Java

  • KEEL [Github][论文] - KEEL 提供了一个基于数据流的简单 图形用户界面 来设计实验,使用不同的数据集和计算智能算法(尤其关注进化算法)来评估算法的表现。这一工具包含许多广泛使用的不平衡学习技术,例如(进化)过/欠采样、成本敏感学习、算法修改和集成学习方法。

    注意: 包含多种经典的分类、回归、预处理算法。

1.4 Scalar

1.5 Julia

  • smote_variants [文档][Github] - 一个用于不平衡学习的 85 种少数类 过采样 技术的集合,具有多类别过采样和模型选择功能(全部用 Python 编写,也支持 R 和 Julia)。

2. 研究论文

2.1 调查

  • 从不平衡数据中学习 (IEEE TKDE, 2009, 6000+ 引用) [论文]

    • 高度引用的经典调查论文。系统地回顾了流行的解决方案、评估指标以及未来研究中的挑战问题(截至2009年)。
  • 从不平衡数据中学习:开放挑战和未来方向 (2016, 900+ 引用) [论文]

    • 这篇论文集中讨论了不平衡学习中的开放问题和挑战,例如极端类别不平衡、在线/流学习中的不平衡、多类别不平衡学习以及半监督/无监督的不平衡学习。
  • 学习不平衡数据:方法和应用综述 (2017, 900+ 引用) [论文]

    • 最近的一项全面调查不平衡学习方法和应用,总共包括 527 篇论文。它提供了多个现有方法的详细分类,并讨论了该研究领域的最新趋势。

2.2 集成学习

2.2.1 通用集成

<!-- - **通用集成** -->

注意: 灵活的解决方案,具有卓越的性能和计算效率。

  • MESA: 用MEta-SAmpler提升集成不平衡学习 (NeurIPS 2020) [论文][代码][视频][知乎]

    注意: 直接从数据中学习最佳采样策略。

  • 类不平衡学习的探索性欠采样 (IEEE Trans. on SMC, 2008, 引用1300+) [论文]

    注意: 简单但有效的解决方案。

2.2.2 基于Boosting

  • AdaBoost (1995, 引用18700+) [论文][代码] - 自适应Boosting与C4.5
  • DataBoost (2004, 引用570+) [论文] - 为不平衡数据生成数据的Boosting
  • SMOTEBoost (2003, 引用1100+) [论文][代码] - 合成少数类过采样技术Boosting
  • MSMOTEBoost (2011, 引用1300+) [论文] - 修改型合成少数类过采样技术Boosting
  • RAMOBoost (2010, 引用140+) [论文][代码] - 排序少数类过采样Boosting
  • RUSBoost (2009, 引用850+) [论文][代码] - 随机欠采样Boosting
  • AdaBoostNC (2012, 引用350+) [论文] - 具有负相关学习的自适应Boosting
  • EUSBoost (2013, 引用210+) [论文] - 基于进化欠采样的Boosting

2.2.3 基于Bagging

  • Bagging (1996, 引用20000+) [论文][代码] - Bagging预测

  • 利用集成模型对不平衡数据集的多样性分析 (2009, 引用400+) [论文]

2.2.4 成本敏感集成

  • AdaCost (ICML 1999,引用800+) [论文][代码] - 误分类成本敏感的Boosting
  • AdaUBoost (NIPS 1999, 引用100+) [论文][代码] - 具有不等损失函数的AdaBoost
  • AsymBoost (NIPS 2001, 引用700+) [论文][代码] - 非对称AdaBoost及检测器级联

2.3 数据重采样

2.3.1 过采样

  • ROS [代码] - 随机过采样
  • SMOTE (2002, 引用9800+) [论文][代码] - 合成少数类过采样技术
  • Borderline-SMOTE (2005, 引用1400+) [论文][代码] - 边界合成少数类过采样技术
  • ADASYN (2008, 引用1100+) [论文][代码] - 自适应合成采样
  • SPIDER (2008, 引用150+) [论文][代码(Java)] - 不平衡数据的选择性预处理
  • Safe-Level-SMOTE (2009, 引用370+) [论文][代码(Java)] - 安全级合成少数类过采样技术
  • SVM-SMOTE (2009, 引用120+) [论文][代码] - 基于支持向量机支持向量的SMOTE
  • MDO (2015, 引用150+) [论文][代码] - 基于马氏距离的多类不平衡问题过采样。

注意: 关于更多过采样方法,请参见 smote-variants.

2.3.2 欠采样

  • RUS [代码] - 随机欠采样
  • CNN (1968年, 2100+ 引用) [论文][代码] - 浓缩最近邻
  • ENN (1972年, 1500+ 引用) [论文] [代码] - 编辑的浓缩最近邻
  • TomekLink (1976年, 870+ 引用) [论文][代码] - Tomek 的浓缩最近邻修改
  • NCR (2001年, 500+ 引用) [论文][代码] - 邻域清理规则
  • NearMiss-1 & 2 & 3 (2003年, 420+ 引用) [论文][代码] - 针对不平衡数据分布的几种 kNN 方法
  • CNN with TomekLink (2004年, 2000+ 引用) [论文][代码(Java)] - 浓缩最近邻 + TomekLink
  • OSS (2007年, 2100+ 引用) [论文][代码] - 单侧选择
  • EUS (2009年, 290+ 引用) [论文] - 进化欠采样
  • IHT (2014年, 130+ 引用) [论文][代码] - 实例硬度阈值

2.3.3 混合采样

  • A Study of the Behavior of Several Methods for Balancing Training Data (2004年, 2000+ 引用) [论文]

    注意: 涉及 10 种不同过采样/欠采样方法的广泛实验评估。

  • SMOTE-RSB (2012年, 210+ 引用) [论文][代码] - 使用 SMOTE 和粗糙集理论的混合预处理

  • SMOTE-IPF (2015年, 180+ 引用) [论文][代码] - 带有迭代分区过滤器的 SMOTE

2.4 成本敏感学习

  • CSC4.5 (2002年, 420+ 引用) [论文][代码(Java)] - 一种实例加权方法,用于构建成本敏感树
  • CSSVM (2008年, 710+ 引用) [论文][代码(Java)] - 用于高度不平衡分类的成本敏感 SVM
  • CSNN (2005年, 950+ 引用) [论文][代码(Java)] - 使用解决类别不平衡问题的方法训练成本敏感神经网络。

2.5 深度学习

2.5.1 综述

  • 综述

  • 卷积神经网络中类别不平衡问题的系统研究 (2018年, 330+ 引用) [论文]

  • 类别不平衡深度学习综述 (2019年, 50+ 引用) [论文]

    注意: 最近关于深度学习中类不平衡问题的全面综述。

2.5.2 图数据挖掘

  • 图神经网络

  • 半监督图不平衡回归 (KDD 2023) [论文] [代码]

  • TAM: 用于类不平衡节点分类的拓扑感知边缘损失 (ICML 2022) [论文][代码]

  • GraphSMOTE:使用图神经网络的图节点不平衡分类 (WSDM 2021) [论文][代码]

  • 用于半监督节点分类的拓扑不平衡学习 (NeurIPS 2021) [论文][代码]

  • GraphENS:用于类不平衡节点分类的邻域感知自我网络合成 (ICLR 2022) [论文][代码]

  • LTE4G:用于图神经网络的长尾专家 (CIKM 2022) [论文][代码]

  • 多类不平衡图卷积网络学习 (IJCAI 2020) [论文]

2.5.3 困难样本挖掘

  • 困难样本挖掘

  • 使用在线困难样本挖掘训练基于区域的目标检测器 (CVPR 2016, 840+ 引用) [论文][代码] - 在 NN 训练的后期阶段,仅对“困难样本”(即损失值较大的样本)执行梯度反向传播

2.5.4 损失函数工程

  • 损失函数工程

  • 用于密集目标检测的焦点损失 (ICCV 2017, 2600+ 引用) [论文][代码 (detectron2)][代码(非官方)] - 一种均匀的损失函数,专注于训练一组稀疏的困难样本,以防止训练过程中大量容易的负样本压倒检测器。

注意: 优雅的解决方案,高影响力。

  • 在不平衡数据集上训练深度神经网络 (IJCNN 2016, 110+ 引用) [论文] - 平均(平方)错误,可以同样捕捉来自多数类和少数类的分类错误。
  • 使用视觉注意力聚合进行深度不平衡属性分类 (ECCV 2018, 30+ 引用) [论文][代码]
  • 通过少数类增量修正实现不平衡深度学习 (TPAMI 2018, 60+ 引用) [论文] - 类别修正损失,通过在迭代批量学习过程中发现少数类的稀疏采样边界,最小化多数类的主导效应。
  • 带有标签分布感知边缘损失的不平衡数据集学习 (NIPS 2019, 10+ 引用) [论文][代码] - 一个理论上有原则的标签分布感知边缘(LDAM)损失,通过最小化基于边缘的泛化界限。
  • 梯度和谐单阶段检测器 (AAAI 2019, 40+ 引用) [论文][代码] - 与仅对“容易”负样本进行降权的Focal损失相比,GHM还对可能为异常值的“非常困难”样本进行降权。
  • 基于有效样本数量的类平衡损失 (CVPR 2019, 70+ 引用) [论文][代码] - 一个基于有效样本数量的简单而通用的类重加权机制。
  • 对不平衡视觉分类的影响平衡损失 (ICCV 2021) [论文][代码]
  • AutoBalance:用于不平衡数据的优化损失函数 (NeurIPS 2021) [论文]
  • 过度参数化下的不平衡标签和群体敏感分类 (NeurIPS 2021) [论文][代码]

元学习

  • 学习尾部模型 (NIPS 2017, 70+ 引用) [论文] - 从分布头中的数据丰富类转移元知识到尾部的数据匮乏类。
  • 学习重新加权样本以实现稳健的深度学习 (ICML 2018, 150+ 引用) [论文][代码] - 通过隐式学习一个权重函数来在DNN的梯度更新中重新加权样本。

注意: 通过元学习解决类别不平衡问题的代表性工作。

  • 元权重网络:学习一个显式的样本加权映射 (NIPS 2019) [论文][代码] - 显式学习一个权重函数(以多层感知器作为函数近似器)来在DNN的梯度更新中重新加权样本。
  • 学习数据操纵以增强和加权 (NIPS 2019) [论文][代码]
  • 学习平衡:用于不平衡和分布外任务的贝叶斯元学习 (ICLR 2020) [论文][代码]
  • MESA: 使用元采样器增强集成不平衡学习 (NeurIPS 2020) [论文][代码][视频]

注意: 由元学习驱动的集成学习

表示学习

  • 用于不平衡分类的深度表示学习 (CVPR 2016, 220+ 引用) [论文]
  • 基于GAN的不平衡分类的有监督类分布学习 (ICDM 2019) [论文]
  • 长尾识别的表示与分类器解耦 (ICLR 2020) [论文][代码]

注意: 在表示学习和分类器学习方面的有趣发现

  • 用基于能量的对比表示转移来超速不平衡数据学习 (NeurIPS 2021) [论文]
  • 为有监督学习定制自监督 (ECCV 2022) [论文][代码]

后验校准

  • 不平衡数据集的后验重新校准 (NeurIPS 2020) [论文][代码]
  • 通过Logit调整进行长尾学习 (ICLR 2021) [论文][代码]

半监督/自监督学习

  • 重新思考标签的价值以改善不平衡学习 (NeurIPS 2020) [论文][代码][视频]

注意: 半监督训练/自监督预训练有助于不平衡学习

  • 不平衡半监督学习的伪标签分布校准精炼 (NeurIPS 2020) [论文][代码]
  • 用于类不平衡半监督学习的辅助平衡分类器 (NeurIPS 2021) [论文][代码]
  • 通过开放世界采样改善不平衡数据的对比学习 (NeurIPS 2021) [论文]
  • 用于不平衡半监督学习的分布感知语义导向伪标签 (CVPR 2022) [论文][代码]

课程学习

  • 用于不平衡数据分类的动态课程学习 (ICCV 2019) [论文]

两阶段训练

在平衡数据集上进行预训练,在原始不平衡数据上微调softmax之前的最后输出层。

网络架构

  • BBN: 用于长尾视觉识别的双边分支网络与累积学习 (CVPR 2020) [论文][代码]
  • 通过类平衡集成实现不平衡深度学习 (TNNLS 2021) [论文]

深度生成模型

  • 用于鲁棒不平衡分类的深度生成模型 (CVPR 2020) [论文]

不平衡回归

  • 半监督图不平衡回归 (KDD 2023) [论文] [代码]
  • RankSim: 排名相似性正则化用于深度不平衡回归 (ICML 2022) [论文] [代码]
  • 不平衡视觉回归的均衡MSE (CVPR 2022) [论文] [代码]
  • 深入研究深度不平衡回归 (ICML 2021) [论文][代码][视频]
  • 基于密度加权的不平衡回归 (Machine Learning [J], 2021) [论文][代码]

2.5.14 数据增强

<!-- - **增强** -->
  • 面向少数类的附近扩展与注意力聚合用于视频长尾识别 (AAAI 2023) [论文][代码]
<!-- ## 2.6 异常检测 #### 2.6.1 **综述** - 异常检测: 一项综述 (ACM computing surveys, 2009, 9000+ 引用) [[**论文**](cinslab.com/wp-content/uploads/2019/03/xiaorong.pdf)] - 网络异常检测技术综述 (2017, 700+ 引用) [[**论文**](https://www.gta.ufrj.br/~alvarenga/files/CPE826/Ahmed2016-Survey.pdf)] #### 2.6.2 **基于分类的** - 用于文档分类的一类SVM (JMLR, 2001, 1300+ 引用) [[**论文**](www.jmlr.org/papers/volume2/manevitz01a/manevitz01a.pdf)] - 一类协同过滤 (ICDM 2008, 1000+ 引用) [[**论文**](https://cseweb.ucsd.edu/classes/fa17/cse291-b/reading/04781145.pdf)] - 隔离森林 (ICDM 2008, 1000+ 引用) [[**论文**](https://cs.nju.edu.cn/zhouzh/zhouzh.files/publication/icdm08b.pdf?q=isolation-forest)] - 使用单类神经网络进行异常检测 (2018, 200+ 引用) [[**论文**](https://arxiv.org/pdf/1802.06360.pdf)] - 用稳健深度自动编码器进行异常检测 (KDD 2017, 170+ 引用) [[**论文**](https://pdfs.semanticscholar.org/c112/b06d3dac590b4cc111e5ec9c805d0b086c6e.pdf)] -->

3. 杂项

3.1 数据集

  • imbalanced-learn 数据集

    该数据集集合来自 imblearn.datasets.fetch_datasets.

    ID名称存储库及目标比例#S#F
    1ecoliUCI, 目标: imU8.6:13367
    2optical_digitsUCI, 目标: 89.1:15,62064
    3satimageUCI, 目标: 49.3:16,43536
    4pen_digitsUCI, 目标: 59.4:110,99216
    5abaloneUCI, 目标: 79.7:14,17710
    6sick_euthyroidUCI, 目标: sick euthyroid9.8:13,16342
    7spectrometerUCI, 目标: > =4411:153193
    8car_eval_34UCI, 目标: good, v good12:11,72821
    9isoletUCI, 目标: A, B12:17,797617
    10us_crimeUCI, 目标: >0.6512:11,994100
    11yeast_ml8LIBSVM, 目标: 813:12,417103
    12sceneLIBSVM, 目标: >one label13:12,407294
    13libras_moveUCI, 目标: 114:136090
    14thyroid_sickUCI, 目标: sick15:13,77252
    15coil_2000KDD, CoIL, 目标: minority16:19,82285
    16arrhythmiaUCI, 目标: 0617:1452278
    17solar_flare_m0UCI, 目标: M->019:11,38932
    18oilUCI, 目标: minority22:193749
    19car_eval_4UCI, 目标: vgood26:11,72821
    20wine_qualityUCI, wine, 目标: <=426:14,89811
    21letter_imgUCI, 目标: Z26:120,00016
    22yeast_me2UCI, 目标: ME228:11,4848
    23webpageLIBSVM, w7a, 目标: minority33:134,780300
    24ozone_levelUCI, ozone, data34:12,53672
    25mammographyUCI, 目标: minority42:111,1836
    26protein_homoKDD CUP 2004, 目标: minority111:1145,75174
    27abalone_19UCI, 目标: 19130:14,17710
  • 不平衡数据库

    链接: https://github.com/gykovacs/mldb

3.2 Github 存储库

3.2.1 算法 & 工具 & Jupyter 笔记本

3.2.2 论文列表

3.2.3 幻灯片

  • acm_imbalanced_learning - 2016年4月27日在德克萨斯州奥斯汀举行的ACM不平衡学习讲座的幻灯片和代码。

Contributors ✨

感谢以下这些优秀的人们 (emoji key):

<!-- ALL-CONTRIBUTORS-LIST:START - Do not remove or modify this section --> <!-- prettier-ignore-start --> <!-- markdownlint-disable --> <table> <tbody> <tr> <td align="center" valign="top" width="14.28%"><a href="http://zhiningliu.com"><img src="https://yellow-cdn.veclightyear.com/35dd4d3f/4e0790a5-3f18-4e7a-9a05-409b6a2c6fb3.png" width="100px;" alt="Zhining Liu"/><br /><sub><b>Zhining Liu</b></sub></a><br /><a href="https://github.com/ZhiningLiu1998/awesome-imbalanced-learning/commits?author=ZhiningLiu1998" title="Code">💻</a> <a href="#maintenance-ZhiningLiu1998" title="Maintenance">🚧</a> <a href="#translation-ZhiningLiu1998" title="Translation">🌍</a></td> <td align="center" valign="top" width="14.28%"><a href="https://github.com/AshinZeng"><img src="https://yellow-cdn.veclightyear.com/35dd4d3f/80e59f23-37e1-47b4-b936-12f288fb38ec.png" width="100px;" alt="曾阿信"/><br /><sub><b>曾阿信</b></sub></a><br /><a href="#maintenance-AshinZeng" title="Maintenance">🚧</a></td> <td align="center" valign="top" width="14.28%"><a href="https://wjun0830.github.io/"><img src="https://yellow-cdn.veclightyear.com/35dd4d3f/618aecce-d7e1-4c2c-96d7-4c187091650f.png" width="100px;" alt="WonJun Moon"/><br /><sub><b>WonJun Moon</b></sub></a><br /><a href="https://github.com/ZhiningLiu1998/awesome-imbalanced-learning/commits?author=wjun0830" title="Code">💻</a></td> <td align="center" valign="top" width="14.28%"><a href="https://github.com/liugangcode"><img src="https://yellow-cdn.veclightyear.com/35dd4d3f/3e7503d7-b579-4ac4-b663-fe4e24753c13.png" width="100px;" alt="Gang Liu"/><br /><sub><b>Gang Liu</b></sub></a><br /><a href="https://github.com/ZhiningLiu1998/awesome-imbalanced-learning/commits?author=liugangcode" title="Code">💻</a></td> </tr> </tbody> </table> <!-- markdownlint-restore --> <!-- prettier-ignore-end --> <!-- ALL-CONTRIBUTORS-LIST:END -->

该项目遵循all-contributors规范。欢迎任何形式的贡献!

编辑推荐精选

Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
问小白

问小白

全能AI智能助手,随时解答生活与工作的多样问题

问小白,由元石科技研发的AI智能助手,快速准确地解答各种生活和工作问题,包括但不限于搜索、规划和社交互动,帮助用户在日常生活中提高效率,轻松管理个人事务。

热门AI助手AI对话AI工具聊天机器人
Transly

Transly

实时语音翻译/同声传译工具

Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

AI办公办公工具AI工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图热门
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

热门AI开发模型训练AI工具讯飞星火大模型智能问答内容创作多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

热门AI辅助写作AI工具讯飞绘文内容运营AI创作个性化文章多平台分发AI助手
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

openai-agents-python

openai-agents-python

OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。

openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。

下拉加载更多