Pretty Confusion Matrix是一个强大而灵活的Python库,专门用于绘制美观的混淆矩阵。它由Wagner Cipriano于2018年创建,旨在为机器学习从业者和研究人员提供一种简单的方法来可视化分类模型的性能。该库利用seaborn和matplotlib的功能,生成类似MATLAB风格的高质量混淆矩阵图。
Pretty Confusion Matrix具有以下几个突出特点:
简单易用:只需几行代码即可生成漂亮的混淆矩阵。
灵活性强:支持从NumPy矩阵或两个NumPy数组(y_test和predictions)创建混淆矩阵。
高度可定制:提供多种参数来调整矩阵的外观,包括颜色方案、标签等。
MATLAB风格:生成的混淆矩阵具有类似MATLAB的清晰美观风格。
与主流数据科学库兼容:可以无缝集成到使用NumPy、Pandas等库的工作流程中。
安装Pretty Confusion Matrix非常简单,只需使用pip:
pip install pretty-confusion-matrix
以下是一个基本使用示例,展示了如何从DataFrame创建混淆矩阵:
import numpy as np import pandas as pd from pretty_confusion_matrix import pp_matrix array = np.array([[13, 0, 1, 0, 2, 0], [0, 50, 2, 0, 10, 0], [0, 13, 16, 0, 0, 3], [0, 0, 0, 13, 1, 0], [0, 40, 0, 1, 15, 0], [0, 0, 0, 0, 0, 20]]) # 创建pandas DataFrame df_cm = pd.DataFrame(array, index=range(1, 7), columns=range(1, 7)) # 选择颜色方案 cmap = 'PuRd' # 绘制混淆矩阵 pp_matrix(df_cm, cmap=cmap)
这段代码将生成一个漂亮的混淆 矩阵,使用'PuRd'颜色方案。

Pretty Confusion Matrix还提供了许多高级功能,使用户能够进一步自定义混淆矩阵的外观和内容。
您可以使用自定义文本而不是整数来标记轴。例如:
col = ['Dog', 'Cat', 'Mouse', 'Fox', 'Bird', 'Chicken'] df_cm = pd.DataFrame(array, index=col, columns=col) pp_matrix(df_cm, cmap=cmap)
这将用"Dog", "Cat", "Mouse"等替换轴上的数字标签。
除了使用DataFrame,您还可以直接从预测向量和真实标签向量创建混淆矩阵:
from pretty_confusion_matrix import pp_matrix_from_data y_test = np.array([1, 2, 3, 4, 5, ...]) # 真实标签 predic = np.array([1, 2, 4, 3, 5, ...]) # 预测标签 pp_matrix_from_data(y_test, predic)
这种方法特别适用于直接处理机器学习模型输出的情况。
Pretty Confusion Matrix支持matplotlib中的所有颜色方案。您可以通过更改cmap参数来选择不同的颜色方案:
pp_matrix(df_cm, cmap='Oranges')
要查看所有可用的颜色方案,可以使用:
from matplotlib import colormaps list(colormaps)
Pretty Confusion Matrix在多个机器学习和数据科学领域都有广泛应用:
图像分类:评估卷积神经网络在识别不同物体或场景时的性能。
自然语言处理:分析文本分类模型在区分不同主题或情感时的准确性。
医学诊断:可视化机器学习模型在预测不同疾病时的准确性和错误类型。
金融风险评估:展示信用评分模型在预测不同风险级别时的表现。
生物信息学:分析基因表达数据分类的结果。
通过使用Pretty Confusion Matrix,研究人员和数据科学家可以快速直观地理解他们的模型性能,识别常见的错误类型,并针对性地改进模型。
虽然scikit-learn等库也提供了混淆矩阵可视化功能,但Pretty Confusion Matrix在以下几个方面具有优势:
美观度:生成的图表更加美观,类似于MATLAB的专业风格。
定制性:提供更多参数来调整矩阵的外观。
易用性:API设计简洁,使用起来更加直观。
与pandas的集成:可以直接使用pandas DataFrame,简化了工作流程。
作为一个开源项目,Pretty Confusion Matrix正在不断发展。未来可能的改进方向包括:
支持交互式可视化,允许用户在浏览器中探索混淆矩阵。
增加更多的统计指标,如精确度、召回率等。
提供更多的预设主题和样式。
改进对大规模数据集的处理能力。
Pretty Confusion Matrix为Python中的混淆矩阵可视化提供了一个强大而灵活的解决方案。无论是初学者还是经验丰富的数据科学家,都可以利用这个库来创建漂亮、信息丰富的混淆矩阵,从而更好地理解和改进他们的分类模型。通过持续的社区贡献和开发,Pretty Confusion Matrix有望在未来变得更加强大和versatile。
对于任何从事机器学习和数据分析工作的人来说,Pretty Confusion Matrix都是一个值得添加到工具箱中的库。它不仅能帮助您更好地理解模型性能,还能在报告和演示中创建专业的可视化效果。无论您是在进行学术研究、开发商业应用还是参与数据科学竞赛,Pretty Confusion Matrix都能为您的工作增添价值。


免费创建高清无水印Sora视频
Vora是一个免费创建高清无水印Sora视频的AI工具


最适合小白的AI自动化工作流平台
无需编码,轻松生成可复用、可变现的AI自动化工作流

大模型驱动的Excel数据处理工具
基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。


AI辅助编程,代码自动修复
Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。


AI论文写作指导平台
AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。


AI一键生成PPT,就用博思AIPPT!
博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。


AI赋能电商视觉革命,一站式智能商拍平台
潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。


企业专属的AI法律顾问
iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构, 帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。


稳定高效的流量提升解决方案,助力品牌曝光
稳定高效的流量提升解决方案,助力品牌曝光


最新版Sora2模型免费使用,一键生成无水印视频
最新版Sora2模型免费使用,一键生成无水印视频
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号