Leaderboard

Leaderboard

多语言语音识别基准测试平台 促进ASR系统评估

SpeechColab ASR leaderboard是一个开源的语音识别基准平台,集成测试集、模型集和标准化评估流程。平台提供多样化测试数据,涵盖广泛ASR场景,支持商业API和开源模型评估。它简化了ASR系统的基准测试、复现和验证过程,方便研究人员和开发者比较不同系统性能。通过统一的评估标准,该平台有助于推动语音识别技术的持续进步。

语音识别基准测试数据集模型评估Github开源项目

SpeechColab ASR leaderboard

result result

1. Overview

"If you can’t measure it, you can’t improve it." -- Peter Drucker

SpeechIO leaderboard serves as an ASR benchmarking platform by providing 3 components:

  1. TestSet Zoo: A collection of test sets covering wide range of speech recognition tasks & scenarios

  2. Model Zoo: A collection of models including commercial APIs & open-sourced models

  3. Benchmarking Pipeline: a simple & well-specified pipeline to take care of data preparation / recognition / post processing / error rate evaluation.

People should be able to easily benchmark, reproduce, examine ASR systems from each other

Overview


2. TestSet Zoo: datasets/*

<details><summary> Academic Test Sets (EN & ZH) </summary><p>
已公开 <br> UNLOCKED编号 <br> DATASET_ID说明 <br> DESCRIPTION语言 <br> LANGUAGE
AISHELL1_TESTtest set of AISHELL-1zh
AISHELL2_IOS_TESTtest set of AISHELL-2 (iOS channel)zh
AISHELL2_ANDROID_TESTtest set of AISHELL-2 (Android channel)zh
AISHELL2_MIC_TESTtest set of AISHELL-2 (Microphone channel)zh
ALIMEETING_EVAL_NEAR_FIELDAliMeetingzh
ALIMEETING_TEST_NEAR_FIELDAliMeetingzh
ALIMEETING_EVAL_FAR_FIELDAliMeetingzh
ALIMEETING_TEST_FAR_FIELDAliMeetingzh
LIBRISPEECH_TEST_CLEAN"test_clean" set of LibriSpeechen
LIBRISPEECH_TEST_OTHER"test_other" set of LibriSpeechen
TEDLIUM_RELEASE3_LEGACY_DEVtedlium release 3, legacy dir dev set TEDLium3en
TEDLIUM_RELEASE3_LEGACY_TESTtedlium release 3, legacy dir test set TEDLium3en
GIGASPEECH_V1.0.0_DEVdev set of GigaSpeechen
GIGASPEECH_V1.0.0_TESTtest set of GigaSpeechen
VOXPOPULI_V1.0_EN_DEVdev set of VoxPopulien
VOXPOPULI_V1.0_EN_TESTtest set of VoxPopulien
VOXPOPULI_V1.0_EN_ACCENTED_TESTaccented test set of VoxPopulien
COMMON_VOICE_V11.0_DEVdev set of Common Voiceen
COMMON_VOICE_V11.0_TESTtest set of Common Voiceen
</p></details> <details><summary> SpeechIO Test Sets (ZH) </summary><p>
SpeechIO test sets are carefully curated by SpeechIO authors, crawled from publicly available sources (Youtube, TV programs, Podcast etc), covering various well-known scenarios and topics, transcribed by payed professional annotators.
已公开 <br> UNLOCKED编号 <br> DATASET_ID名称 <br> NAME场景 <br> SCENARIO内容领域 <br> TOPIC有效时长 <br> DURATION (HOURS)难度(1-5) <br> DIFFICULTY
SPEECHIO_ASR_ZH00000调试集 <br> for debugging视频会议、论坛演讲 <br> conference & speech经济、货币、金融 <br> economy, currency, finance1.0★★☆
SPEECHIO_ASR_ZH00001新闻联播新闻播报 <br> TV News时政 <br> news & politics9
SPEECHIO_ASR_ZH00002鲁豫有约访谈电视节目 <br> TV interview名人工作/生活 <br> celebrity & film & music & daily3★★☆
SPEECHIO_ASR_ZH00003天下足球专题电视节目 <br> TV program足球 <br> Sports & Football & Worldcup2.7★★☆
SPEECHIO_ASR_ZH00004罗振宇跨年演讲会场演讲 <br> Stadium Public Speech社会、人文、商业 <br> Society & Culture & Business Trend2.7★★
SPEECHIO_ASR_ZH00005李永乐讲堂在线教育 <br> Online Education科普 <br> Popular Science4.4★★★
SPEECHIO_ASR_ZH00006王者荣耀 <br> 张大仙 & 骚白直播 <br> Live Broadcasting游戏 <br> Game1.6★★★☆
SPEECHIO_ASR_ZH00007直播带货 <br> 李佳琪 & 薇娅直播 <br> Live Broadcasting电商、美妆 <br> Makeup & Online shopping/advertising0.9★★★★☆
SPEECHIO_ASR_ZH00008老罗语录线下培训 <br> Offline lecture段子、做人 <br> Life & Purpose & Ethics1.3★★★★☆
SPEECHIO_ASR_ZH00009故事FM播客 <br> Podcast人生故事、见闻 <br> Ordinary Life Story Telling4.5★★☆
SPEECHIO_ASR_ZH00010创业内幕播客 <br> Podcast创业、产品、投资 <br> Startup & Enterprenuer & Product & Investment4.2★★☆
SPEECHIO_ASR_ZH00011罗翔刑法法考在线教育 <br> Online Education法律 法考 <br> Law & Lawyer Qualification Exams3.4★★☆
SPEECHIO_ASR_ZH00012张雪峰考研在线教育 <br> Online Education考研 高校报考 <br> University & Graduate School Entrance Exams3.4★★★☆
SPEECHIO_ASR_ZH00013谷阿莫 <br> 牛叔说电影短视频 <br> VLog电影剪辑 <br> Movie Cuts1.8★★★
SPEECHIO_ASR_ZH00014贫穷料理 <br> 琼斯爱生活短视频 <br> VLog美食、烹饪 <br> Food & Cooking & Gourmet1★★★☆
SPEECHIO_ASR_ZH00015单田芳 白眉大侠评书 <br> Traditional Podcast江湖、武侠 <br> Kongfu Fiction2.2★★☆
SPEECHIO_ASR_ZH00016德云社演出剧场相声 <br> Theater Crosstalk Show包袱段子 <br> Funny Stories1★★★
SPEECHIO_ASR_ZH00017吐槽大会脱口秀电视节目 <br> Standup Comedy明星糗事 <br> Celebrity Jokes1.8★★☆
SPEECHIO_ASR_ZH00018小猪佩奇 <br> 熊出没少儿动画 <br> Children Cartoon童话故事、日常 <br> Fairy Tale0.9★☆
SPEECHIO_ASR_ZH00019CCTV5 NBA 转播体育赛事解说 <br> Sports Game Live篮球、NBA <br> NBA Game0.7★★★
SPEECHIO_ASR_ZH00020篮球人物纪录片 <br> Documentary篮球明星、成长 <br> NBA Super Stars' Life & History2.2★★
SPEECHIO_ASR_ZH00021汽车之家评测短视频 <br> VLog汽车测评 <br> Car benchmarks, Road driving test1.7★★★☆
SPEECHIO_ASR_ZH00022小艾大叔 豪宅带看短视频 <br> VLog房地产、豪宅 <br> Realestate, Mansion tour1.7★★★
SPEECHIO_ASR_ZH00023无聊开箱 <br> Zealer评测短视频 <br> VLog产品开箱评测 <br> Unboxing2★★★
SPEECHIO_ASR_ZH00024付老师种植技术短视频 <br> VLog农业、种植 <br> Agriculture, Planting2.7★★★☆
SPEECHIO_ASR_ZH00025石国鹏讲历史线下培训 <br> Offline lecture历史,古希腊哲学 <br> History, Greek philosophy1.3★★☆
SPEECHIO_ASR_ZH00026张震鬼故事广播节目 <br> Broadcasting Program鬼故事 <br> Horror Stories2.4★★★
SPEECHIO_ASR_ZH00027华语辩论世界杯辩论赛 <br> Debates Contest兴趣、技能、成长 <br> Hobby, Skill, Growth1.4★★★
SPEECHIO_ASR_ZH00028时政现场同传同声传译 <br> Simultaneous Translation时政、社会公共治理 <br> News & Events on Public Governance2.1★★★☆
SPEECHIO_ASR_ZH00029港台明星访谈 <br> 周杰伦,曾志伟 <br> 张家辉,陈小春 <br> 周星驰口音(港台) <br> HongKong/Taiwan Accents娱乐、生活、演艺 <br> Entertainment, Acting, Musics1.5★★★☆
SPEECHIO_ASR_ZH00030世界青年说口音(老外) <br> Foreigner Accents异国文化比较 <br> Cultural Difference2★★★☆
SPEECHIO_ASR_ZH00031东方甄选直播 <br> broadcast带货,英语教学 <br> Online advertising & English Education2.4★★★☆
SPEECHIO_ASR_ZH00032郎朗钢琴课长视频 <br> long-form video音乐乐理,钢琴 <br> Music & piano1.7★★☆
SPEECHIO_ASR_ZH00033老石谈芯短视频 <br> VLog芯片 <br> chips2.8★★★
SPEECHIO_ASR_ZH00034电丸科技AK短视频 <br> VLog网络 IT <br> Internet tech, IT1.4★★★☆
SPEECHIO_ASR_ZH00035新氧医美短视频 <br> VLog医疗美容 <br> Medical Cosmetology1.4★★
SPEECHIO_ASR_ZH00036交通广播交通广播 <br> traffic radio路况,娱乐 <br> Traffics1.2★★★☆
SPEECHIO_ASR_ZH00037老俞闲聊在线会议 <br> Online meeting闲聊 <br> chat2.4★★★
SPEECHIO_ASR_ZH00038电影:疯狂石头+疯狂赛车电影 <br> Film重庆话、山东青岛、四川成都话、河北唐山话、粤语、天津话、河南话、陕西话、闽南话,武汉话等 <br> multiple accents1.3★★★★☆
SPEECHIO_ASR_ZH00039电影:1942电影 <br> Film河南话 <br> HeNan Accent0.9★★★★
SPEECHIO_ASR_ZH00040电影:白鹿原电影 <br> Film陕西话 <br> ShaanXi Accent1.1★★★★★
SPEECHIO_ASR_ZH00041电影:让子弹飞电影 <br> Film四川话 <br> SiChuan Accent1.1★★★★☆
SPEECHIO_ASR_ZH00042电影:人生大事电影 <br> Film武汉话 <br> WuHan Accent0.8★★★★
</p></details>

Download Dataset


3. Model Zoo: models/*

<details><summary> EN Models </summary><p>
编号 <br> MODEL_ID类型 <br> TYPE厂商/作者 <br> PROVIDER/AUTHOR简介 <br> DESCRIPTION链接 <br> URL
aliyun_api_en

编辑推荐精选

音述AI

音述AI

全球首个AI音乐社区

音述AI是全球首个AI音乐社区,致力让每个人都能用音乐表达自我。音述AI提供零门槛AI创作工具,独创GETI法则帮助用户精准定义音乐风格,AI润色功能支持自动优化作品质感。音述AI支持交流讨论、二次创作与价值变现。针对中文用户的语言习惯与文化背景进行专门优化,支持国风融合、C-pop等本土音乐标签,让技术更好地承载人文表达。

QoderWork

QoderWork

阿里Qoder团队推出的桌面端AI智能体

QoderWork 是阿里推出的本地优先桌面 AI 智能体,适配 macOS14+/Windows10+,以自然语言交互实现文件管理、数据分析、AI 视觉生成、浏览器自动化等办公任务,自主拆解执行复杂工作流,数据本地运行零上传,技能市场可无限扩展,是高效的 Agentic 生产力办公助手。

lynote.ai

lynote.ai

一站式搞定所有学习需求

不再被海量信息淹没,开始真正理解知识。Lynote 可摘要 YouTube 视频、PDF、文章等内容。即时创建笔记,检测 AI 内容并下载资料,将您的学习效率提升 10 倍。

AniShort

AniShort

为AI短剧协作而生

专为AI短剧协作而生的AniShort正式发布,深度重构AI短剧全流程生产模式,整合创意策划、制作执行、实时协作、在线审片、资产复用等全链路功能,独创无限画布、双轨并行工业化工作流与Ani智能体助手,集成多款主流AI大模型,破解素材零散、版本混乱、沟通低效等行业痛点,助力3人团队效率提升800%,打造标准化、可追溯的AI短剧量产体系,是AI短剧团队协同创作、提升制作效率的核心工具。

seedancetwo2.0

seedancetwo2.0

能听懂你表达的视频模型

Seedance two是基于seedance2.0的中国大模型,支持图像、视频、音频、文本四种模态输入,表达方式更丰富,生成也更可控。

nano-banana纳米香蕉中文站

nano-banana纳米香蕉中文站

国内直接访问,限时3折

输入简单文字,生成想要的图片,纳米香蕉中文站基于 Google 模型的 AI 图片生成网站,支持文字生图、图生图。官网价格限时3折活动

扣子-AI办公

扣子-AI办公

职场AI,就用扣子

AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!

堆友

堆友

多风格AI绘画神器

堆友平台由阿里巴巴设计团队创建,作为一款AI驱动的设计工具,专为设计师提供一站式增长服务。功能覆盖海量3D素材、AI绘画、实时渲染以及专业抠图,显著提升设计品质和效率。平台不仅提供工具,还是一个促进创意交流和个人发展的空间,界面友好,适合所有级别的设计师和创意工作者。

图像生成AI工具AI反应堆AI工具箱AI绘画GOAI艺术字堆友相机AI图像热门
码上飞

码上飞

零代码AI应用开发平台

零代码AI应用开发平台,用户只需一句话简单描述需求,AI能自动生成小程序、APP或H5网页应用,无需编写代码。

Vora

Vora

免费创建高清无水印Sora视频

Vora是一个免费创建高清无水印Sora视频的AI工具

下拉加载更多