machine-learning-for-the-web

machine-learning-for-the-web

交互式机器学习在Web应用中的实践教程

项目为Web开发者和创意工作者提供了机器学习在浏览器环境中的应用指南。内容覆盖预训练模型运行、自定义数据模型创建等全流程,聚焦机器学习在创意项目中的实际应用。涉及图像/声音分类、人脸/姿势识别、多媒体生成等主题,运用迁移学习、卷积神经网络等技术。通过实践,参与者可掌握常见机器学习模型的工作原理、训练方法及其在创意领域的应用潜力。

机器学习TensorFlow.jsml5.jsRunwayML神经网络Github开源项目

网络机器学习

这是纽约大学ITP"网络机器学习"课程的代码仓库

TensorFlow.jsTeachable Machineml5.jsRunwayML等工具为浏览器中的交互式机器学习项目创造了新的机会。本课程的目标是学习和理解常见的高级机器学习技术,并将其应用于在浏览器中生成创意输出。

本课程将从运行预训练模型开始,使用ml5.js和p5.js的高级API在浏览器中重新训练模型,并探索TensorFlow.js的层级API,使用自定义数据从头开始创建模型。本课程还将涵盖为训练模型准备数据集。课程将更多地关注ML模型的创意应用,而不是模型架构的数学和理论。

完成本课程后,学生将更好地理解常见和流行的机器学习模型,它们如何工作,如何训练这些模型,以及它们在创意项目中的应用。课程的成果将是交互式ML网络应用。

课程将涵盖的主题包括图像/声音/涂鸦分类、人脸/姿势/手势识别、图像、视频和文本生成。我们将使用和构建的技术和神经网络包括迁移学习、卷积神经网络、生成对抗网络和潜在扩散。

预期学生应该已经参加过ICM(计算媒体导论)课程,或具有同等的JavaScript(p5.js)、HTML、CSS编程经验。

信息

  • Yining Shi,周五,晚上6:00 - 8:30,370 Jay Street,409教室 地点:布鲁克林校区,面授,2023/1/26 - 2023/5/3
  • 办公时间

帮助

开始使用

要运行每个示例,请打开终端,输入以下命令:

$ git clone https://github.com/yining1023/machine-learning-for-the-web.git
$ cd machine-learning-for-the-web
$ python3 -m http.server

在浏览器中访问localhost:8000,你会看到类似这样的目录列表:

  • week1-intro/
  • week2-...
  • week3-...
  • week4-...
  • week5-...
  • week6-...

点击进入每周文件夹,你将看到每周的示例。

课程大纲

第1周 机器学习介绍,MobileNet

  • 笔记:机器学习介绍

  • 编码环节:

    • 安装ml5.js
    • 使用ml5.js运行图像分类示例
    • 在github上托管p5草图或使用p5网页编辑器
    • 如何更新作业wiki
  • 作业1

  • 作业2

第2周 图像分类(迁移学习,KNN分类器)

  • 笔记

  • 编码环节:

    • 制作KNN图像分类器或Teachable machine
  • 作业

第3周 姿势(PoseNet,BodyPix,U-Net)

  • 笔记

  • 编码环节:

    • PoseNet
    • PoseNet + KNN图像分类器
    • Body-pix
  • 作业

第4周 人脸和手势

第5周 声音分类器

  • 笔记

  • 编程课程:

    • 使用Teachable Machine的声音分类器
    • 使用Teachable Machine的姿势分类器
    • 使用Teachable Machine的图像分类器
    • 使用Arduino的分类器
  • 作业

第6周 图像生成

第7周 RunwayML

第8周 文本生成

  • 笔记

  • 编程课程:

    • ml5js Word2Vec
    • ml5js 情感分析
    • ml5js CharRNN
    • ChatGPT
    • GPT-4
  • 作业

第9周 使用ml5.js自制神经网络

  • 特邀演讲嘉宾!

  • 笔记

  • 编程课程:

    • 用ml5.js构建神经网络
  • 作业

第10周 自制CNN模型:涂鸦分类器

第11周 期末项目提案

第12周 期末项目开发

第13周 期末项目测试

第14周 期末项目展示

资源

设备

你需要一台现代笔记本电脑(4年内的型号为宜)。大多数所需软件都是免费提供的。

政策

评估

你必须参加所有的课堂会议,提交所有每周作业和一个期末项目。

评分(通过/不通过)将基于以下因素的组合:

  • 出勤率、课堂讨论参与度以及对其他学生项目的参与度(40%)
  • 作业(40%)
  • 期末项目(20%)

请参阅ITP关于通过/不通过的声明,其中指出"通过"相当于"A"或"B",而任何低于这个标准的都将被视为"不通过"。 出勤是必须的。如果您将缺席某堂课,请通过电子邮件通知您的老师。两次无故缺席将导致不及格。(迟到10分钟或以上相当于半次缺席。)

本课程将采取参与式教学,您需要参与课堂讨论,并在课堂上和课外项目中为其他学生提供反馈。这(连同出勤)占您总成绩的40%。

课程将以最终项目结束。您需要发挥自己的能力,创造出运用课程所学知识,对自己或世界有用的作品。这将占您总成绩的20%。

学术诚信声明

剽窃是将他人的作品呈现为自己的。具体来说,剽窃包括:未加引号引用他人的文字序列、对他人作品的段落进行改写、或使用他人创作的事实、想法或图像。

使用免费和开源代码示例

(以下内容改编自卡内基梅隆大学戈兰·莱文的交互性与计算课程(2018年秋季)。)

您必须引用所使用的任何代码的来源

除了教授在课程视频中特别提供的示例外。请注意以下额外的期望和指导原则:

检查许可证。

使用他人的代码时,请注意其发布的许可证,并确保满足这些许可证的条款和要求。常见许可证及其要求的描述可在choosealicense.com找到。某些许可证可能需要获得许可。如果您感到困惑或不确定如何引用代码,请询问课程讲师之一,并尽最大努力。不正确引用代码来源将导致作业得零分。

使用库。

强烈鼓励使用通用、可重复使用的库。开发和贡献这些组件给社区的人付出了努力,往往没有报酬;通过引用他们的名字并链接到他们的仓库来表示认可。

谨慎使用。

有时艺术家会将其作品的全部源代码放在网上,作为他人学习的资源。新媒体艺术课程中教授给出的作业通常相似(例如"时钟");您可能还会发现其他班级或学校的学生为类似作业发布的代码。您可能应该避免使用这些代码。至少,您应该谨慎考虑是否重复使用此类代码。如果必须这样做,最好提取解决特定技术问题的组件,而不是那些用于创造诗意体验的部分。当您使用他人的代码时,您的挑战是使其成为您自己的。显然,从某人的GitHub下载一件艺术作品并简单地改变颜色是极其懒惰的行为。而且如果不正确引用,这将构成彻底的剽窃。

原则声明

蒂施艺术学院教育经验的核心是学生创作原创学术和艺术作品,供教师进行批评性审查。因此,学生始终向教师准确表达自己当前的能力和知识,以便获得适当的建设性批评和建议,这一点至关重要。任何试图通过剽窃或作弊来逃避教师和学生之间这种基本的、透明的交流的行为,从教育角度来看都是自我挫败的,也是对蒂施艺术学院社区标准的严重违反。有关剽窃的所有细节,请参阅蒂施艺术学院政策和程序手册第10页,可在以下网址找到:http://students.tisch.nyu.edu/page/home.html

无障碍声明

请随时向您的讲师提出建议,说明如何使本课程对您更加无障碍。学术调整适用于有证明文件的残障学生。请联系Moses残障学生中心,电话212 998-4980,了解更多信息。

咨询和健康声明

您的健康和安全是纽约大学的优先事项。如果您在本课程期间遇到任何健康或心理健康问题,我们鼓励您使用全天候NYU健康交流服务,电话212-443-9999。此外,所有可能需要学术调整的学生,无论是身体还是心理上的合格残障,请在Moses中心注册,电话212-998-4980。如果您需要帮助联系这些资源,请告知您的讲师。

电子设备使用声明

笔记本电脑将是本课程的重要组成部分,可在课堂讨论和讲座时用于记笔记。在课堂讨论和学生演示期间,必须关闭笔记本电脑。除非与您自己作品的演示直接相关或作为课程的一部分被要求这样做,否则课堂上严禁使用手机。

编辑推荐精选

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

AI办公办公工具AI工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图热门
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

热门AI开发模型训练AI工具讯飞星火大模型智能问答内容创作多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

热门AI辅助写作AI工具讯飞绘文内容运营AI创作个性化文章多平台分发AI助手
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

openai-agents-python

openai-agents-python

OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。

openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。

Hunyuan3D-2

Hunyuan3D-2

高分辨率纹理 3D 资产生成

Hunyuan3D-2 是腾讯开发的用于 3D 资产生成的强大工具,支持从文本描述、单张图片或多视角图片生成 3D 模型,具备快速形状生成能力,可生成带纹理的高质量 3D 模型,适用于多个领域,为 3D 创作提供了高效解决方案。

3FS

3FS

一个具备存储、管理和客户端操作等多种功能的分布式文件系统相关项目。

3FS 是一个功能强大的分布式文件系统项目,涵盖了存储引擎、元数据管理、客户端工具等多个模块。它支持多种文件操作,如创建文件和目录、设置布局等,同时具备高效的事件循环、节点选择和协程池管理等特性。适用于需要大规模数据存储和管理的场景,能够提高系统的性能和可靠性,是分布式存储领域的优质解决方案。

下拉加载更多