斯坦福大学自然语言理解课程代码库与学习资源
CS224u项目包含斯坦福大学自然语言理解课程的代码库和学习资源。提供作业、教程、PyTorch模型实现和实验方法介绍等内容,涉及向量空间模型、情感分析和模型可解释性等自然语言处理领域。项目采用开源许可发布,为自然语言处理学习者提供全面的学习材料。
斯坦福大学课程的代码。
2023年春季
setup.ipynb
关于如何设置以使用此代码的详细信息。
hw_*.ipynb
当前课程运行的一系列作业。
tutorial_*
笔记本Jupyter笔记本、使用NumPy及其相关工具进行科学计算以及PyTorch的入门介绍。
torch_*.py
模块一个通用优化类(torch_model_base.py
)以及GloVe、自动编码器、浅层神经分类器、RNN分类器、树结构网络和基于语境的自然语言生成的子类。
tutorial_pytorch_models.ipynb
展示了如何使用这些模块作为创建原创系统的通用框架。
evaluation_*.ipynb
和 projects.md
涵盖关键实验方法和实际考虑因素的笔记本,以及关于在该领域撰写和展示工作的提示。
iit*
和 feature_attribution.ipynb
我们可解释性和模型分析单元的一部分。
np_*.py
模块现在被视为课程的背景材料。
torch_*.py
模型的参考实现,旨在更多地揭示优化过程的工作原理。
vsm_*
现在被视为课程的背景材料。
关于意义的向量空间模型的单元,涵盖传统方法如PMI和LSA以及较新的方法如自动编码器和GloVe。vsm.py
提供了许多核心功能,而torch_glove.py
和torch_autoencoder.py
是我们涵盖的学习模型。vsm_03_contextualreps.ipynb
探索了从上下文模型中派生静态表示的方法。
sst_*
现在被视为课程的背景材料。
使用英语斯坦福情感树库进行情感分析的单元。核心代码是sst.py
,其中包括一个灵活的实验框架。所有PyTorch分类器都得到了使用:torch_shallow_neural_network.py
、torch_rnn_classifier.py
和torch_tree_nn.py
。
finetuning.ipynb
现在被视为课程的背景材料。
使用来自Hugging Face的预训练参数进行特征化和微调。
utils.py
整个代码中使用的各种核心函数。
test/
要运行这些测试,请使用
py.test -vv test/*
或者,仅运行test_shallow_neural_classifiers.py
中的测试,
py.test -vv test/test_shallow_neural_classifiers.py
如果上述命令不起作用,请尝试
python3 -m pytest -vv test/test_shallow_neural_classifiers.py
本仓库中的材料根据Apache 2.0许可证和知识共享署名-相同方式共享4.0国际许可证授权。
字节跳动发布的AI编程神器IDE
Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。
全能AI智能助手,随时解答生活与工作的多样问题
问小白,由元石科技研发的AI智能助手,快速准确地解答各种生活和工作问题,包括但不限于搜索、规划和社交互动,帮助用户在日常生活中提高效率,轻松管理个人事务。
实时语音翻译/同声传译工具
Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。