reserves-lib-tsinghua-downloader

reserves-lib-tsinghua-downloader

清华教参服务平台电子书籍自动下载工具

reserves-lib-tsinghua-downloader是一个为清华大学教参服务平台开发的开源工具。它可以自动下载电子书籍原图并生成PDF,无需登录。支持多平台使用,具有批量下载和PDF生成功能,便于获取教材资源。该项目持续更新,欢迎社区贡献。

清华教参服务平台PDF下载图书章节Python脚本GitHub项目Github开源项目

写在前面:正在寻找维护者。如果您有兴趣,请联系 libthu (a) yandex.com!

清华教参服务平台辅助工具

GitHub 最新发布版本 Python 版本 GitHub 工作流状态 GitHub 问题

http://reserves.lib.tsinghua.edu.cn/ 下载页面

下载书籍每一页的原图,生成PDF,无需登录。

下载

发布页面的"Assets"中,下载对应系统的可执行文件。或运行Python脚本 downloader.py

使用方法

网站截图

运行 downloader,输入网站"阅读全文"下方的链接地址(如图中标黄的位置)。程序会自动爬取当前章节及以下的所有章节。

程序会将图片保存在 clawed 文件夹下,并自动生成PDF。

程序界面截图

macOS

macOS用户可能无法直接运行下载的 downloader,可能有两种原因:

  • 因为它没有"执行权限"。

    解决方法:在终端中进入 downloader 文件所在的文件夹,执行 chmod +x downloader 命令。有关此命令的更多帮助请参阅 Apple支持

  • 因为它不是从App Store下载的。

    解决方法:点击"安全性与隐私" -> "通用" -> "仍要打开"按钮来允许被阻止的App。此按钮在您尝试打开该App后一小时内可用。更多帮助请参阅 Apple支持

常见问题

**问:**图片压缩的 quality 选项应该怎样设置?

答:范围 [1, 96]:其中96为不压缩(默认),[1, 95]从最差到最佳。更多信息请参见PIL文档

**问:**运行时报错 'type' object is not subscriptable,怎么办?

答:请升级Python版本至3.9+,或直接运行分发的可执行文件。

**问:**运行时报错 Cookie Required,怎么办?

答:经测试,绝大部分教参无需cookie即可访问。少数教参需要cookie进行身份验证,请将网站cookie中 .ASPXAUTHASP.NET_SessionId 的值依次写入同目录下 cookie.txt,每行一个。获取cookie的方法请见 #5

**问:**下载的章节不全?

答:这是因为此图书的章节编号不连续。请再次运行程序并输入下一位置的章节链接。通常不会出现此情况。

**问:**下载突然失败了?

答:目前学校对教参平台的访问添加了速率限制,短时间内多次爬取会暂时封禁IP,请过一段时间重试。设置相邻请求的间隔时间可以使用 -i seconds 来设置。

**问:**分享一些高级玩法?

  • 使用学校提供的正版福昕编辑器可以对PDF进行OCR。
  • Z-Library无法正常访问,使用谷歌搜索 zlib searcher 有惊喜。
  • 从GitHub Actions中可以下载预览版的可执行文件。

高级设置

在终端中运行 downloader --help

用法: downloader.py [-h] [-v] [-u URL] [-c C] [-i I] [-q Q] [-r] [-e] [--no-pdf] [--no-img]

查看README.md获取帮助。仓库: https://github.com/libthu/reserves-lib-tsinghua-downloader

可选参数:
  -h, --help            显示此帮助信息并退出
  -v, --version         显示程序版本号并退出
  -u URL, --url URL     输入URL
  -c C, --concurrent C  并发下载数量(默认为4)
  -i I, --interval I    批次之间的时间间隔,以秒为单位(默认为0.5)
  -q Q, --quality Q     图像质量,从0(最差)到95(最佳)。96保持图像不变。
  -r, --resume          跳过下载图像
  -e, --exit            完成后自动退出
  --no-pdf              不生成PDF
  --no-img              不保存图像

待办事项

  • 翻译
  • 从网站获取纯文本
  • PDF书签

贡献

请查看contribution.md

欢迎Star/Issue/PR~


使用风险自负。

友情链接:更多清华常用信息/服务汇总请看这里

编辑推荐精选

GPT Plus|Pro充值

GPT Plus|Pro充值

GPT充值

支持 ChatGPT Plus / Pro 充值服务,支付便捷,自动发货,售后可查。

GPT Image 2中文站

GPT Image 2中文站

AI 图片生成平台

GPT Image 2 是面向用户的 AI 图片生成平台,支持文生图、图生图及多模型创意工作流。

Vecbase

Vecbase

你的AI Agent团队

Vecbase 是专为 AI 团队打造的智能工作空间,将数据管理、模型协作与知识沉淀整合于一处。算法、产品与业务在同一平台无缝协同,让从数据到 AI 应用的落地更快一步。

音述AI

音述AI

全球首个AI音乐社区

音述AI是全球首个AI音乐社区,致力让每个人都能用音乐表达自我。音述AI提供零门槛AI创作工具,独创GETI法则帮助用户精准定义音乐风格,AI润色功能支持自动优化作品质感。音述AI支持交流讨论、二次创作与价值变现。针对中文用户的语言习惯与文化背景进行专门优化,支持国风融合、C-pop等本土音乐标签,让技术更好地承载人文表达。

QoderWork

QoderWork

阿里Qoder团队推出的桌面端AI智能体

QoderWork 是阿里推出的本地优先桌面 AI 智能体,适配 macOS14+/Windows10+,以自然语言交互实现文件管理、数据分析、AI 视觉生成、浏览器自动化等办公任务,自主拆解执行复杂工作流,数据本地运行零上传,技能市场可无限扩展,是高效的 Agentic 生产力办公助手。

lynote.ai

lynote.ai

一站式搞定所有学习需求

不再被海量信息淹没,开始真正理解知识。Lynote 可摘要 YouTube 视频、PDF、文章等内容。即时创建笔记,检测 AI 内容并下载资料,将您的学习效率提升 10 倍。

AniShort

AniShort

为AI短剧协作而生

专为AI短剧协作而生的AniShort正式发布,深度重构AI短剧全流程生产模式,整合创意策划、制作执行、实时协作、在线审片、资产复用等全链路功能,独创无限画布、双轨并行工业化工作流与Ani智能体助手,集成多款主流AI大模型,破解素材零散、版本混乱、沟通低效等行业痛点,助力3人团队效率提升800%,打造标准化、可追溯的AI短剧量产体系,是AI短剧团队协同创作、提升制作效率的核心工具。

seedancetwo2.0

seedancetwo2.0

能听懂你表达的视频模型

Seedance two是基于seedance2.0的中国大模型,支持图像、视频、音频、文本四种模态输入,表达方式更丰富,生成也更可控。

nano-banana纳米香蕉中文站

nano-banana纳米香蕉中文站

国内直接访问,限时3折

输入简单文字,生成想要的图片,纳米香蕉中文站基于 Google 模型的 AI 图片生成网站,支持文字生图、图生图。官网价格限时3折活动

扣子-AI办公

扣子-AI办公

职场AI,就用扣子

AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!

下拉加载更多