Crawler

Crawler

开源多平台社交媒体数据采集项目

这是一个开源项目,专注于抖音、快手、哔哩哔哩等主流社交媒体平台的数据采集。项目提供API接口,支持关键词搜索、内容详情获取、评论采集和媒体资源下载。该项目旨在帮助开发者了解平台特性,强调合法合规使用,仅供学习和研究。

爬虫服务主流媒体平台数据采集API接口免责声明Github开源项目

服务 - 主流媒体平台爬虫

抖音、快手、哔哩哔哩、小红书、淘宝、京东、微博平台爬虫服务器项目。它可以获取这些平台上的公开信息,但请遵守下方的免责声明。

免责声明

本项目的初衷是为了帮助开发者更好地了解和掌握这些平台,也希望能帮助企业和安全工程师了解爬虫手段,提高平台的反爬虫措施,而不是用于非法用途,反对用于任何违反相关法律法规的行为。

仅供学习和研究使用,不得用于任何商业用途或非法目的。使用本项目提供的功能时,用户需自行承担可能带来的一切法律责任。

我们提供的爬虫仅能获取抖音,快手、哔哩哔哩、小红书、淘宝、京东、微博平台上公开的信息,我们强烈反对任何形式的隐私侵犯行为。如果你使用本项目进行了侵犯他人隐私的行为,我们将与你保持距离,并支持受害者通过法律手段维护自己的权益。

使用本仓库的内容即表示您同意本免责声明的所有条款和条件。如果你不接受以上的免责声明,请立即停止使用本项目。

如有侵犯到您的知识产权、侵犯到您的个人隐私等,请立即联系我们, 我们将积极配合保护您的权益。

如有任何问题,可联系我的邮箱 lishilong0101@gmail.com

功能

平台关键词搜索帖子/视频详情一级评论二级评论视频/图片下载用户信息/作品
抖音
快手
哔哩哔哩
小红书
微博
淘宝
京东
  • 快手、抖音、哔哩哔哩、小红书、淘宝、京东、微博平台的爬虫接口
  • 获取公开的用户信息,帖子信息等
  • 使用简单,支持多种语言使用HTTP调用
  • 小红书无水印视频
  • 哔哩哔哩视频一键下载
  • 微博媒体资源预览接口

快速开始

如果使用Windows操作系统,请跳转到Windows查看启动方式。

使用Makefile

  1. 准备好python

  2. 准备好js运行环境

    curl -fsSL https://deb.nodesource.com/setup_20.x | sudo bash - sudo apt-get install -y nodejs
  3. 执行下列命令

    cd Crawler make run

    可选,通过port参数指定端口(默认8080)。

  4. 查看日志

    日志默认存放在.log/目录下,crawler.log为爬虫日志。

  5. 本地测试

    test/cookie.py中添加自己的cookie,然后运行make test module=douyin进行单元测试,不加module参数则运行所有测试用例。

使用docker

  1. 一键启动

    sudo docker run -d --name crawler -p 8080:8080 shilongli0101/crawler:latest

    或(国内阿里云镜像源)

    sudo docker run -d --name crawler -p 8080:8080 registry.cn-hangzhou.aliyuncs.com/shilongli0101/crawler:latest # 国内镜像源
  2. 查看日志

    sudo docker logs crawler

首次使用需添加账号,例如:调用http://localhost:8080/{platfrom}/add_account添加账号,platfrom取douyinkuaishoubilibilixhstaobaojdweibo,接口详情请参考API 文档

然后在你的代码中调用API,获取公开的信息。

文档

快速上手:快速上手

API文档:API 文档

即将支持

  • Bilibili
  • 小红书
  • 微博
  • 抖音全面更新a_bogus
  • 更新异步框架,多请求并行提高响应速度
  • 淘宝详情、评论、用户信息功能
  • 京东详情、评论、用户信息功能

star 趋势图

  • 如果该项目对你有帮助,star一下 ❤️❤️❤️

Star History Chart

贡献

如果你有任何想法或者建议,欢迎提交issue或者pull request。

许可

本项目遵循非商业使用许可,详情请见LICENSE文件。


注意: 本项目不承担用户因违反这些使用条件而产生的任何直接或间接的损失或责任。

编辑推荐精选

音述AI

音述AI

全球首个AI音乐社区

音述AI是全球首个AI音乐社区,致力让每个人都能用音乐表达自我。音述AI提供零门槛AI创作工具,独创GETI法则帮助用户精准定义音乐风格,AI润色功能支持自动优化作品质感。音述AI支持交流讨论、二次创作与价值变现。针对中文用户的语言习惯与文化背景进行专门优化,支持国风融合、C-pop等本土音乐标签,让技术更好地承载人文表达。

QoderWork

QoderWork

阿里Qoder团队推出的桌面端AI智能体

QoderWork 是阿里推出的本地优先桌面 AI 智能体,适配 macOS14+/Windows10+,以自然语言交互实现文件管理、数据分析、AI 视觉生成、浏览器自动化等办公任务,自主拆解执行复杂工作流,数据本地运行零上传,技能市场可无限扩展,是高效的 Agentic 生产力办公助手。

lynote.ai

lynote.ai

一站式搞定所有学习需求

不再被海量信息淹没,开始真正理解知识。Lynote 可摘要 YouTube 视频、PDF、文章等内容。即时创建笔记,检测 AI 内容并下载资料,将您的学习效率提升 10 倍。

AniShort

AniShort

为AI短剧协作而生

专为AI短剧协作而生的AniShort正式发布,深度重构AI短剧全流程生产模式,整合创意策划、制作执行、实时协作、在线审片、资产复用等全链路功能,独创无限画布、双轨并行工业化工作流与Ani智能体助手,集成多款主流AI大模型,破解素材零散、版本混乱、沟通低效等行业痛点,助力3人团队效率提升800%,打造标准化、可追溯的AI短剧量产体系,是AI短剧团队协同创作、提升制作效率的核心工具。

seedancetwo2.0

seedancetwo2.0

能听懂你表达的视频模型

Seedance two是基于seedance2.0的中国大模型,支持图像、视频、音频、文本四种模态输入,表达方式更丰富,生成也更可控。

nano-banana纳米香蕉中文站

nano-banana纳米香蕉中文站

国内直接访问,限时3折

输入简单文字,生成想要的图片,纳米香蕉中文站基于 Google 模型的 AI 图片生成网站,支持文字生图、图生图。官网价格限时3折活动

扣子-AI办公

扣子-AI办公

职场AI,就用扣子

AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!

堆友

堆友

多风格AI绘画神器

堆友平台由阿里巴巴设计团队创建,作为一款AI驱动的设计工具,专为设计师提供一站式增长服务。功能覆盖海量3D素材、AI绘画、实时渲染以及专业抠图,显著提升设计品质和效率。平台不仅提供工具,还是一个促进创意交流和个人发展的空间,界面友好,适合所有级别的设计师和创意工作者。

图像生成AI工具AI反应堆AI工具箱AI绘画GOAI艺术字堆友相机AI图像热门
码上飞

码上飞

零代码AI应用开发平台

零代码AI应用开发平台,用户只需一句话简单描述需求,AI能自动生成小程序、APP或H5网页应用,无需编写代码。

Vora

Vora

免费创建高清无水印Sora视频

Vora是一个免费创建高清无水印Sora视频的AI工具

下拉加载更多