ai-video-search-engine

ai-video-search-engine

智能视频内容检索与分析系统

AI Video Search Engine项目是一种创新型视频搜索引擎,采用先进AI技术实现视频内容的深度索引和智能检索。该系统能够精确定位视频中的特定信息,提供上下文相关的搜索结果,并具备视频摘要生成和智能对话功能。项目整合了Supabase、Hasura和JigsawStack等技术,为视频内容检索提供高效、精准的解决方案,适用于教育、研究和信息获取等领域。

AI视频搜索引擎视频内容索引视频转录向量搜索JigsawStackGithub开源项目

AI视频搜索引擎(AVSE)

由最新AI工具驱动的视频搜索引擎

为什么?

随着TikTok和YouTube等短视频内容的兴起,比以往任何时候都有更多的知识存在于视频中。对任何人来说,在数百万个视频中找到特定答案都是一项艰巨的任务。因此,问题是:既然有Google可以索引网站上的文本,使人们更容易根据问题的上下文找到答案,为什么没有一个Google可以索引视频内容,让用户更容易在其中找到答案呢?

所以我建立了这个项目,以展示利用现有的技术和基础设施完全可以实现这一点。

技术栈

  • Supbase(PostgreSQL、PG_Vector、Auth)
  • Hasura(GraphQL层、权限)
  • Fly(Hasura托管)
  • JigsawStack(摘要AI、聊天AI)
  • Vercel(NextJS托管、无服务器函数)

工作原理?

视频存储

搜索

  • 根据问题在数据库中进行向量余弦搜索,返回相关结果
  • 结果中的每个视频将执行第二次搜索,以找到与问题相关的视频片段
  • 这些片段将映射回带时间戳的转录,以播放视频的相关片段

摘要和聊天

  • 视频转录将发送到JigsawStack API,生成要点和文本形式的摘要
  • 聊天会话将由JigsawStack API创建和管理,根据问题将视频的相关片段发送到聊天会话

自行托管需注意的事项

  • 如果你计划索引数千到数百万个视频,你需要付费的Supabase和Fly.io账户
  • admin/config/fly.toml包含将Hasura部署到fly所需的配置
  • admin/migration是可用于通过Hasura CLI重新创建架构的迁移转储
  • hasura init migration --endpoint <hasuraurl.fly.app> --admin-secret <admin_secret>用于更新admin中的迁移文件夹
  • admin/indexChannelVideos.ts是在本地通过YouTube频道索引大量视频的脚本
  • .env.example包含运行项目所需的密钥

常见问题

YouTube不是已经做到这一点了吗?

  • 不完全是,YouTube并不搜索视频的转录音频,而是依赖上传者编写的内容,如标题、描述、标签。所有音频内容都未被索引。

这个技术栈如何处理数百万个视频?

  • 它可以处理数百万个视频,但在当前设置下可能无法处理数十亿/万亿个。这需要更多的副本、实例,尤其是更多的资金。

下一步计划?

编辑推荐精选

音述AI

音述AI

全球首个AI音乐社区

音述AI是全球首个AI音乐社区,致力让每个人都能用音乐表达自我。音述AI提供零门槛AI创作工具,独创GETI法则帮助用户精准定义音乐风格,AI润色功能支持自动优化作品质感。音述AI支持交流讨论、二次创作与价值变现。针对中文用户的语言习惯与文化背景进行专门优化,支持国风融合、C-pop等本土音乐标签,让技术更好地承载人文表达。

QoderWork

QoderWork

阿里Qoder团队推出的桌面端AI智能体

QoderWork 是阿里推出的本地优先桌面 AI 智能体,适配 macOS14+/Windows10+,以自然语言交互实现文件管理、数据分析、AI 视觉生成、浏览器自动化等办公任务,自主拆解执行复杂工作流,数据本地运行零上传,技能市场可无限扩展,是高效的 Agentic 生产力办公助手。

lynote.ai

lynote.ai

一站式搞定所有学习需求

不再被海量信息淹没,开始真正理解知识。Lynote 可摘要 YouTube 视频、PDF、文章等内容。即时创建笔记,检测 AI 内容并下载资料,将您的学习效率提升 10 倍。

AniShort

AniShort

为AI短剧协作而生

专为AI短剧协作而生的AniShort正式发布,深度重构AI短剧全流程生产模式,整合创意策划、制作执行、实时协作、在线审片、资产复用等全链路功能,独创无限画布、双轨并行工业化工作流与Ani智能体助手,集成多款主流AI大模型,破解素材零散、版本混乱、沟通低效等行业痛点,助力3人团队效率提升800%,打造标准化、可追溯的AI短剧量产体系,是AI短剧团队协同创作、提升制作效率的核心工具。

seedancetwo2.0

seedancetwo2.0

能听懂你表达的视频模型

Seedance two是基于seedance2.0的中国大模型,支持图像、视频、音频、文本四种模态输入,表达方式更丰富,生成也更可控。

nano-banana纳米香蕉中文站

nano-banana纳米香蕉中文站

国内直接访问,限时3折

输入简单文字,生成想要的图片,纳米香蕉中文站基于 Google 模型的 AI 图片生成网站,支持文字生图、图生图。官网价格限时3折活动

扣子-AI办公

扣子-AI办公

职场AI,就用扣子

AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!

堆友

堆友

多风格AI绘画神器

堆友平台由阿里巴巴设计团队创建,作为一款AI驱动的设计工具,专为设计师提供一站式增长服务。功能覆盖海量3D素材、AI绘画、实时渲染以及专业抠图,显著提升设计品质和效率。平台不仅提供工具,还是一个促进创意交流和个人发展的空间,界面友好,适合所有级别的设计师和创意工作者。

图像生成AI工具AI反应堆AI工具箱AI绘画GOAI艺术字堆友相机AI图像热门
码上飞

码上飞

零代码AI应用开发平台

零代码AI应用开发平台,用户只需一句话简单描述需求,AI能自动生成小程序、APP或H5网页应用,无需编写代码。

Vora

Vora

免费创建高清无水印Sora视频

Vora是一个免费创建高清无水印Sora视频的AI工具

下拉加载更多