只选最新/最好的AI信息

工具
Qwen2.5-VL
Qwen2.5-VL

Qwen2.5-VL - 一款强大的视觉语言模型,支持图像和视频输入

Qwen2.5-VL 是一款强大的视觉语言模型,支持图像和视频输入,可用于多种场景,如商品特点总结、图像文字识别等。项目提供了 OpenAI API 服务、Web UI 示例等部署方式,还包含了视觉处理工具,有助于开发者快速集成和使用,提升工作效率。

19 小时
工具
HunyuanVideo
HunyuanVideo

HunyuanVideo - HunyuanVideo 是一个可基于文本生成高质量图像和视频的项目。

HunyuanVideo 是一个专注于文本到图像及视频生成的项目。它具备强大的视频生成能力,支持多种分辨率和视频长度选择,能根据用户输入的文本生成逼真的图像和视频。使用先进的技术架构和算法,可灵活调整生成参数,满足不同场景的需求,是文本生成图像视频领域的优质工具。

19 小时
工具
WebUI for Browser Use
WebUI for Browser Use

WebUI for Browser Use - 一个基于 Gradio 构建的 WebUI,支持与浏览器智能体进行便捷交互。

WebUI for Browser Use 是一个强大的项目,它集成了多种大型语言模型,支持自定义浏览器使用,具备持久化浏览器会话等功能。用户可以通过简洁友好的界面轻松控制浏览器智能体完成各类任务,无论是数据提取、网页导航还是表单填写等操作都能高效实现,有利于提高工作效率和获取信息的便捷性。该项目适合开发者、研究人员以及需要自动化浏览器操作的人群使用,在 SEO 优化方面,其关键词涵盖浏览器使用、WebUI、大型语言模型集成等,有助于提高网页在搜索引擎中的曝光度。

19 小时
工具
xiaozhi-esp32
xiaozhi-esp32

xiaozhi-esp32 - 基于 ESP32 的小智 AI 开发项目,支持多种网络连接与协议,实现语音交互等功能。

xiaozhi-esp32 是一个极具创新性的基于 ESP32 的开发项目,专注于人工智能语音交互领域。项目涵盖了丰富的功能,如网络连接、OTA 升级、设备激活等,同时支持多种语言。无论是开发爱好者还是专业开发者,都能借助该项目快速搭建起高效的 AI 语音交互系统,为智能设备开发提供强大助力。

19 小时
工具
olmocr
olmocr

olmocr - 一个用于 OCR 的项目,支持多种模型和服务器进行 PDF 到 Markdown 的转换,并提供测试和报告功能。

olmocr 是一个专注于光学字符识别(OCR)的 Python 项目,由 Allen Institute for Artificial Intelligence 开发。它支持多种模型和服务器,如 vllm、sglang、OpenAI 等,可将 PDF 文件的页面转换为 Markdown 格式。项目还提供了测试框架和 HTML 报告生成功能,方便用户对 OCR 结果进行评估和分析。适用于科研、文档处理等领域,有助于提高工作效率和准确性。

3 天
文章
腾讯HunYuan-3D 1.0,支持文本到3D和图像到3D,10秒即可生成高分辨率细3D模型。

腾讯HunYuan-3D 1.0,支持文本到3D和图像到3D,10秒即可生成高分辨率细3D模型。

HunYuan-3D支持文本到3D和图像到3D功能,包括网格和纹理提取在内,整个过程在 10 秒内完成。

3 天AIGC Studio
文章
阿里开源多语言大模型,支持全球90%人口

阿里开源多语言大模型,支持全球90%人口

3 天AIGC开放社区
文章
奥特曼豪言:OpenAI第一个发布AGI!下一代人不可能比AI聪明,却没人在意

奥特曼豪言:OpenAI第一个发布AGI!下一代人不可能比AI聪明,却没人在意

4 天新智元
文章
DeepSeek R2 在ARC-AGI 中得分90%!?

DeepSeek R2 在ARC-AGI 中得分90%!?

虽为谣言,但仍期待!

4 天AGI Hunt
文章
哈佛斯坦福顶尖中国毕业生回流,向DeepSeek疯投简历!

哈佛斯坦福顶尖中国毕业生回流,向DeepSeek疯投简历!

美国人才开始逆向归国

5 天Datawhale
文章
实测首个烹饪大模型「食神」:DeepSeek进厨房,看脸生成养生食谱,普通人也能做大餐

实测首个烹饪大模型「食神」:DeepSeek进厨房,看脸生成养生食谱,普通人也能做大餐

APP操控厨电设备,无缝菜谱制作

5 天量子位
工具
飞书多维表格
飞书多维表格

飞书多维表格 - 飞书多维表格 ×DeepSeek R1 满血版

飞书多维表格联合 DeepSeek R1 模型,提供 AI 自动化解决方案,支持批量写作、数据分析、跨模态处理等功能,适用于电商、短视频、影视创作等场景,提升企业生产力与创作效率。关键词:飞书多维表格、DeepSeek R1、AI 自动化、批量处理、企业协同工具。

5 天
文章
AI 把表情包都玩明白了,人类连玩梗的快乐也保不住了?

AI 把表情包都玩明白了,人类连玩梗的快乐也保不住了?

AI 搞抽象?搞得明白吗?

5 天APPSO
文章
3天内猛涨2.6k+ Star!LangManus:用自然语言操控全网数据,复杂任务一键执行

3天内猛涨2.6k+ Star!LangManus:用自然语言操控全网数据,复杂任务一键执行

自动化任务处理的“智能钥匙”。

5 天开源星探
文章
重磅!腾讯推出T1 模型,超越DeepSeek R1,棒打GPT-4.5!

重磅!腾讯推出T1 模型,超越DeepSeek R1,棒打GPT-4.5!

刚刚,腾讯宣布推出混元T1 模型!

5 天AGI Hunt
向下滚动加载更多