WebcamGPT-Vision

WebcamGPT-Vision 项目介绍

WebcamGPT-Vision 是一个轻量级的网页应用，用户可以使用 OpenAI 的 GPT-4 Vision API 处理来自摄像头的图像。该应用可以捕捉用户摄像头中的画面，将其发送到 GPT-4 Vision API，然后展示由人工智能生成的图像描述。

项目版本

WebcamGPT-Vision 项目有三个版本：PHP、Node.js 和 Python/Flask。

功能特点

摄像头集成：支持通过摄像头实时捕捉图像。
图像处理：利用 OpenAI GPT-4 Vision API 进行图像分析。
结果显示：展示AI生成的图像描述。
用户界面简洁直观：设计友好，使用简单。

使用前提

在开始使用之前，请确保满足以下要求：

使用的是现代网页浏览器。
如果使用 PHP 版本：您的服务器支持 PHP 且启用了 cURL。
如果使用 Node.js 版本：已安装 Node.js 和 npm。
如果使用 Python/Flask 版本：已安装 Python 和 Flask。
拿到了 OpenAI 的 GPT-4 Vision API 的 API 密钥。

安装指南

根据您使用的版本，按照以下步骤安装 WebcamGPT-Vision（以下步骤面向所有版本）：

PHP 版本

克隆项目代码到本地机器或服务器：

git clone https://github.com/bdekraker/webcamgpt-vision.git

进入 php-version 目录。
在 process_image.php 文件中替换 YOUR_DEFAULT_API_KEY 为您实际的 OpenAI API 密钥。
将代码上传到支持 PHP 的服务器。
打开 index.html 即可开始使用。

Node.js 版本

克隆项目代码：

git clone https://github.com/bdekraker/webcamgpt-vision.git

进入 js-version 目录。
运行 npm install 安装依赖包。
在 js-version 目录下创建 .env 文件，并添加 OpenAI API 密钥：
```
OPENAI_API_KEY=YOUR_DEFAULT_API_KEY
```
使用 node server.js 启动服务器。
在浏览器中访问 http://localhost:3000（或您设置的其他端口）。

Python/Flask 版本

克隆项目代码：

git clone https://github.com/bdekraker/webcamgpt-vision.git

进入 python-version 目录。
运行 pip install -r requirements.txt 安装依赖包。

将您的 OpenAI API 密钥设为环境变量：

export YOUR_DEFAULT_API_KEY='your_actual_api_key_here'

使用 python process_image.py 启动 Flask 服务器。
在浏览器中访问 http://localhost:5000。

使用方法

对于所有版本，使用步骤如下：

确保连接了能够正常工作且被浏览器允许使用的摄像头。
在浏览器中打开 index.html 页面。
点击 "Capture" 按钮，从摄像头拍摄快照。
应用将处理图像并在摄像头视图下方显示描述。

贡献

欢迎对 WebcamGPT-Vision 项目的贡献。请遵循以下指南：

叉当前仓库，并为您的功能或修复创建新分支。
撰写清晰简洁的提交信息。
确保您的代码符合现有风格。
提交一个详细描述您所做更改的拉取请求。

支持

如果您有任何问题或反馈，请在仓库中提交问题，维护人员将尽快回复。

许可证

该项目使用 MIT 许可证 - 详情见 LICENSE.md 文件。

致谢

感谢 OpenAI 提供 GPT-4 Vision API。
本项目灵感来源于 AI 在图像处理和理解方面的能力。

联系方式

如需联系本项目的维护者，请联系 Benjamin De Kraker。

免责声明

此应用不隶属于 OpenAI，使用 GPT-4 Vision API 需遵循 OpenAI 的条款与条件。请确保遵循 OpenAI 的使用指南，并获得适当的权限使用 API。