众所周知,在几个月前,Gemini 2.5 Pro 的 API 是可以免费调用的。但是近来 Google 关闭了这一优惠活动,为了白嫖,就得想想别的路子。
Gemini 网页 / AI Studio 目前仍旧可以免费使用 2.5 Pro 模型,将网页端的 Gemini 2.5 Pro 模型提取出来,转换为 API 供我们的各种 AI 应用调用,就是一个很可行的思路。
经过简单的调研,有两个方案:
- AIstudioProxyAPI 珠玉在前,逆向了 AI Studio 的接口,实现了 OpenAI 兼容的 API Server
- HanaokaYuzu/Gemini-API 走了另一个路径,逆向了从 Gemini 网页端调用模型的接口,然后封装成了 SDK。
这两个工具的区别在于,前者调用的是 AI Studio 的接口、后者调用的是 Gemini 网页端的接口。本帖就讲讲后者开通的新路径。
HanaokaYuzu/Gemini-API 这个 SDK 仅提供了一个 Python 包,无法直接调用,所以必须自己编程实现 OpenAI 的接口,才能在各类应用中使用。
https://github.com/Nativu5/Gemini-FastAPI
Gemini-FastAPI 项目对 HanaokaYuzu/Gemini-API 的 SDK 进行了封装,实现了一个 FastAPI Server,可以方便地对接各类 AI 应用,获得和 Google 官方 API 相仿的效果。并且该项目支持容器化一键部署、自动更新 Cookies 等功能,相当易用。
功能特性
- 无需 Google API Key:提供网页 Cookie 即可免费通过 API 调用 Gemini,并支持多账号 Cookies 负载均衡。
- 内置 Google Apps:API 已内置 Gemini 网页端的 Google Apps(包含 Gmail/Gmap/Youtube/网页搜索等插件),模型响应更加准确。
- 会话持久化:基于 LMDB 存储,支持多轮对话历史记录。
- 多模态支持:可处理文本、图片及文件上传。
获取 Cookies
使用 Gemini-FastAPI 需获取 Gemini 网页端的 Cookie。我们可以用隐私窗口+开发者工具的方式获取 Cookies,这样就不会影响到我们平时使用网页端(不会顶号),并且可以自动刷新。步骤如下:
- 在无痕/隐私窗口打开 Gemini 并登录
- 打开开发者工具(F12)
- 进入 Application → Storage → Cookies
查找并复制以下值:
- __Secure-1PSID
- __Secure-1PSIDTS
这两个值复制出来之后,要立刻关闭浏览器窗口。因为网页可能自动轮换 Cookies,复制下来的就失效了。
快速部署
docker run -p 8000:8000 \
-v $(pwd)/config:/app/config \
-v $(pwd)/data:/app/data \
-v $(pwd)/cache:/app/.venv/lib/python3.12/site-packages/gemini_webapi/utils/temp \
-e CONFIG_SERVER__API_KEY="your-api-key-here" \
-e CONFIG_GEMINI__CLIENTS__0__ID="client-id-0" \
-e CONFIG_GEMINI__CLIENTS__0__SECURE_1PSID="your-secure-1psid" \
-e CONFIG_GEMINI__CLIENTS__0__SECURE_1PSIDTS="your-secure-1psidts" \
ghcr.io/nativu5/gemini-fastapi
如上,在命令中替换刚刚获取的 Cookies,然后设置一个 API Key,就可以快速拉起 FastAPI 服务。
详细的部署教程可以参考: https://github.com/Nativu5/Gemini-FastAPI/blob/main/README.zh.md
效果测试
以 Open WebUI 为例,添加我们刚刚创建的 API Server,Open Web UI 会自动识别出可以调用的模型。
由于我们是通过逆向工程获取的网页端 Gemini 的接口,所以我们所有的对话,都可在 Gemini 中同步看到:
总结
简单测试下来,Gemini-FastAPI 转发的网页端 API,功能基本够用,同样具备一定的多模态能力,可以上传图像、文件进行分析。
同时,得益于网页端的搜索功能和 Google Apps 集成,该 API 中的模型可以自己搜索网页、查 Google Maps、上油管搜视频,省去自己配置 travily 等搜索能力的麻烦。
但是,网页端 API 毕竟是逆向工程所得,使用上存在一些限制。因为 Gemini 网页端毕竟是面向大众的产品(不像 AI Studio),没有这些功能,也就不存在接口,比如 Token 计量、Top P 参数调整就无法支持了。
与坛友的 AIstudioProxyAPI 相比,比较特色的功能在于集成 Google Apps、持久化对话历史。另外后续可能添加对 Gems/ Deep Research 的支持。但如果你需要特别精细的控制,这个网页端 API 还是不够合适。
推荐部署尝试一下,轻量场景下做官方 API 分流/免费替代还是合适的(毕竟白嫖)。