Gemini 2.5 Pro 上手指南:搜索、创作与数据分析实战
与 Gemini 2.5 Pro 共度的第一个小时
如果你有 60 分钟,想从零到跑通 Gemini 2.5 Pro 集成,这篇指南适合你。过去两个月我在工作坊和 Meetup 中带约 300 位开发者走完了这个过程,最有效的模式是:先跑通,再理解。
第一步:获取 API 密钥(5 分钟)
前往 Google AI Studio(aistudio.google.com)。用 Google 账号登录后,点击左侧栏"Get API Key",再点"Create API Key"。
几个容易踩的坑:免费层提供每分钟 60 次 Gemini 2.5 Pro 请求,开发阶段足够用。除非上生产或测试时触发限制,否则不需要绑定账单。但如果你在做正经项目,尽早关联账单——免费层有不太文档化的每日请求上限,在调试过程中撞上限很烦。
把 API 密钥存到环境变量里,不要写在代码中。这不是建议,是必须:
GEMINI_API_KEY=your_key_here
把 .env 加到 .gitignore。上个月我亲眼见过三个开发者把密钥推到了公开仓库。
第二步:第一次 API 调用(10 分钟)
安装 SDK:
npm install @google/genai
第一个脚本:
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });
const response = await ai.models.generateContent({
model: "gemini-2.5-pro",
contents: "用两段话解释 REST 和 GraphQL 的区别。",
});
console.log(response.text);
用 node --env-file=.env index.mjs 运行,大约 2-4 秒出结果。注意 token 用量元数据:输入 $1.25/百万 token,输出 $5/百万 token。一个典型查询约 150 输入 token + 200 输出 token,每次约 $0.001。
第三步:构建文档分析器(25 分钟)
做点真正有用的。创建一个工具:接收 PDF,提取内容,生成结构化摘要。
import { GoogleGenAI } from "@google/genai";
import { fromPath } from "pdf2pic";
import fs from "fs";
const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });
async function analyzeDocument(pdfPath) {
const converter = fromPath(pdfPath, {
density: 150,
saveFilename: "page",
format: "png",
});
const images = [];
for (let i = 1; i <= 5; i++) {
const result = await converter(i);
const imageData = fs.readFileSync(result.path, { encoding: "base64" });
images.push({
inlineData: { mimeType: "image/png", data: imageData },
});
}
const response = await ai.models.generateContent({
model: "gemini-2.5-pro",
contents: [
...images,
{ text: "分析这个文档。返回 JSON:title, summary, keyPoints (数组), documentType。" },
],
config: { responseMimeType: "application/json" },
});
return JSON.parse(response.text);
}
关键点:用 responseMimeType: "application/json" 强制结构化输出,这是 Gemini 特有的功能,保证返回合法 JSON。不用的话,大约 80% 的情况会返回被 markdown 包裹的 JSON。
第四步:添加搜索增强(10 分钟)
Gemini 2.5 Pro 的亮点之一是 Google Search grounding——用实时搜索结果增强回复。
const response = await ai.models.generateContent({
model: "gemini-2.5-pro",
contents: "React 19 最新特性有哪些?",
config: { tools: [{ googleSearch: {} }] },
});
注意:搜索增强会增加 1-3 秒延迟,且并非所有地区都可用。在我们的测试中,约 8 个国家不支持。对国际化应用,建议用 VPN 测试目标国家。
第五步:错误处理与速率限制(10 分钟)
API 会失败。提前准备。用指数退避处理 429 限流,用线性退避处理 500/503 服务错误。SDK 不自带重试逻辑,需要自己实现。
接下来可以做什么
三个项目想法:会议纪要摘要器、截图转代码工具、内容质量分析器。每个都练习 API 的不同部分——多模态输入、结构化输出、搜索增强,或三者组合。Gemini 2.5 Pro API 在 2026 年 3 月已经足够稳定用于生产环境,价格也很有竞争力。不要过度思考,直接开始构建。