费用与省钱攻略
费用与省钱攻略
使用 Claude Code 进行开发是一项投资。理解它的计费逻辑, 掌握省钱技巧, 能让你在不影响效率的前提下大幅降低开支。本文将从计费模式讲起, 逐步展开 7 个实战省钱策略。
一、Claude Code 的计费模式
1.1 两种使用方式
Claude Code 目前有两种主要的使用途径:
方式一: API 按量付费
通过 Anthropic API 调用 Claude 模型。你需要:
- 注册 Anthropic 账号并获取 API Key
- 在 Claude Code CLI 中配置 API Key
- 每次对话按 Token 数量计费
计费公式:
费用 = 输入 Token 数 x 输入单价 + 输出 Token 数 x 输出单价
以 Claude Sonnet 为例:
| 项目 | 单价 |
|---|---|
| 输入 Token | $3 / 百万 Token |
| 输出 Token | $15 / 百万 Token |
以 Claude Opus 为例:
| 项目 | 单价 |
|---|---|
| 输入 Token | $15 / 百万 Token |
| 输出 Token | $75 / 百万 Token |
方式二: Max 订阅计划
Anthropic 提供 Max 订阅, 包含 Claude Code 使用额度:
| 计划 | 月费 | 说明 |
|---|---|---|
| Pro | $20/月 | 包含一定量的 Claude Code 使用 |
| Max 5x | $100/月 | Pro 的 5 倍用量 |
| Max 20x | $200/月 | Pro 的 20 倍用量 |
1.2 Token 是什么
Token 是模型处理文本的最小单位。粗略估算:
- 英文: 1 个单词约 1-2 个 Token
- 中文: 1 个汉字约 1.5-2 个 Token
- 代码: 因语言而异, 通常 1 行代码约 5-15 个 Token
一次典型的 Claude Code 对话可能消耗:
| 场景 | 输入 Token | 输出 Token | 估算费用 (Sonnet) |
|---|---|---|---|
| 简单问答 | 1,000 | 500 | $0.01 |
| 读取文件并修改 | 10,000 | 2,000 | $0.06 |
| 大型重构 | 50,000 | 10,000 | $0.30 |
| 全项目分析 | 200,000 | 20,000 | $0.90 |
1.3 隐藏的费用大户: 上下文
Claude Code 每次交互会自动携带上下文信息, 包括:
- 当前对话历史
- 读取过的文件内容
- 项目结构信息
- CLAUDE.md 的内容
这意味着对话越长, 每次请求的输入 Token 越多, 费用增长是累积的。一个持续 30 轮的对话, 后期每轮的输入 Token 可能是前期的 10 倍以上。
二、API vs 订阅: 怎么选
2.1 适合 API 的场景
- 使用频率不固定, 有时候一周不用
- 需要精确控制成本
- 团队使用, 需要分账
- 只用于特定项目, 用量可预测
2.2 适合订阅的场景
- 每天都在用 Claude Code
- 不想操心费用计算
- 个人开发者, 追求简单
- 用量较大且稳定
2.3 盈亏平衡点分析
假设你主要使用 Sonnet 模型:
- 如果月度 API 费用经常超过 $100, Max 5x 更划算
- 如果月度 API 费用在 $20-$50 之间, Pro 计划可能更合适
- 如果月度 API 费用低于 $20, 按量付费更经济
建议: 先用 API 按量付费一个月, 统计实际用量, 再决定是否切换到订阅。
三、七个省钱技巧
技巧一: 精简提示词, 减少废话
差的提示:
你好, 我想请你帮我看一下这个文件, 这个文件是我昨天写的,
主要功能是处理用户登录, 但是我发现有一个 bug, 就是当用户
输入空密码的时候会崩溃, 你能不能帮我找到问题在哪里, 然后
修复它, 谢谢你。
好的提示:
修复 src/auth/login.ts 中空密码导致崩溃的 bug
效果差异:
- 差的提示: 约 80 个 Token
- 好的提示: 约 20 个 Token
- 单次节省不多, 但累计下来差距明显
核心原则: 提示词要像电报, 信息密度高, 废话少。
技巧二: 善用 /compact 压缩上下文
当对话变长时, 上下文膨胀是费用增长的主要原因。Claude Code 提供了 /compact 命令:
# 在对话中输入
/compact
这会让 Claude 总结之前的对话, 用更少的 Token 表达相同的信息。建议:
- 每 10-15 轮对话执行一次 /compact
- 在切换任务主题时执行 /compact
- 感觉响应变慢时执行 /compact (通常意味着上下文过长)
技巧三: 分拆任务, 短对话优于长对话
不要在一个对话里完成所有事情。例如, 要重构一个模块:
错误做法: 在一个对话里完成分析、设计、编码、测试、文档
正确做法:
对话 1: 分析现有代码结构, 输出重构方案
对话 2: 按方案重构核心逻辑
对话 3: 编写测试
对话 4: 更新文档
每个短对话的上下文都从较小的基数开始, 总体 Token 消耗更少。
技巧四: 用 CLAUDE.md 替代重复说明
如果你每次对话都要解释项目背景、编码规范、技术栈, 不如写进 CLAUDE.md:
# 项目说明
- 技术栈: Next.js 14 + TypeScript + Prisma
- 代码规范: 使用 ESLint airbnb 配置
- 测试框架: Vitest
- 命名: 组件用 PascalCase, 函数用 camelCase
CLAUDE.md 会被自动加载, 但只加载一次。比每次手动输入省得多。
技巧五: 选择合适的模型
不是所有任务都需要最强的模型:
| 任务类型 | 推荐模型 | 原因 |
|---|---|---|
| 简单代码生成 | Sonnet | 速度快, 费用低 |
| 复杂架构设计 | Opus | 推理能力强 |
| 代码解释 | Sonnet | 足够胜任 |
| Bug 调试 | Sonnet/Opus | 视复杂度而定 |
| 文档撰写 | Sonnet | 性价比高 |
在 Claude Code 中切换模型:
# 使用 /model 命令切换
/model sonnet
/model opus
日常开发 80% 的任务用 Sonnet 就够了, 只在遇到难题时切换 Opus。
技巧六: 精确指定文件范围
让 Claude Code 只关注必要的文件:
# 差: 让它自己去找
修复登录页面的样式问题
# 好: 明确指定
修复 src/pages/Login.tsx 第 45-60 行的 flexbox 布局问题
指定文件路径可以避免 Claude Code 扫描大量不相关的文件, 减少读取文件带来的 Token 消耗。
技巧七: 利用缓存机制
Anthropic API 支持 Prompt Caching。当连续请求中有大量重复内容时, 缓存命中的部分按更低的价格计费:
- 缓存写入: 比标准输入价格高 25%
- 缓存读取: 比标准输入价格低 90%
实际操作中, Claude Code 会自动利用缓存。你能做的是:
- 保持 CLAUDE.md 内容稳定, 不要频繁修改
- 在同一个会话中处理相关任务 (缓存在会话内有效)
- 避免在提示词开头加入变化的内容 (缓存按前缀匹配)
四、费用监控
4.1 查看当前用量
在 Claude Code 对话中, 可以随时查看本次会话的 Token 消耗:
# 查看当前会话统计
/cost
4.2 API 控制台监控
登录 Anthropic Console 可以查看:
- 每日/每月 API 调用量
- Token 消耗明细
- 费用趋势图
建议设置用量告警:
# 在 Anthropic Console 设置
Settings -> Usage Limits -> Set monthly budget alert
4.3 设定预算上限
API 模式下可以设置硬性消费上限:
- 月度上限: 达到后 API 自动停止响应
- 每日上限: 防止某天异常消耗
五、团队使用的成本优化
5.1 共享 CLAUDE.md
团队项目中, 一份好的 CLAUDE.md 能让每个成员减少重复提示, 整体省下大量 Token。
5.2 知识沉淀
把 Claude Code 生成的好方案记录下来, 形成团队知识库。下次遇到类似问题直接参考, 不需要再次消耗 Token 让 AI 从头分析。
5.3 使用场景分级
为团队制定使用规范:
| 级别 | 场景 | 策略 |
|---|---|---|
| 必要 | 复杂 Bug 调试 | 放心使用 |
| 推荐 | 代码审查辅助 | 控制频率 |
| 可选 | 简单代码生成 | 能手写就手写 |
| 避免 | 闲聊、测试玩耍 | 使用免费工具 |
六、常见费用陷阱
陷阱一: 无限循环对话
Claude Code 在自动修复 Bug 时, 可能陷入”修了又错、错了又修”的循环。设置合理的迭代上限。
陷阱二: 大文件读取
让 Claude Code 读取一个 5000 行的文件, 一次就消耗大量输入 Token。指定行范围比读取整个文件高效得多。
陷阱三: 频繁切换任务
在同一个对话中频繁切换不相关的任务, 导致上下文包含大量无关信息。不同任务开不同的对话。
陷阱四: 忘记关闭会话
长时间不用但不关闭会话, 再次使用时可能带着很长的历史上下文。及时使用 /compact 或开启新对话。
七、总结
省钱的核心思路只有一个: 减少不必要的 Token 消耗。
行动清单:
- 确认自己适合 API 还是订阅模式
- 写好 CLAUDE.md, 避免重复说明
- 养成写精简提示词的习惯
- 定期使用 /compact 压缩上下文
- 日常任务用 Sonnet, 难题切 Opus
- 指定文件路径, 避免全局扫描
- 每周检查一次费用报告, 发现异常及时调整
掌握这些技巧后, 大多数开发者可以将月度费用控制在合理范围内, 同时不影响开发效率。