使用 Claude Code 进行开发是一项投资。理解它的计费逻辑, 掌握省钱技巧, 能让你在不影响效率的前提下大幅降低开支。本文将从计费模式讲起, 逐步展开 7 个实战省钱策略。
Claude Code 目前有两种主要的使用途径:
方式一: API 按量付费
通过 Anthropic API 调用 Claude 模型。你需要:
计费公式:
费用 = 输入 Token 数 x 输入单价 + 输出 Token 数 x 输出单价
以 Claude Sonnet 为例:
| 项目 | 单价 |
|---|---|
| 输入 Token | $3 / 百万 Token |
| 输出 Token | $15 / 百万 Token |
以 Claude Opus 为例:
| 项目 | 单价 |
|---|---|
| 输入 Token | $15 / 百万 Token |
| 输出 Token | $75 / 百万 Token |
方式二: Max 订阅计划
Anthropic 提供 Max 订阅, 包含 Claude Code 使用额度:
| 计划 | 月费 | 说明 |
|---|---|---|
| Pro | $20/月 | 包含一定量的 Claude Code 使用 |
| Max 5x | $100/月 | Pro 的 5 倍用量 |
| Max 20x | $200/月 | Pro 的 20 倍用量 |
Token 是模型处理文本的最小单位。粗略估算:
一次典型的 Claude Code 对话可能消耗:
| 场景 | 输入 Token | 输出 Token | 估算费用 (Sonnet) |
|---|---|---|---|
| 简单问答 | 1,000 | 500 | $0.01 |
| 读取文件并修改 | 10,000 | 2,000 | $0.06 |
| 大型重构 | 50,000 | 10,000 | $0.30 |
| 全项目分析 | 200,000 | 20,000 | $0.90 |
Claude Code 每次交互会自动携带上下文信息, 包括:
这意味着对话越长, 每次请求的输入 Token 越多, 费用增长是累积的。一个持续 30 轮的对话, 后期每轮的输入 Token 可能是前期的 10 倍以上。
假设你主要使用 Sonnet 模型:
建议: 先用 API 按量付费一个月, 统计实际用量, 再决定是否切换到订阅。
差的提示:
你好, 我想请你帮我看一下这个文件, 这个文件是我昨天写的,
主要功能是处理用户登录, 但是我发现有一个 bug, 就是当用户
输入空密码的时候会崩溃, 你能不能帮我找到问题在哪里, 然后
修复它, 谢谢你。
好的提示:
修复 src/auth/login.ts 中空密码导致崩溃的 bug
效果差异:
核心原则: 提示词要像电报, 信息密度高, 废话少。
当对话变长时, 上下文膨胀是费用增长的主要原因。Claude Code 提供了 /compact 命令:
# 在对话中输入
/compact
这会让 Claude 总结之前的对话, 用更少的 Token 表达相同的信息。建议:
不要在一个对话里完成所有事情。例如, 要重构一个模块:
错误做法: 在一个对话里完成分析、设计、编码、测试、文档
正确做法:
对话 1: 分析现有代码结构, 输出重构方案
对话 2: 按方案重构核心逻辑
对话 3: 编写测试
对话 4: 更新文档
每个短对话的上下文都从较小的基数开始, 总体 Token 消耗更少。
如果你每次对话都要解释项目背景、编码规范、技术栈, 不如写进 CLAUDE.md:
# 项目说明
- 技术栈: Next.js 14 + TypeScript + Prisma
- 代码规范: 使用 ESLint airbnb 配置
- 测试框架: Vitest
- 命名: 组件用 PascalCase, 函数用 camelCase
CLAUDE.md 会被自动加载, 但只加载一次。比每次手动输入省得多。
不是所有任务都需要最强的模型:
| 任务类型 | 推荐模型 | 原因 |
|---|---|---|
| 简单代码生成 | Sonnet | 速度快, 费用低 |
| 复杂架构设计 | Opus | 推理能力强 |
| 代码解释 | Sonnet | 足够胜任 |
| Bug 调试 | Sonnet/Opus | 视复杂度而定 |
| 文档撰写 | Sonnet | 性价比高 |
在 Claude Code 中切换模型:
# 使用 /model 命令切换
/model sonnet
/model opus
日常开发 80% 的任务用 Sonnet 就够了, 只在遇到难题时切换 Opus。
让 Claude Code 只关注必要的文件:
# 差: 让它自己去找
修复登录页面的样式问题
# 好: 明确指定
修复 src/pages/Login.tsx 第 45-60 行的 flexbox 布局问题
指定文件路径可以避免 Claude Code 扫描大量不相关的文件, 减少读取文件带来的 Token 消耗。
Anthropic API 支持 Prompt Caching。当连续请求中有大量重复内容时, 缓存命中的部分按更低的价格计费:
实际操作中, Claude Code 会自动利用缓存。你能做的是:
在 Claude Code 对话中, 可以随时查看本次会话的 Token 消耗:
# 查看当前会话统计
/cost
登录 Anthropic Console 可以查看:
建议设置用量告警:
# 在 Anthropic Console 设置
Settings -> Usage Limits -> Set monthly budget alert
API 模式下可以设置硬性消费上限:
团队项目中, 一份好的 CLAUDE.md 能让每个成员减少重复提示, 整体省下大量 Token。
把 Claude Code 生成的好方案记录下来, 形成团队知识库。下次遇到类似问题直接参考, 不需要再次消耗 Token 让 AI 从头分析。
为团队制定使用规范:
| 级别 | 场景 | 策略 |
|---|---|---|
| 必要 | 复杂 Bug 调试 | 放心使用 |
| 推荐 | 代码审查辅助 | 控制频率 |
| 可选 | 简单代码生成 | 能手写就手写 |
| 避免 | 闲聊、测试玩耍 | 使用免费工具 |
Claude Code 在自动修复 Bug 时, 可能陷入”修了又错、错了又修”的循环。设置合理的迭代上限。
让 Claude Code 读取一个 5000 行的文件, 一次就消耗大量输入 Token。指定行范围比读取整个文件高效得多。
在同一个对话中频繁切换不相关的任务, 导致上下文包含大量无关信息。不同任务开不同的对话。
长时间不用但不关闭会话, 再次使用时可能带着很长的历史上下文。及时使用 /compact 或开启新对话。
省钱的核心思路只有一个: 减少不必要的 Token 消耗。
行动清单:
掌握这些技巧后, 大多数开发者可以将月度费用控制在合理范围内, 同时不影响开发效率。
每周更新 Claude Code 实战技巧、工具对比、行业动态。回复「模板」获取 CLAUDE.md 模板合集。