费用与省钱攻略

使用 Claude Code 进行开发是一项投资。理解它的计费逻辑, 掌握省钱技巧, 能让你在不影响效率的前提下大幅降低开支。本文将从计费模式讲起, 逐步展开 7 个实战省钱策略。

一、Claude Code 的计费模式

1.1 两种使用方式

Claude Code 目前有两种主要的使用途径:

方式一: API 按量付费

通过 Anthropic API 调用 Claude 模型。你需要:

注册 Anthropic 账号并获取 API Key
在 Claude Code CLI 中配置 API Key
每次对话按 Token 数量计费

计费公式:

费用 = 输入 Token 数 x 输入单价 + 输出 Token 数 x 输出单价

以 Claude Sonnet 为例:

项目	单价
输入 Token	$3 / 百万 Token
输出 Token	$15 / 百万 Token

以 Claude Opus 为例:

项目	单价
输入 Token	$15 / 百万 Token
输出 Token	$75 / 百万 Token

方式二: Max 订阅计划

Anthropic 提供 Max 订阅, 包含 Claude Code 使用额度:

计划	月费	说明
Pro	$20/月	包含一定量的 Claude Code 使用
Max 5x	$100/月	Pro 的 5 倍用量
Max 20x	$200/月	Pro 的 20 倍用量

1.2 Token 是什么

Token 是模型处理文本的最小单位。粗略估算:

英文: 1 个单词约 1-2 个 Token
中文: 1 个汉字约 1.5-2 个 Token
代码: 因语言而异, 通常 1 行代码约 5-15 个 Token

一次典型的 Claude Code 对话可能消耗:

场景	输入 Token	输出 Token	估算费用 (Sonnet)
简单问答	1,000	500	$0.01
读取文件并修改	10,000	2,000	$0.06
大型重构	50,000	10,000	$0.30
全项目分析	200,000	20,000	$0.90

1.3 隐藏的费用大户: 上下文

Claude Code 每次交互会自动携带上下文信息, 包括:

当前对话历史
读取过的文件内容
项目结构信息
CLAUDE.md 的内容

这意味着对话越长, 每次请求的输入 Token 越多, 费用增长是累积的。一个持续 30 轮的对话, 后期每轮的输入 Token 可能是前期的 10 倍以上。

二、API vs 订阅: 怎么选

2.1 适合 API 的场景

使用频率不固定, 有时候一周不用
需要精确控制成本
团队使用, 需要分账
只用于特定项目, 用量可预测

2.2 适合订阅的场景

每天都在用 Claude Code
不想操心费用计算
个人开发者, 追求简单
用量较大且稳定

2.3 盈亏平衡点分析

假设你主要使用 Sonnet 模型:

如果月度 API 费用经常超过 $100, Max 5x 更划算
如果月度 API 费用在 $20-$50 之间, Pro 计划可能更合适
如果月度 API 费用低于 $20, 按量付费更经济

建议: 先用 API 按量付费一个月, 统计实际用量, 再决定是否切换到订阅。

三、七个省钱技巧

技巧一: 精简提示词, 减少废话

差的提示:

你好, 我想请你帮我看一下这个文件, 这个文件是我昨天写的,
主要功能是处理用户登录, 但是我发现有一个 bug, 就是当用户
输入空密码的时候会崩溃, 你能不能帮我找到问题在哪里, 然后
修复它, 谢谢你。

好的提示:

修复 src/auth/login.ts 中空密码导致崩溃的 bug

效果差异:

差的提示: 约 80 个 Token
好的提示: 约 20 个 Token
单次节省不多, 但累计下来差距明显

核心原则: 提示词要像电报, 信息密度高, 废话少。

技巧二: 善用 /compact 压缩上下文

当对话变长时, 上下文膨胀是费用增长的主要原因。Claude Code 提供了 /compact 命令:

# 在对话中输入
/compact

这会让 Claude 总结之前的对话, 用更少的 Token 表达相同的信息。建议:

每 10-15 轮对话执行一次 /compact
在切换任务主题时执行 /compact
感觉响应变慢时执行 /compact (通常意味着上下文过长)

技巧三: 分拆任务, 短对话优于长对话

不要在一个对话里完成所有事情。例如, 要重构一个模块:

错误做法: 在一个对话里完成分析、设计、编码、测试、文档

正确做法:

对话 1: 分析现有代码结构, 输出重构方案
对话 2: 按方案重构核心逻辑
对话 3: 编写测试
对话 4: 更新文档

每个短对话的上下文都从较小的基数开始, 总体 Token 消耗更少。

技巧四: 用 CLAUDE.md 替代重复说明

如果你每次对话都要解释项目背景、编码规范、技术栈, 不如写进 CLAUDE.md:

# 项目说明
- 技术栈: Next.js 14 + TypeScript + Prisma
- 代码规范: 使用 ESLint airbnb 配置
- 测试框架: Vitest
- 命名: 组件用 PascalCase, 函数用 camelCase

CLAUDE.md 会被自动加载, 但只加载一次。比每次手动输入省得多。

技巧五: 选择合适的模型

不是所有任务都需要最强的模型:

任务类型	推荐模型	原因
简单代码生成	Sonnet	速度快, 费用低
复杂架构设计	Opus	推理能力强
代码解释	Sonnet	足够胜任
Bug 调试	Sonnet/Opus	视复杂度而定
文档撰写	Sonnet	性价比高

在 Claude Code 中切换模型:

# 使用 /model 命令切换
/model sonnet
/model opus

日常开发 80% 的任务用 Sonnet 就够了, 只在遇到难题时切换 Opus。

技巧六: 精确指定文件范围

让 Claude Code 只关注必要的文件:

# 差: 让它自己去找
修复登录页面的样式问题

# 好: 明确指定
修复 src/pages/Login.tsx 第 45-60 行的 flexbox 布局问题

指定文件路径可以避免 Claude Code 扫描大量不相关的文件, 减少读取文件带来的 Token 消耗。

技巧七: 利用缓存机制

Anthropic API 支持 Prompt Caching。当连续请求中有大量重复内容时, 缓存命中的部分按更低的价格计费:

缓存写入: 比标准输入价格高 25%
缓存读取: 比标准输入价格低 90%

实际操作中, Claude Code 会自动利用缓存。你能做的是:

保持 CLAUDE.md 内容稳定, 不要频繁修改
在同一个会话中处理相关任务 (缓存在会话内有效)
避免在提示词开头加入变化的内容 (缓存按前缀匹配)

四、费用监控

4.1 查看当前用量

在 Claude Code 对话中, 可以随时查看本次会话的 Token 消耗:

# 查看当前会话统计
/cost

4.2 API 控制台监控

每日/每月 API 调用量
Token 消耗明细
费用趋势图

建议设置用量告警:

# 在 Anthropic Console 设置
Settings -> Usage Limits -> Set monthly budget alert

4.3 设定预算上限

API 模式下可以设置硬性消费上限:

月度上限: 达到后 API 自动停止响应
每日上限: 防止某天异常消耗

五、团队使用的成本优化

5.1 共享 CLAUDE.md

团队项目中, 一份好的 CLAUDE.md 能让每个成员减少重复提示, 整体省下大量 Token。

5.2 知识沉淀

把 Claude Code 生成的好方案记录下来, 形成团队知识库。下次遇到类似问题直接参考, 不需要再次消耗 Token 让 AI 从头分析。

5.3 使用场景分级

为团队制定使用规范:

级别	场景	策略
必要	复杂 Bug 调试	放心使用
推荐	代码审查辅助	控制频率
可选	简单代码生成	能手写就手写
避免	闲聊、测试玩耍	使用免费工具

六、常见费用陷阱

陷阱一: 无限循环对话

Claude Code 在自动修复 Bug 时, 可能陷入”修了又错、错了又修”的循环。设置合理的迭代上限。

陷阱二: 大文件读取

让 Claude Code 读取一个 5000 行的文件, 一次就消耗大量输入 Token。指定行范围比读取整个文件高效得多。

陷阱三: 频繁切换任务

在同一个对话中频繁切换不相关的任务, 导致上下文包含大量无关信息。不同任务开不同的对话。

陷阱四: 忘记关闭会话

长时间不用但不关闭会话, 再次使用时可能带着很长的历史上下文。及时使用 /compact 或开启新对话。

七、总结

省钱的核心思路只有一个: 减少不必要的 Token 消耗。

行动清单:

确认自己适合 API 还是订阅模式
写好 CLAUDE.md, 避免重复说明
养成写精简提示词的习惯
定期使用 /compact 压缩上下文
日常任务用 Sonnet, 难题切 Opus
指定文件路径, 避免全局扫描
每周检查一次费用报告, 发现异常及时调整

掌握这些技巧后, 大多数开发者可以将月度费用控制在合理范围内, 同时不影响开发效率。

费用与省钱攻略

费用与省钱攻略

一、Claude Code 的计费模式

1.1 两种使用方式

1.2 Token 是什么

1.3 隐藏的费用大户: 上下文

二、API vs 订阅: 怎么选

2.1 适合 API 的场景

2.2 适合订阅的场景

2.3 盈亏平衡点分析

三、七个省钱技巧

技巧一: 精简提示词, 减少废话

技巧二: 善用 /compact 压缩上下文

技巧三: 分拆任务, 短对话优于长对话

技巧四: 用 CLAUDE.md 替代重复说明

技巧五: 选择合适的模型

技巧六: 精确指定文件范围

技巧七: 利用缓存机制

四、费用监控

4.1 查看当前用量

4.2 API 控制台监控

4.3 设定预算上限

五、团队使用的成本优化

5.1 共享 CLAUDE.md

5.2 知识沉淀

5.3 使用场景分级

六、常见费用陷阱

陷阱一: 无限循环对话

陷阱二: 大文件读取

陷阱三: 频繁切换任务

陷阱四: 忘记关闭会话

七、总结

觉得有用？关注公众号获取更多