模型资料 · 数据同步于 2025-04-22
Llama 3.3 70B Instruct FP8 Fast
Llama 3.3 70B Instruct FP8 Fast 是 Meta 的模型,主打工具调用、开放权重。它的上下文窗口为 128K,价格在同类中中等(比约 48% 的同类便宜)。适合日常问答、写作和轻量集成。
速览
- 最低输入价:$0.29/1M token(Cloudflare AI Gateway),比约 48% 的同类便宜
- 最低输出价:$2.25/1M token
- 输出/输入比:7.8×(输出贵几倍)
- 上下文窗口:128K token,比约 25% 的同类更长
- 发布日期:2025-04-03
- 能力:工具调用、开放权重
- 可用平台数:2
各平台价格
同一个模型,不同平台价格不同。最便宜的排在前面。
| 平台 | 输入/1M | 输出/1M | 上下文 | 上架 |
|---|---|---|---|---|
| Cloudflare AI Gateway | $0.29 | $2.25 | 128K | 2025-04-03 |
| Cloudflare Workers AI | $0.293 | $2.25 | 24K | 2024-12-06 |
价格每日同步自 models.dev + 各家官方文档。
同类对比
和价位/厂商相近的模型放一起看。
| 模型 | 厂商 | 输入/1M | 输出/1M | 上下文 |
|---|---|---|---|---|
| M2M100 1.2B | Cloudflare AI Gateway | $0.34 | $0.34 | 128K |
| IndicTrans2 EN-Indic 1B | Cloudflare AI Gateway | $0.34 | $0.34 | 128K |
| Mistral Small 3.1 24B | Cloudflare AI Gateway | $0.35 | $0.56 | 128K |
| Gemma SEA-LION v4 27B IT | Cloudflare AI Gateway | $0.35 | $0.56 | 128K |
该不该选它
Llama 3.3 70B Instruct FP8 Fast 是 Meta 的模型,主打工具调用、开放权重。它的上下文窗口为 128K,价格在同类中中等(比约 48% 的同类便宜)。适合日常问答、写作和轻量集成。
- 先并排对比:在对比工具里和 1-2 个候选放一起,规模化时价格差比跑分更重要。
- 挑满足延迟/SLA 的最便宜平台:同样的权重,不同平台价差很大。
- 每 3 个月重估一次:前沿价格降得快,今天最便宜的下个季度未必。
相关模型
常见问题
Llama 3.3 70B Instruct FP8 Fast 多少钱?最低 $0.29 输入 / $2.25 输出(每 1M token,最便宜平台)。其他平台见上表。
上下文窗口多大?128K token。
哪些平台提供?Cloudflare AI Gateway、Cloudflare Workers AI。
数据来源?models.dev + 各家官方文档,每日同步。关于数据。