模型资料 · 数据同步于 2025-04-22
Llama 3.1 8B
Llama 3.1 8B 是 Meta 的模型,主打工具调用、开放权重、推理。它的上下文窗口为 16K,价格在同类中偏便宜(比约 82% 的同类便宜)。适合日常问答、写作和轻量集成。
速览
- 最低输入价:$0/1M token(Nvidia),比约 82% 的同类便宜
- 最低输出价:$0/1M token
- 输出/输入比:—×(输出贵几倍)
- 上下文窗口:16K token,比约 6% 的同类更长
- 发布日期:2025-01-01
- 知识截止:2023-12
- 能力:工具调用、开放权重、推理
- 可用平台数:17
各平台价格
同一个模型,不同平台价格不同。最便宜的排在前面。
| 平台 | 输入/1M | 输出/1M | 上下文 | 上架 |
|---|---|---|---|---|
| Nvidia | $0 | $0 | 16K | 2025-01-01 |
| NovitaAI | $0.02 | $0.05 | 16K | 2024-07-24 |
| OpenRouter | $0.02 | $0.05 | 16K | 2024-07-23 |
| Deep Infra | $0.02 | $0.05 | 131K | 2024-07-23 |
| Abacus | $0.02 | $0.05 | 128K | 2024-07-23 |
| Inference | $0.025 | $0.025 | 16K | 2025-01-01 |
| Vercel AI Gateway | $0.03 | $0.05 | 131K | 2024-07-23 |
| Regolo AI | $0.05 | $0.25 | 120K | 2025-04-07 |
| NanoGPT | $0.054 | $0.054 | 131K | 2024-07-23 |
| Friendli | $0.1 | $0.1 | 131K | 2024-08-01 |
| Cerebras | $0.1 | $0.1 | 32K | 2025-01-01 |
| OVHcloud AI Endpoints | $0.11 | $0.11 | 131K | 2025-06-11 |
| STACKIT | $0.16 | $0.27 | 128K | 2024-07-23 |
| Synthetic | $0.2 | $0.2 | 128K | 2024-07-23 |
| LLM Gateway | $0.22 | $0.22 | 128K | 2024-07-23 |
| Amazon Bedrock | $0.22 | $0.22 | 128K | 2024-07-23 |
| Cloudflare AI Gateway | $0.28 | $0.83 | 128K | 2025-04-03 |
价格每日同步自 models.dev + 各家官方文档。
同类对比
和价位/厂商相近的模型放一起看。
| 模型 | 厂商 | 输入/1M | 输出/1M | 上下文 |
|---|---|---|---|---|
| Mistral-7B-Instruct-v0.3 | Nvidia | $0 | $0 | 66K |
| qwen3-coder-480b-a35b-instruct | Nvidia | $0 | $0 | 262K |
| Magistral Small 2506 | Nvidia | $0 | $0 | 33K |
| Gemma 3 27B IT | Nvidia | $0 | $0 | 131K |
该不该选它
Llama 3.1 8B 是 Meta 的模型,主打工具调用、开放权重、推理。它的上下文窗口为 16K,价格在同类中偏便宜(比约 82% 的同类便宜)。适合日常问答、写作和轻量集成。
- 先并排对比:在对比工具里和 1-2 个候选放一起,规模化时价格差比跑分更重要。
- 挑满足延迟/SLA 的最便宜平台:同样的权重,不同平台价差很大。
- 每 3 个月重估一次:前沿价格降得快,今天最便宜的下个季度未必。
相关模型
常见问题
Llama 3.1 8B 多少钱?最低 $0 输入 / $0 输出(每 1M token,最便宜平台)。其他平台见上表。
上下文窗口多大?16K token。
哪些平台提供?STACKIT、OVHcloud AI Endpoints、NanoGPT、NovitaAI、Regolo AI、Friendli、Inference、OpenRouter、LLM Gateway、Nvidia 等,见上方完整表格。
数据来源?models.dev + 各家官方文档,每日同步。关于数据。