Ctrl K

Llama 3.3 70B Instruct

accounts/fireworks/models/llama-v3p3-70b-instruct

Llama 3.3 70B Instruct 是 Llama 3.1 70B 的 12 月更新版本。该模型在 Llama 3.1 70B（于 2024 年 7 月发布）的基础上进行了改进，增强了工具调用、多语言文本支持、数学和编程能力。该模型在推理、数学和指令遵循方面达到了行业领先水平，并且能够提供与 3.1 405B 相似的性能，同时在速度和成本上具有显著优势。

128K

支持该模型的服务商

accounts/fireworks/models/llama-v3p3-70b-instruct

最大上下文长度

128K

最大输出长度

输入价格

$0.90

输出价格

$0.90

模型参数

随机性

temperature

此设置影响模型回应的多样性。较低的值会导致更可预测和典型的回应，而较高的值则鼓励更多样化和不常见的回应。当值设为0时，模型对于给定的输入总是给出相同的回应。查看文档

类型

FLOAT

默认值

1.00

范围

0.00 ~ 2.00

核采样

top_p

此设置将模型的选择限制为可能性最高的一定比例的词汇：只选择那些累计概率达到P的顶尖词汇。较低的值使得模型的回应更加可预测，而默认设置则允许模型从全部范围的词汇中进行选择。查看文档

类型

FLOAT

默认值

1.00

范围

0.00 ~ 1.00

话题新鲜度

presence_penalty

此设置旨在根据词汇在输入中出现的频率来控制词汇的重复使用。它尝试较少使用那些在输入中出现较多的词汇，其使用频率与出现频率成比例。词汇惩罚随出现次数而增加。负值将鼓励重复使用词汇。查看文档

类型

FLOAT

默认值

0.00

范围

-2.00 ~ 2.00

频率惩罚度

frequency_penalty

此设置调整模型重复使用输入中已经出现的特定词汇的频率。较高的值使得这种重复出现的可能性降低，而负值则产生相反的效果。词汇惩罚不随出现次数增加而增加。负值将鼓励词汇的重复使用。查看文档

类型

FLOAT

默认值

0.00

范围

-2.00 ~ 2.00

单次回复限制

max_tokens

此设置定义了模型在单次回复中可以生成的最大长度。设置较高的值允许模型生成更长的回应，而较低的值则限制回应的长度，使其更简洁。根据不同的应用场景，合理调整此值可以帮助达到预期的回应长度和详细程度。查看文档

类型

INT

默认值

推理强度

reasoning_effort

此设置用于控制模型在生成回答前的推理强度。低强度优先响应速度并节省 Token，高强度提供更完整的推理，但会消耗更多 Token 并降低响应速度。默认值为中，平衡推理准确性与响应速度。查看文档

类型

STRING

默认值

范围

low ~ high

Llama 3.3 70B Instruct

支持该模型的服务商

模型参数

相关模型

Llama 3.2 3B Instruct

Llama 3.2 11B Vision Instruct

Llama 3.2 90B Vision Instruct

Llama 3.1 8B Instruct

Llama 3.1 70B Instruct