AI 智慧岛
返回发现
Meta

Llama 3.3 70B Instruct

accounts/fireworks/models/llama-v3p3-70b-instruct
Llama 3.3 70B Instruct 是 Llama 3.1 70B 的 12 月更新版本。该模型在 Llama 3.1 70B(于 2024 年 7 月发布)的基础上进行了改进,增强了工具调用、多语言文本支持、数学和编程能力。该模型在推理、数学和指令遵循方面达到了行业领先水平,并且能够提供与 3.1 405B 相似的性能,同时在速度和成本上具有显著优势。
128K

支持该模型的服务商

Meta
FireworksFireworks
Metaaccounts/fireworks/models/llama-v3p3-70b-instruct
最大上下文长度
128K
最大输出长度
--
输入价格
$0.90
输出价格
$0.90

模型参数

随机性
temperature

此设置影响模型回应的多样性。较低的值会导致更可预测和典型的回应,而较高的值则鼓励更多样化和不常见的回应。当值设为0时,模型对于给定的输入总是给出相同的回应。 查看文档

类型
FLOAT
默认值
1.00
范围
0.00 ~ 2.00
核采样
top_p

此设置将模型的选择限制为可能性最高的一定比例的词汇:只选择那些累计概率达到P的顶尖词汇。较低的值使得模型的回应更加可预测,而默认设置则允许模型从全部范围的词汇中进行选择。 查看文档

类型
FLOAT
默认值
1.00
范围
0.00 ~ 1.00
话题新鲜度
presence_penalty

此设置旨在根据词汇在输入中出现的频率来控制词汇的重复使用。它尝试较少使用那些在输入中出现较多的词汇,其使用频率与出现频率成比例。词汇惩罚随出现次数而增加。负值将鼓励重复使用词汇。 查看文档

类型
FLOAT
默认值
0.00
范围
-2.00 ~ 2.00
频率惩罚度
frequency_penalty

此设置调整模型重复使用输入中已经出现的特定词汇的频率。较高的值使得这种重复出现的可能性降低,而负值则产生相反的效果。词汇惩罚不随出现次数增加而增加。负值将鼓励词汇的重复使用。 查看文档

类型
FLOAT
默认值
0.00
范围
-2.00 ~ 2.00
单次回复限制
max_tokens

此设置定义了模型在单次回复中可以生成的最大长度。设置较高的值允许模型生成更长的回应,而较低的值则限制回应的长度,使其更简洁。根据不同的应用场景,合理调整此值可以帮助达到预期的回应长度和详细程度。 查看文档

类型
INT
默认值
--
推理强度
reasoning_effort

此设置用于控制模型在生成回答前的推理强度。低强度优先响应速度并节省 Token,高强度提供更完整的推理,但会消耗更多 Token 并降低响应速度。默认值为中,平衡推理准确性与响应速度。 查看文档

类型
STRING
默认值
--
范围
low ~ high

相关模型

Meta

Llama 3.2 3B Instruct

accounts/fireworks/models/llama-v3p2-3b-instruct
Llama 3.2 3B Instruct 是 Meta 推出的轻量级多语言模型。该模型专为高效运行而设计,相较于更大型的模型,具有显著的延迟和成本优势。其典型应用场景包括查询和提示重写,以及写作辅助。
128K
Meta

Llama 3.2 11B Vision Instruct

accounts/fireworks/models/llama-v3p2-11b-vision-instruct
Meta 推出的指令微调图像推理模型,拥有 110 亿参数。该模型针对视觉识别、图像推理、图片字幕生成以及图片相关的常规问答进行了优化。它能够理解视觉数据,如图表和图形,并通过生成文本描述图像细节,弥合视觉与语言之间的鸿沟。
128K
Meta

Llama 3.2 90B Vision Instruct

accounts/fireworks/models/llama-v3p2-90b-vision-instruct
Meta 推出的指令微调图像推理模型,拥有 900 亿参数。该模型针对视觉识别、图像推理、图片字幕生成以及图片相关的常规问答进行了优化。它能够理解视觉数据,如图表和图形,并通过生成文本描述图像细节,弥合视觉与语言之间的鸿沟。注意:该模型目前作为无服务器模型进行实验性提供。如果用于生产环境,请注意 Fireworks 可能会在短时间内取消部署该模型。
128K
Meta

Llama 3.1 8B Instruct

accounts/fireworks/models/llama-v3p1-8b-instruct
Meta Llama 3.1 系列是多语言大语言模型(LLM)集合,包含 8B、70B 和 405B 三种参数规模的预训练和指令微调生成模型。Llama 3.1 指令微调文本模型(8B、70B、405B)专为多语言对话应用优化,并在常见的行业基准测试中优于许多现有的开源和闭源聊天模型。
128K
Meta

Llama 3.1 70B Instruct

accounts/fireworks/models/llama-v3p1-70b-instruct
Meta Llama 3.1 系列是多语言大语言模型(LLM)集合,包含 8B、70B 和 405B 三种参数规模的预训练和指令微调生成模型。Llama 3.1 指令微调文本模型(8B、70B、405B)专为多语言对话应用优化,并在常见的行业基准测试中优于许多现有的开源和闭源聊天模型。
128K