豆包是字节跳动研发的人工智能大模型,具备多轮对话、内容创作等核心能力,致力于为用户提供智能、便捷的服务体验。
https://www.volcengine.com/product/doubao?from=doubao_product_page
- collect
- recommend
- Not recommended
product labeling
- LLM
For the crowd
- Creator
- Content operator
- Education practit...
- Self-Media
Function label
- Text-generated pi...
- Picture generatio...
- text to text
- Free Use
- Free Trial
- API
- Web Version
豆包,Doubao家族模型,字节跳动推出的自研大模型。
产品价格计算器: https://www.volcengine.com/pricing?product=ark_bd&tab=2
推荐模型:
doubao-1.5-thinking-pro | doubao-1.5-vision | doubao-1.5-pro | deepseek-r1 |
---|---|---|---|
全新推出Doubao深度思考模型。 在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出,在AIME 2024、Codeforces、GPQA等多项权威基准上达到或接近业界第一梯队水平。 支持 128k 上下文长度 支持 96k 输入长度、 32k 思维链内容 可配置 16k 最大输出长度 vision版本支持图文、视频理解 | Doubao-1.5-vision-pro 全新升级的多模态大模型,视觉理解、分类、信息抽取、解题、视频理解等能力显著提升。 在多个公开评测集准上,领先GPT-4o、Claude 3.7 Sonnet、Gemini-2.0-pro等业界一流模型。 支持 128k 上下文长度 可配置 12k 最大输出长度 支持图文、视频理解 | 专业版大模型,单价不提升的同时,模型能力有大幅提升,在知识(MMLU_PRO:80.2; GPQA:66.2)、代码(FullStackBench:65.1)、推理(DROP:92.6)、中文(C-Eval:91.5)等相关的多项测评中获得高分,达到行业SOTA水平。 最高支持 256k 最大上下文长度 可配置 16k 最大输出长度 高质量,低成本,极具性价比 | deepseek-r1 在后训练阶段大规模使用了强化学习技术,在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。 支持 96k 上下文长度 支持 64k 最大输入、32k 思维链内容 可配置 16k 最大输出长度 高性能,满血版 |
声音复刻
语音识别
语音合成
音乐生成
翻译
语音大模型
视觉大模型
角色扮演
向量大模型
代码生成
信息抽取
Function Call
内容创作
文本生成
图片内容理解
对话模型
深度思考
建议使用 doubao-1.5-thinking-pro和deepseek-r1
深度思考模型
按 token 使用量付费(后付费)
- 出账时间:每小时出账。
- 付款类型:按量后付费。
- 模型范围:
- 推理服务(输出):包含模型输出的内容,包括模型返回信息里输出(
content
字段)以及深度思考模型的思维链(reasoning_content
字段)内容。 - 模型单价(刊例价):如下表,实际购买价格以下单页面为准。
模型名称 | 服务类型 | 定价(元/百万 token) | 计费方式 | 免费额度万 token |
---|---|---|---|---|
doubao-1.5-thinking-pro含m-250415版本 | 推理服务(输入) | 4.00 | 后付费 | 50 |
推理服务(输出) | 16.00 | 后付费 | ||
deepseek-r1 | 推理服务(输入) | 4.00 | 后付费 | 50 |
推理服务(输出) | 16.00 | 后付费 | ||
deepseek-r1-distill-qwen-32b | 推理服务(输入) | 1.50 | 后付费 | 50 |
推理服务(输出) | 6.00 | 后付费 | ||
deepseek-r1-distill-qwen-7b | 推理服务(输入) | 0.60 | 后付费 | 50 |
大语言模型
按 token 使用量付费(后付费)
- 出账时间:每小时出账。
- 付款类型:按量后付费。
- 模型范围:
- 适用于:调用 doubao 等语言类大模型,基于 doubao 等大模型精调后的模型。
注意
- 仅部分doubao模型支持精调后按token后付费在线推理,以创建在线推理接入点页面可选的付费方式为准。
- doubao 1.5及后续模型的精调后推理服务在延迟和性能方面较旧版模型有比较明显的提升,在大流量场景的稳定性也有提升。
- 不适用于:全量精调模型。
- 模型单价(刊例价):如下表,实际购买价格以下单页面为准。
模型名称 | 服务类型 | 定价(元/百万 token) | 计费方式 | 免费额度万 token |
---|---|---|---|---|
doubao-1.5-pro-32k | 推理服务(输入) | 0.80 | 后付费 | 50 |
推理服务(输出) | 2.00 | 后付费 | ||
精调模型推理服务(输入) | 2.00 | 后付费 | ||
精调模型推理服务(输出) | 5.00 | 后付费 | ||
doubao-1.5-pro-256k | 推理服务(输入) | 5.00 | 后付费 | 50 |
推理服务(输出) | 9.00 | 后付费 | ||
doubao-1.5-lite-32k | 推理服务(输入) | 0.30 | 后付费 | 50 |
推理服务(输出) | 0.60 | 后付费 | ||
精调模型推理服务(输入) | 0.75 | 后付费 | ||
精调模型推理服务(输出) | 1.50 | 后付费 | ||
doubao-lite-4k包括分支版本: character | 推理服务(输入) | 0.30 | 后付费 | 50 |
推理服务(输出) | 0.60 | 后付费 | ||
doubao-lite-32k | 推理服务(输入) | 0.30 | 后付费 | 50 |
推理服务(输出) | 0.60 | 后付费 | ||
doubao-lite-128k | 推理服务(输入) | 0.80 | 后付费 | 50 |
推理服务(输出) | 1.00 | 后付费 | ||
doubao-pro-4k包括分支版本:character、functioncall | 推理服务(输入) | 0.80 | 后付费 | 50 |
推理服务(输出) | 2.00 | 后付费 | ||
doubao-pro-32k | 推理服务(输入) | 0.80 | 后付费 | 50 |
推理服务(输出) | 2.00 | 后付费 | ||
doubao-pro-128k | 推理服务(输入) | 5.00 | 后付费 | 50 |
推理服务(输出) | 9.00 | 后付费 | ||
doubao-pro-256k | 推理服务(输入) | 5.00 | 后付费 | 50 |
推理服务(输出) | 9.00 | 后付费 | ||
deepseek-v3 | 推理服务(输入) | 2.00 | 后付费 | 50 |
推理服务(输出) | 8.00 | 后付费 | ||
Moonshot-v1-8K | 推理服务 | 12.0 | 后付费 | 50 |
Moonshot-v1-32K | 推理服务 | 24.0 | 后付费 | 50 |
Moonshot-v1-128K | 推理服务 | 60.0 | 后付费 | 50 |
视觉理解模型
方舟会将输入的信息(包括图片)转化为 token 后,进行计量计费。具体用量统计逻辑请参见token 用量说明。
模型名称 | 服务类型 | 定价元/百万 token | 计费方式 | 免费额度万 token |
---|---|---|---|---|
doubao-1.5-vision-pro | 推理服务(输入) | 3.00 | 后付费 | 50 |
推理服务(输出) | 9.00 | 后付费 | ||
doubao-1.5-vision-lite | 推理服务(输入) | 1.50 | 后付费 | 50 |
推理服务(输出) | 4.50 | 后付费 | ||
doubao-1.5-ui-tars | 推理服务(输入) | 3.50 | 后付费 | 50 |
推理服务(输出) | 12.00 | 后付费 | ||
doubao-1.5-vision-pro-32k | 推理服务(输入) | 3.00 | 后付费 | 50 |
推理服务(输出) | 9.00 | 后付费 | ||
doubao-vision-lite-32k | 推理服务(输入) | 1.50 | 后付费 | 50 |
推理服务(输出) | 4.50 | 后付费 | ||
doubao-vision-pro-32k | 推理服务(输入) | 3.00 | 后付费 | 50 |
推理服务(输出) | 9.00 | 后付费 |
视觉生成模型
- 计费逻辑
- 视频生成模型按输出 token 计费,图生视频、文生视频同价。生成不同时长、不同画面尺寸的视频,将消耗不同数量的 token。
- 用量计算近似方式如下,准确的 token 用量以调用API后返回信息中的
usage
字段为准。 - 计费定价
模型名称 | 服务类型 | 定价元/百万 token | 计费方式 | 免费额度万 token |
---|---|---|---|---|
doubao-seaweed | 推理服务(输出) | 30.00 | 后付费 | 200 |
wan2.1-14b | 推理服务(输出) | 50.00 | 后付费 | 200 |
- Seaweed 计费示例
画面比例 | 宽(像素) | 高(像素) | 帧率(帧/秒) | 视频时长(秒) | 用量(token) | 刊例价单价(元) |
---|---|---|---|---|---|---|
1:1 | 720 | 720 | 24 | 5 | 60,750 | 1.82 |
4:3 | 960 | 720 | 24 | 5 | 81,000 | 2.43 |
16:9 | 1280 | 720 | 24 | 5 | 108,000 | 3.24 |
1:1 | 720 | 720 | 24 | 10 | 121,500 | 3.65 |
4:3 | 960 | 720 | 24 | 10 | 162,000 | 4.86 |
16:9 | 1280 | 720 | 24 | 10 | 216,000 | 6.48 |
1:1 | 480 | 480 | 24 | 5 | 27,000 | 0.81 |
4:3 | 640 | 480 | 24 | 5 | 36,000 | 1.08 |
16:9 | 848 | 480 | 24 | 5 | 47,700 | 1.43 |
1:1 | 480 | 480 | 24 | 10 | 54,000 | 1.62 |
4:3 | 640 | 480 | 24 | 10 | 72,000 | 2.16 |
16:9 | 848 | 480 | 24 | 10 | 95,400 | 2.86 |
- Wan2.1-14B 计费示例
画面比例 | 宽(像素) | 高(像素) | 帧率(帧/秒) | 视频时长(秒) | 用量(token) | 刊例价单价(元) |
---|---|---|---|---|---|---|
16:9 | 832 | 480 | 16 | 5 | 31,200 | 1.56 |
16:9 | 1280 | 720 | 16 | 5 | 72,000 | 3.6 |
文生图大模型
模型 | 计费项 | 支持并发 | 定价 | 计费方式 |
---|---|---|---|---|
豆包-文生图模型-智能绘图 | 推理服务 | 详见控制台 | 0.2 元/次 | 后付费 (免费额度 200 次) |
语音大模型
模型 | 服务类型 | 定价元/万字 | 计费方式 | 免费额度字 |
---|---|---|---|---|
doubao-语音合成 | 推理服务 | 5 | 后付费 | 5000 |
doubao-声音复刻 | 推理服务 | 8 | 后付费 | 5000 |
文本向量模型
模型 | 服务类型 | 定价元/百万 token | 计费方式 | 免费额度万 token |
---|---|---|---|---|
doubao-embedding | 推理服务(输入) | 0.50 | 后付费 | 50 |
doubao-embedding-large | 推理服务(输入) | 0.70 | 后付费 | 50 |
图文向量模型
方舟会将输入的信息(包括图片)转化为 token 后,进行计量计费。
说明:图片tokens = (width px * height px)/784,超大图封顶1312 token。
模型 | 服务类型 | 定价元/百万 token | 计费方式 | 免费额度万 token |
---|---|---|---|---|
doubao-embedding-vision | 推理服务(输入) | 文本输入:0.70图片输入:1.80 | 后付费 | 50 |
上下文缓存计费
计费项
与普通的在线推理有所不同,使用了Session 缓存后,计费项会变更为下面几个计费项:
- 输入内容:使用会话缓存的有状态 API,您无需重新发送之前的对话轮次。输入token 仅代表添加到正在进行的对话中的新文本。
- 命中缓存内容:Context API 会自动处理之前的对话历史记录,因此在请求期间访问的所有相关的先前对话 token 都将计为缓存命中。缓存命中的计费费率会低于输入,使多轮对话更具成本效益。
- 存储:存储按小时计费,基于每个自然小时内存储的最大token数。即使Context会一直保留,直到被删除,详细工作原理见触发过期时间。极端情况下Context 创建后没被使用,收费会持续到上下文的生存时间 (TTL) 过期。
- 输出内容:输出代表模型生成的内容。计费方式与标准语言模型的使用保持一致。
计费逻辑
- Session缓存计费逻辑请参见计费说明。 https://www.volcengine.com/docs/82379/1396491#519c0e9e
- 前缀缓存计费逻辑请参见计费逻辑。 https://www.volcengine.com/docs/82379/1396490#f933b80f
说明
- 免费额度可以抵扣使用上下文缓存命中缓存的token、未命中缓存的token、输出产生的token,但是无法抵扣缓存上下文产生的存储费用。
模型名称 | 输入价格元/百万 token | 缓存存储元/百万 token/小时 | 缓存命中元/百万 token | 输出价格元/百万 token |
---|---|---|---|---|
doubao-1.5-pro-32k | 0.80 | 0.017 | 0.16 | 2.00 |
doubao-1.5-lite-32k | 0.30 | 0.017 | 0.06 | 0.60 |
doubao-pro-32k | 0.80 | 0.017 | 0.16 | 2.00 |
deepseek-r1-distill-qwen-32b | 1.50 | 0.017 | 0.30 | 6.00 |
deepseek-r1 | 4.00 | 0.017 | 0.80 | 16.00 |
deepseek-v3 | 2.00 | 0.017 | 0.40 | 8.00 |
TPM 保障包
对于部分模型,支持购买 TPM(Tokens Per Minute)保障包。对成功购买的保障包内,保障 token 并发。相比单纯的按token计费,可获得更高的并发,更低的延迟,更强的稳定性。
模型 | 计费项 | 输入or输出 | 单价(元) |
---|---|---|---|
doubao-1.5-pro-32k | TPM保障包(小时后付费)- 输入-每10K TPM | 输入 | 1.920 |
TPM保障包(小时后付费)- 输出-每1K TPM | 输出 | 0.480 | |
TPM保障包(包天预付费)- 输入-每10K TPM | 输入 | 23.040 | |
TPM保障包(包天预付费)- 输出-每1K TPM | 输出 | 5.760 | |
doubao-1.5-lite-32k | TPM保障包(小时后付费)- 输入-每10K TPM | 输入 | 0.72 |
TPM保障包(小时后付费)- 输出-每1K TPM | 输出 | 0.144 | |
TPM保障包(包天预付费)- 输入-每10K TPM | 输入 | 8.64 | |
TPM保障包(包天预付费)- 输出-每1K TPM | 输出 | 1.728 | |
doubao-pro-32k | TPM保障包(小时后付费)- 输入-每10K TPM | 输入 | 1.920 |
TPM保障包(小时后付费)- 输出-每1K TPM | 输出 | 0.480 | |
TPM保障包(包天预付费)- 输入-每10K TPM | 输入 | 23.040 | |
TPM保障包(包天预付费)- 输出-每1K TPM | 输出 | 5.760 | |
deepseek-r1 | TPM保障包(小时后付费)- 输入-每10K TPM | 输入 | 9.60 |
TPM保障包(小时后付费)- 输出-每1K TPM | 输出 | 3.84 | |
TPM保障包(包天预付费)- 输入-每10K TPM | 输入 | 115.20 | |
TPM保障包(包天预付费)- 输出-每1K TPM | 输出 | 46.08 | |
deepseek-v3 | TPM保障包(小时后付费)- 输入-每10K TPM | 输入 | 4.80 |
TPM保障包(小时后付费)- 输出-每1K TPM | 输出 | 1.92 | |
TPM保障包(包天预付费)- 输入-每10K TPM | 输入 | 57.60 | |
TPM保障包(包天预付费)- 输出-每1K TPM | 输出 | 23.04 |
模型单元
- 算力资源:独占的算力资源。
- 售卖方式:两种模式可叠加购买,您可依据业务流量灵活采购。
- 按月售卖
- 按小时售
说明
- 模型单元当前支持白名单内购买。
- 原有模型单元依然可以续费或退费。
- 更多说明,请参见 模型单元。 https://www.volcengine.com/docs/82379/1513690
模型名称 | 计费项 | 性能预估(TPS) | 定价(元/个) | 计费方式 |
---|---|---|---|---|
doubao-lite-4k | 模型单元(按小时) | 3000 | 60 | 后付费 |
模型单元(包月) | 3000 | 28000 | 预付费 | |
doubao-lite-32k | 模型单元(按小时) | 3000 | 60 | 后付费 |
模型单元(包月) | 3000 | 28000 | 预付费 | |
doubao-lite-128k | 模型单元(按小时) | 4500 | 240 | 后付费 |
模型单元(包月) | 4500 | 112000 | 预付费 | |
doubao-pro-4k | 模型单元(按小时) | 3200 | 160 | 后付费 |
模型单元(包月) | 3200 | 80000 | 预付费 | |
doubao-pro-32k | 模型单元(按小时) | 3200 | 160 | 后付费 |
模型单元(包月) | 3200 | 80000 | 预付费 | |
doubao-pro-128k | 模型单元(按小时) | 3500 | 1200 | 后付费 |
模型单元(包月) | 3500 | 550000 | 预付费 |
批量推理
火山方舟大语言模型(全部)和视觉理解模型(仅doubao1.5-vision-pro-32k)支持批量推理。批量推理计费单价与在线推理后付费价格一致。您仅需为已处理的请求消耗的 token 量付费,具体用量可在批量推理任务详情页「Tokens 使用量」查看。
注意
- 为了进一步释放技术红利,下表中 Doubao 1.5 系列模型和 Deepseek 系列模型,批量推理价格下调为在线推理价格的50%(2025年3月7日00:00起生效)。
- 批量推理将在2025年4月14日21:00开始支持透明前缀缓存能力,无需任何配置,即可在下表中模型的批量推理服务上享受前缀缓存技术应用带来的费用降低(输入的 token 会命中缓存,命中缓存的 token 费用会是未命中缓存 token 费用的4折)。
模型分类 | 模型名称 | 免费额度抵扣 | 输入元/百万token | 输出元/百万token | 缓存命中元/百万token |
---|---|---|---|---|---|
大语言模型 | doubao-1.5-pro-32k(基础模型/精调后模型) | 不支持 | 0.40 | 1.00 | 0.16 |
大语言模型 | doubao-1.5-lite-32k(基础模型/精调后模型) | 不支持 | 0.15 | 0.30 | 0.06 |
大语言模型 | deepseek-r1 | 不支持 | 2.00 | 8.00 | 0.80 |
大语言模型 | deepseek-r1-distill-qwen-32b | 不支持 | 0.75 | 3.00 | 暂未支持,不涉及 |
大语言模型 | deepseek-r1-distill-qwen-7b | 不支持 | 0.30 | 1.20 | 暂未支持,不涉及 |
大语言模型 | deepseek-v3 | 不支持 | 1.00 | 4.00 | 0.40 |
大语言模型 | doubao-pro-32k | 不支持 | 0.80 | 2.00 | 0.16 |
大语言模型 | doubao-lite-32k | 不支持 | 0.30 | 0.60 | 0.06 |
视觉理解模型 | doubao-1.5-vision-pro-32k | 不支持 | 1.50 | 4.50 | 暂未支持,不涉及 |
模型精调
大语言模型
按 token 使用量(训练文本*训练迭代次数)计费,训练完成后出账,按量后付费。
模型 | 服务类型 | 定价元/千 token | 计费方式 |
---|---|---|---|
doubao-lite-32k | 模型精调(LoRA) | 0.03 | 后付费 |
doubao-pro-32k | 模型精调(LoRA) | 0.05 | 后付费 |
1. 豆包大模型使用入口在哪里?
目前豆包大模型对接需通过字节自营平台“火山引擎”完成。
2.有何特点?
doubao-1.5-thinking-pro 拥有更加突出的深度思考能力
3.官方文档
How do you feel about豆包大模型