豆包大模型1.6正式发布:跻身全球第一梯队,支持1080P高品质视频生成

6月12日消息,字节跳动旗下火山引擎在FORCE原动力大会上正式发布豆包大模型1.6,标志着其在AI领域的技术实力迈入全球第一梯队。此次升级不仅大幅提升了推理、数学、指令遵循等能力,还推出了豆包·视频生成模型Seedance 1.0 pro豆包·语音播客模型,进一步拓展了多模态AI的应用场景。

核心升级亮点

  1. 模型能力突破豆包1.6系列包含三个版本:豆包1.6(支持on/off/auto三种思考模式)豆包1.6-thinking(强化推理能力,在GPQA Diamond测试中达81.5分,AIME25数学测评达86.3分)豆包1.6-flash(极速响应,延迟低至10ms)。支持256K长上下文,具备深度思考、多模态理解及图形界面(GUI)操作能力,可自动执行复杂任务,如酒店预订、票据整理等。
  2. 视频生成能力全球领先Seedance 1.0 pro支持文字/图片输入,可生成1080P高清视频,具备多镜头切换、运动稳定性和自然画面表现。在Artificial Analysis评测中,该模型在文生视频、图生视频两项任务中均排名第一,超越谷歌Veo3、可灵2.0等竞品。价格极具竞争力,生成5秒1080P视频仅需3.67元,为行业最低。
  3. 语音播客模型上线可秒级生成双人对话式播客,支持自然插话、附和等交互元素,效果媲美真人。

商业化与行业应用

  • 定价创新:豆包1.6采用按输入长度区间定价,0-32K上下文输入仅0.8元/百万tokens,综合成本较前代降低63%。
  • 行业渗透:已服务全球TOP10手机厂商中的9家、80%主流汽车品牌、70%系统重要性银行及超50%的985高校。
  • 日均调用量达16.4万亿tokens,较去年增长137倍,占据中国公有云大模型市场46.4%的份额。

未来展望

火山引擎总裁谭待表示,AI时代的主体将从“APP”转向“Agent”,豆包大模型将持续迭代,推动AI Agent的规模化应用7。此次升级不仅巩固了字节跳动在AI领域的领先地位,也为企业及开发者提供了更高效、低成本的AI解决方案。

image.png

豆包大模型1.6正式发布:跻身全球第一梯队,支持1080P高品质视频生成

6月12日消息,字节跳动旗下火山引擎在FORCE原动力大会上

长按识别二维码