久冉科技

业界

火山引擎:豆包 1.5 模型表现出色 20B 参数

时间:2025-05-13 18:57 阅读:

  火山引擎在 FORCELINKAI 创新巡展·上海站发布新模型火山引擎新发布的豆包 1.5·视觉深度思考模型激活参数仅 20B,却具备强大多模态理解和推理能力。 在 60 个公开评测基准中,有 38 个取得 SOTA 表现,在理解、视觉推理、GUIAgent 能力等方面处于第一梯队,目前已在火山方舟上线。 在理解方面,支持动态帧率采样,时序定位能力显著增强,结合向量,能精准定位中与文本描述相对应的片段。 同时,新增深度思考能力,模型学习数万亿多模态标记数据,掌握广泛视觉知识,结合强化学习,视觉推理能力大幅提升。 此外,该模型新增 GUIAgent 能力,基于强大的 GUI 定位性能,可在不同环境中完成复杂交互任务,已应用于字节跳动多款 APP 产品的开发测试中。