久冉科技

热点

浙商证券:OpenAI谷歌相继发力 有望引领多模态大模型浪潮

时间:2024-02-17 22:01 阅读:

  OpenAI 发布文生模型 Sora,可遵循用户的指示生成长达一分钟的,并保持

  近日,OpenAI 发布文生模型 Sora,可遵循用户的指示生成长达一分钟的,并保持

  OpenAI 发布 Sora 文生模型,可生成最长一分钟

  北京时间 2024 年 2 月 16 日,OpenAI 发布文生模型 Sora,可遵循用户的指示生成长达一分钟的,并保持

  Sora 模型基于 DALL-E 和 GPT 模型研究成果,可实现加工、拼接等功能

  除了基于文本生成的能力,Sora 模型也可以接受其他输入,例如预先存在的图像或。Sora 能够执行多种图像和

  OpenAI 官方技术文档指出,研究人员探索了生成模型在数据上的大规模训练,并在时长、分辨率和宽高比可变的和图像上联合训练了文本条件下的扩散模型。与大语言模型使用文本 Token 不同的是,Sora 模型使用了

  谷歌发布 Gemini 1.5 Pro 大模型,长文本及多模态推理能力出色

  美国时间 2024 年 2 月 15 日,谷歌发布基于 MoE 架构的 Gemini 1.5 Pro 大模型,是基于前期发布的 Gemini 1.0 Pro 的更新版本。大模型在处理 530,000 token 文本时,能够实现 100%的检索完整性,在处理 1,000,000 token 的文本时也可达到 99.7% 的检索完整性。在多模态能力方面,Gemini 1.5 Pro 能够分别在约 11 小时的音频资料和大约 3 小时的内容中,100%成功检索到各种隐藏的音频片段或

  看好 2024 年多模态大模型以及大模型在 3D 建模、领域迎来爆发

  我们在 2023 年 11 月 15 日发布的