自从 OpenAI 的 ChatGPT 去年年底席卷全球以来,我们一直在等待不可避免的竞争的出现。今天,OpenAI 的第一个重要竞争对手登场了。继在 Google I/O 2023 上公布 Gemini AI模型后,谷歌于周二正式推出 Gemini 1.0。该公司称 Gemini 为迄今为止最大、功能最强大的模型,能够理解和组合文本、图像、音频、视频和代码。
谷歌的 Gemini 型号有三种不同的尺寸:Ultra、Pro 和 Nano。Ultra 是最大的型号,能够处理大型且复杂的任务。Pro 处于中间位置,可以扩展到多种任务。Nano 是最高效的模型,适用于设备上的任务。从数据中心到智能手机,Gemini 都能胜任这项任务。
Google 首席执行官 Sundar Pichai 和 DeepMind 首席执行官 Demis Hassabis 解释了 Gemini 与其他多模态模型的不同之处:“我们将 Gemini 设计为原生多模态,从一开始就针对不同模态进行了预训练。然后我们使用额外的多模态数据对其进行微调,以进一步完善其有效性。这有助于 Gemini 从头开始无缝地理解和推理各种输入,远远优于现有的多模式模型,而且它的功能几乎在每个领域都是最先进的。”