xAI已在X上发布了Grok-2和Grok-2minibetaAILLM,企业API将于本月晚些时候推出。Grok-2在LMSYS排行榜上位列最强大的四个大型语言模型之一,并在一系列标准化AI基准测试中位列前六。
xAI已在X上发布了Grok-2和Grok-2minibetaAI大型语言模型(LLM),企业API将于本月晚些时候推出。Grok-2的生成图像功能也通过集成BlackForestLabs的FLUX.1AI得到了扩展。第二个版本在2023年11月首次发布后近九个月推出,并可立即作为beta测试版提供给Premium和Premium+X订阅者。Grok-2LLM的API访问权限将于本月晚些时候推出。
xAI是一家专注于开发AI的初创公司,由X(前身为Twitter)的所有者埃隆·马斯克(ElonMusk)创立。该公司于2023年发布了其首个LLM,该LLM被集成到X服务中以提供AI功能。Grok-1的设计初衷并不像OpenAI的GPT-4o等竞争LLM那样令人觉醒、受到审查或枯燥无味。此类偏见会影响当今用于聊天机器人服务的所有AILLM的响应,导致种族偏见甚至荒谬的答案。值得注意的是,Grok-1已作为296GB的免费下载发布,是少数以开源软件形式发布的顶级LLM之一。
在过去的一年中,法学硕士(LLM)的性能取得了重大进步。最新版本,例如OpenAIGPT-4o和AnthropicClaude3.5Sonnet,不仅具有更强大的知识,还具有更高的性能。喜欢使用人工智能的读者可以戴上人工智能眼镜(例如亚马逊上的这些),同时为人工智能人形机器人接管家务的那一天做计划。
根据xAI内部测试,Grok-2和Grok-2minibeta在全球所有LLM中均名列前茅。xAI尚未提供最新版本Grok与最新竞争LLM的基准测试。尽管如此,Grok-2仍是LMSYS聊天机器人排行榜上最强大的四个LLM之一,并在一系列标准化AI基准测试中名列前六。
具体来说,OpenAIGPT-4o的8月版本在排行榜上超过了Grok-2的早期版本,而日期不详的AnthropicClaude3.5Sonnet则落后于Grok-2。在八个标准化AI基准测试中,较旧的5月版本GPT-4o在八次中有四次击败了Grok-2,而Claude3.5Sonnet在八次中有六次击败了Grok-2。