馬斯克 的首款多模態大模型來了,GPT-4V又被超越了
科技2024-04-15
智者2024年4月15日消息,自從 2023 年 11 月 Grok 首次亮相以來,馬斯克的 xAI 正在大模型領域不斷取得進步,向 OpenAI 等先行者發起進攻。在 Grok-1 開源后不到一個月,xAI 的首個多模態模型就問世了。昨天,xAI 推出了 Grok-1.5V,該模型不僅能理解文本,還能處理文檔、圖表、截圖和照片中的內容。與上一代1.0開源版...
智者2024年4月15日消息,自從 2023 年 11 月 Grok 首次亮相以來,馬斯克的 xAI 正在大模型領域不斷取得進步,向 OpenAI 等先行者發起進攻。在 Grok-1 開源后不到一個月,xAI 的首個多模態模型就問世了。昨天,xAI 推出了 Grok-1.5V,該模型不僅能理解文本,還能處理文檔、圖表、截圖和照片中的內容。
與上一代1.0開源版本相比,Grok-1.5與GPT-4一樣加入了Vision視覺功能可以深度理解真實世界,并進行數據解讀、轉換等。例如,給出一張蒙娜麗莎的圖片,讓其講解該圖片的來歷以及故事等。
根據x.ai公布的測試數據顯示,Grok-1.5 V的真實世界理解能力超過了GPT-4V、Claude 3 Opus 、Gemini Pro 1.5等知名多模態模型。
x.ai表示,Grok-1.5 V將很快向早期的測試者和現有Grok 用戶推出。
相關文章