前沿科技
测评指南

Anthropic 推出最新模型 Claude 3.5 Sonnet,与 GPT-4o 比较如何

6 月 21 日,Anthropic 发布了新模型 Claude 3.5 Sonnet,性能超越前代 Claude 3 Opus。本文将介绍 Claude 3.5 Sonnet 的特点、使用方法、价格,并与 GPT-4o 进行比较。

Claude 3.5 Sonnet

Claude 3.5 Sonnet 的概要及与 GPT-4o 的比较

Claude 3.5 Sonnet在研究生级别推理(GPQA)、本科级别知识(MMLU)、编码熟练度(HumanEval)等基准测试中表现出色。此外,它在理解幽默和细微差别、解释复杂指示方面也有改进。生成自然口吻的高质量内容的能力也得到了增强。Claude 3.5 Sonnet的运行速度是前代旗舰型号Claude 3 Opus的两倍,性价比更高。而且价格与前代中档模型Claude 3 Sonnet相同。

Claude 3.5 Sonnet intelligence

根据自然语言指示,Claude 3.5 Sonnet在代码修复和功能添加上解决了64%的问题,远超Claude 3 Opus的38%。在Anthropic的基准测试中,除本科知识和数学任务外,Claude 3.5 Sonnet在其他任务上表现优于其他模型。

Claude 3.5 Sonnet Scores

基准测试结果显示,Claude 3.5 Sonnet整体表现优于GPT-4o、Gemini 1.5 Pro和Llama-400b。

在视觉信息测试中,Claude 3.5 Sonnet也表现良好。

Claude 3.5 Sonnet is our strongest vision model

价格设定

Claude 3.5 Sonnet的费用为输入 100 万 Token 3 美元,输出 100 万 Token 15 美元,支持 200K Token 的上下文窗口。相比之下,GPT-4o 的输入费用为输入100 万 Token 5 美元,支持 128K Token 的上下文窗口。

就是说,Claude 3.5 Sonnet 有更长的上下文窗口和更便宜的输入费用,但 GPT-4o 在语言优化上有优势,不过呢,实际使用时价格优劣未定。

Artifacts 功能

新引入的 Artifacts 功能支持 AI Devbin!允许在专用窗口中实时查看、编辑和构建代码片段、文档和网页设计等生成物。即,可生成 「Artifacts」即代码库并可以即时预览与迭代,和生成 PPT、在线网站、甚至游戏!此功能为在项目和工作流程中使用 AI 生成内容提供了更高效的工作环境。

使用方法 Claude 3.5 Sonnet 可以在 Claude.ai 和 Claude iOS 应用上免费使用。使用 Claude 聊天时默认选择 Claude 3.5 Sonnet。加入Claude Pro或Team计划的用户,可以享受更高的使用限制。此外,还可以通过 Anthropic API、Amazon Bedrock 和 Google Cloud Vertex AI 使用。

总结

Claude 3.5 Sonnet 性能远超前代模型,并优于 GPT-4o 等其他模型。它的输入费用更低,且拥有更长的上下文窗口,性价比更高。Claude 3.5 Sonnet 在自然语言和视觉信息处理上,预期将成为新一代高质量内容生成和问题解决的强大工具。

赞(1)
版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
文章名称:《Anthropic 推出最新模型 Claude 3.5 Sonnet,与 GPT-4o 比较如何》
文章链接:https://topstip.com/anthropic-releases-latest-model-claude-3-5-sonnet/
转载说明:请注明来自“TopsTip”并加入转载内容页的超链接。
本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。

评论 抢沙发

登录

找回密码

注册