Claude 3全球最强AI模子本领更靠近人类，强在哪？

Anthropic宣布了全新系列模子Claude 3，声称不只比GPT-4更强大，尚有着迫近人类的领略本领。

Anthropic推出全新模子「Claude 3」，比GPT-4更强大

获亚马逊、Google投资的Anthropic，本周颁发了Claude 3系列模子，号称优于包罗GPT-4在内的所有竞争敌手，是今朝最快最强大的模子，甚至在某些任务上揭示「靠近人类」的本领。

「本日，我们公布推出Claude 3系列模子，它对遍及的认知任务（cognitive tasks）奠基了新的财富尺度。」Anthropic在官网上暗示。

Anthropic宣布模子别离有Claude 3 Haiku、Claude 3 Sonnet及Claude 3 Opus三种型号，机能以低到高分列，针对差异的需求、本钱提供用户选择。今朝Opus和Sonnet可以在Claude.ai上及Claude API中利用，不外Opus需要订阅每月20美元的Claude Pro才气利用，Haiku则即将推出。

Anthropic给以了各个模子差异的定位：

Claude 3 Opus：是Anthropic最为先进的模子，拥有迫近人类领略本领及流通性，用于极为巨大的任务及开放式的提示词。
Claude 3 Sonnet：是智慧水平与速度之间取得均衡的模子，有着比同类产物更实惠、高CP的表示，专为大局限利用AI时所需的高耐用性设计
Claude 3 Haiku：最小轻巧、快速的模子，有着近乎即时的回应本领，可以或许快速答复简朴问题，用于与用户的即时互动。

Anthropic声称，在大大都的测试方面，这次宣布中最强大的Opus都优于台面上的各大AI模子，包罗大学水准的专家常识（MMLU）、研究生水准的专业推理（GPQA）、基本数学（ GSM8K）等都取得逾越GPT在内各家AI模子的后果，而且在巨大任务上表示出靠近人类水准的领略本领及流通水平。

图/ Anthropic

同时在视觉本领上，Claude 3系列模子也有着与竞争敌手相当的表示，可以处理惩罚从照片、图表到技能图表等巨大的视觉内容。

Anthropic指出，很多客户的常识库里高出一半都是PDF、流程图和投影片等各类范例的视觉内容，他们很兴奋能为客户提供这种新的模态。值得留意的是，固然Claude 3系列模子可以处理惩罚图像，但不会生成图像内容。

图/ Anthropic

按照《CNBC》报导，Anthropic指出Claude 3约莫可以处理惩罚约15万个单字（20万代币）的文本，，相当于一本《白鲸记》或《哈利波特：死神的圣物》，已往的版本只能处理惩罚约7.5万个单字。

而在Anthropic揭破的资料中，最轻量级的Haiku可以在不到3秒的时间内，处理惩罚完包括各类巨大图表、字符量1万代币局限的研究论文。

而在价值方面，Anthropic为Opus开出输入15美元/每百万代币、输出75美元/每百万代币的用度，这个价值远高于GPT-4 Turbo输入10美元/每百万代币，输出30美元/每百万代币，或者也代表着Anthropic对自家模子的足具信心。

大幅低落模子「幻觉率」，Anthropic致力让Claude 3更安详

谈天呆板人很容易受到误导、可能对问题领略不充实而答复出假造的答覆，这个环境被称为「幻觉」（hallucination），也被认为是催生假动静的大概源头。

Anthropic也试图透过出Claude 3办理这个问题，声称在测试一系列出格刁难、巨大的问题时，Opus模子答复的正确率已经到达旧模子的两倍以上，大幅淘汰了错误回应的比例。不外他们也坦承完全办理这个问题并不容易，「幻觉率要到达零长短常坚苦的。」Anthropic总裁阿莫戴（Daniela Amodei）暗示。