http://www.7klian.com

Claude 3全球最强AI模子本领更靠近人类,强在哪?

Anthropic宣布了全新系列模子Claude 3,声称不只比GPT-4更强大,尚有着迫近人类的领略本领。

Anthropic推出全新模子「Claude 3」,比GPT-4更强大

获亚马逊、Google投资的Anthropic,本周颁发了Claude 3系列模子,号称优于包罗GPT-4在内的所有竞争敌手,是今朝最快最强大的模子,甚至在某些任务上揭示「靠近人类」的本领。

「本日,我们公布推出Claude 3系列模子,它对遍及的认知任务(cognitive tasks)奠基了新的财富尺度。」Anthropic在官网上暗示。

Anthropic宣布模子别离有Claude 3 Haiku、Claude 3 Sonnet及Claude 3 Opus三种型号,机能以低到高分列,针对差异的需求、本钱提供用户选择。今朝Opus和Sonnet可以在Claude.ai上及Claude API中利用,不外Opus需要订阅每月20美元的Claude Pro才气利用,Haiku则即将推出。

Anthropic给以了各个模子差异的定位:

  • Claude 3 Opus:是Anthropic最为先进的模子,拥有迫近人类领略本领及流通性,用于极为巨大的任务及开放式的提示词。

  • Claude 3 Sonnet:是智慧水平与速度之间取得均衡的模子,有着比同类产物更实惠、高CP的表示,专为大局限利用AI时所需的高耐用性设计

  • Claude 3 Haiku:最小轻巧、快速的模子,有着近乎即时的回应本领,可以或许快速答复简朴问题,用于与用户的即时互动。

Anthropic声称,在大大都的测试方面,这次宣布中最强大的Opus都优于台面上的各大AI模子,包罗大学水准的专家常识(MMLU)、研究生水准的专业推理(GPQA)、基本数学( GSM8K)等都取得逾越GPT在内各家AI模子的后果,而且在巨大任务上表示出靠近人类水准的领略本领及流通水平。


图/ Anthropic

同时在视觉本领上,Claude 3系列模子也有着与竞争敌手相当的表示,可以处理惩罚从照片、图表到技能图表等巨大的视觉内容。

Anthropic指出,很多客户的常识库里高出一半都是PDF、流程图和投影片等各类范例的视觉内容,他们很兴奋能为客户提供这种新的模态。值得留意的是,固然Claude 3系列模子可以处理惩罚图像,但不会生成图像内容。


图/ Anthropic

按照《CNBC》报导,Anthropic指出Claude 3约莫可以处理惩罚约15万个单字(20万代币)的文本,,相当于一本《白鲸记》或《哈利波特:死神的圣物》,已往的版本只能处理惩罚约7.5万个单字。

而在Anthropic揭破的资料中,最轻量级的Haiku可以在不到3秒的时间内,处理惩罚完包括各类巨大图表、字符量1万代币局限的研究论文。

而在价值方面,Anthropic为Opus开出输入15美元/每百万代币、输出75美元/每百万代币的用度,这个价值远高于GPT-4 Turbo输入10美元/每百万代币,输出30美元/每百万代币,或者也代表着Anthropic对自家模子的足具信心。

大幅低落模子「幻觉率」,Anthropic致力让Claude 3更安详

谈天呆板人很容易受到误导、可能对问题领略不充实而答复出假造的答覆,这个环境被称为「幻觉」(hallucination),也被认为是催生假动静的大概源头。

Anthropic也试图透过出Claude 3办理这个问题,声称在测试一系列出格刁难、巨大的问题时,Opus模子答复的正确率已经到达旧模子的两倍以上,大幅淘汰了错误回应的比例。不外他们也坦承完全办理这个问题并不容易,「幻觉率要到达零长短常坚苦的。」Anthropic总裁阿莫戴(Daniela Amodei)暗示。


谈天呆板人很容易受到误导、可能对问题领略不充实而答复出假造的答覆,这个环境被称为「幻觉」(hallucination),也被认为是催生假动静的大概源头。

「没有一个模子是完美的,我认为应该要事先说清楚。」阿莫戴强调,「我们倾尽全力让模子更安详、强大,虽然照旧有些时候会假造回应。」

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。