文章主题:整理, 屠敏, CSDN, Claude 2

666AI工具大全,助力做AI时代先行者!

整理 | 屠敏

出品 | CSDN(ID:CSDNnews)

令人期待的是,一款名为Claude 2的聊天机器人已经问世。它不仅具备编写代码的能力,还能分析文本和撰写文章,而且对中文有着出色的理解能力。

Claude 2 的聊天机器与 OpenAI 之间存在着一定的联系。事实上,Claude 2 是由 OpenAI 的前高级成员 Daniela Amodei 和 Dario Amodei 在离开 OpenAI 后所创立的 Anthropic 公司所研发的。

在今年的3月份,Anthropic这家成立仅两年的公司推出了Claude的首个版本。当时,在经过一番测试之后,许多媒体立即将其视为”ChatGPT最强大的竞争对手”。

为什么这么说?

在对Claude 2的最新版本进行深入了解之后,我们发现用户现在可以轻松地通过Anthropic网站提前体验到Claude 2的功能,而无需经历漫长等待“候选名单”的过程。然而,目前这个便捷的使用方式仅限于美国区和英国地区的用户。

在使用某些功能时,您可能需要支付额外的费用。例如,要使用ChatGPT Plus服务,您需支付20美元。然而,令人欣慰的是,Claude 2用户可以免费使用这些功能。

而且,Anthropic 声称 Claude 2 在三个关键领域展示了进步:编码、数学和推理。他们在博客中写道:” 我们最新的模型在律师考试多项选择部分的得分为 76.5%,高于 Claude 1.3 的 73.0%。与申请研究生院的大学生相比,Claude 2 在 GRE 阅读和写作考试中的得分高于 90%,在定量推理方面与申请者的中位数类似。”

在探讨Claude 2与ChatGPT之间的对比时,人们常常问及Claude 2是否有可能超越ChatGPT。作为一款备受瞩目的AI技术产品,CSDN在第一时间就进行了深度体验和评测。

自我介绍

话不多说,先让大家对它有个基础的了解:

像其他聊天机器人一样,Claude 2具备各种功能,如上文所述,它还增添了一项名为”信息检索与提取”的特性。

相较于 Google Bard,Claude 2 至少具备处理中文的能力,然而在理解复杂内容方面仍存在一定局限。

稍微尖锐一些的话题,当问及 Claude 2 ,它和 ChatGPT 相比有何优势时,Claude 2 直白地拒绝做比较。同时,不知道是不是中文能力不太好,在回答问题的过程中出现了一些不明所以的数字内容。当问及它时,它也进行了解释,” 数字就是一段无意义的数字串。”

编码

根据 Anthropic 官方表述,在编码能力方面,Claude 2 表现出熟练程度的提高。它在 Python 编程测试 Codex HumanEval 上的得分从 56% 上升到 71.2%。

先来一道简单的编码问题。

问:用 Python 实现冒泡排序

Claude 2 最终会对代码思路进一步讲解,方便即使不太精通代码的用户也能了解。

提问:

Claude 2:

#include <iostream>#include <cmath>

class Complex {public: double real; double imag;

Complex ( double real = 0.0, double imag = 0.0 ) { this->real = real; this->imag = imag; }

// 复数加法 Complex operator+ ( const Complex& other ) { return Complex ( real + other.real, imag + other.imag ) ; }

// 复数减法 Complex operator- ( const Complex& other ) { return Complex ( real – other.real, imag – other.imag ) ; }

// 复数乘法 Complex operator* ( const Complex& other ) { return Complex ( real*other.real – imag*other.imag, real*other.imag + imag*other.real ) ; }

// 复数除法 Complex operator/ ( const Complex& other ) { double r = other.real; double i = other.imag; double denominator = r*r + i*i; return Complex ( ( real*r + imag*i ) /denominator, ( imag*r – real*i ) /denominator ) ; }

// 复数乘方 Complex pow ( int exponent ) { double r = pow ( abs ( ) , exponent ) * cos ( exponent * arg ( ) ) ; double i = pow ( abs ( ) , exponent ) * sin ( exponent * arg ( ) ) ; return Complex ( r, i ) ; }

// 复数取模 double abs ( ) { return sqrt ( real*real + imag*imag ) ; }

// 复数辐角 double arg ( ) { return atan2 ( imag, real ) ; }};

int main ( ) { Complex a ( 1.0, 2.0 ) ; Complex b ( 3.0, 4.0 ) ;

Complex c = a + b; Complex d = a – b; Complex e = a * b; Complex f = a / b; Complex g = a.pow ( 2 ) ;

std::cout << “c = ” << c.real << ” + ” << c.imag << “in”; std::cout << “d = ” << d.real << ” + ” << d.imag << “in”; std::cout << “e = ” << e.real << ” + ” << e.imag << “in”; std::cout << “f = ” << f.real << ” + ” << f.imag << “in”; std::cout << “g = ” << g.real << ” + ” << g.imag << “in”;

return 0;}

自动总结 PDF 文档

在查找并提取信息维度,我们通过上传一篇《Exploring Length Generalization in Large Language Models》的 PDF 论文,让其帮忙总结。

Claude 2 在响应速度和生成内容维度表现都不错,而且用中文提问,即使文档是全英文的论文,其生成的总结内容也是采用中文输出:

数学问题

同样,根据官方评测,Claude 2 在 GSM8k(一项包含小学数学问题的测试)上,它的得分从 85.2% 提高到 88%。

那我们便以经典的鸡兔同笼问题来检测一下 Claude 2 的能力。

有些出乎意料的是,Claude 2 给出的思路是对的,但是在计算时出现了错误。当告诉它 ” 算错了 ” 时,它也会及时明白错误,并在重新输出后给出了正确的答案:

再来一题:7 年前,妈妈年龄是儿子的 6 倍,儿子今年 12 岁,妈妈今年多少岁 ?

这一次 Claude 2 没有出错。

再试试看:同学们进行广播操比赛,全班正好排成相等的 6 行。小红排在第二行,从头数,她站在第 5 个位置,从后数她站在第 3 个位置,这个班共有 ( ) 人。

几轮下来,Claude 2 在小学数学能力表现方面还不错。

ChatGPT vs   Claude 2

互为竞品,我们还让 ChatGPT 给 Claude 2 出了一道题:

  Claude 2 很快给出了答案:

再让 ChatGPT 来评价一下:” 非常棒的工作,Claude 2!它成功地解决了这道问题。”

闲聊

虽然 Claude 2 说自己的中文理解能力还有限制,但是我们还是忍不住地试了一下:

通过这个示例,Claude 2 表现让我们感到了惊喜。

再试一次:

还不错!

最后

整体而言,像 Claude 2 这样的人工智能模型可以分析长而复杂的作品,但 Anthropic 仍然意识到它的局限性。毕竟,语言模型有时会凭空捏造一些东西,也会像计算数学题一样出错。

而且整体体验下来,如果说其能力超过了 ChatGPT,其实还为时尚早。具体在使用时候,还是建议大家需要对输出内容自行验证,工具只能作为辅助。

最后,如果对 Claude 2 感兴趣的小伙伴,也可以通过:https://www.anthropic.com/index/claude-2 申请注册体验。

神秘上线!Claude2聊天机器人能否成为ChatGPT的最强大对手?

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号AIGC666aigc999或上边扫码,即可拥有个人AI助手!