神秘上线！Claude2聊天机器人能否成为ChatGPT的最强大对手？

文章主题：整理, 屠敏, CSDN, Claude 2

整理 | 屠敏

出品 | CSDN（ID：CSDNnews）

令人期待的是，一款名为Claude 2的聊天机器人已经问世。它不仅具备编写代码的能力，还能分析文本和撰写文章，而且对中文有着出色的理解能力。

Claude 2 的聊天机器与 OpenAI 之间存在着一定的联系。事实上，Claude 2 是由 OpenAI 的前高级成员 Daniela Amodei 和 Dario Amodei 在离开 OpenAI 后所创立的 Anthropic 公司所研发的。

在今年的3月份，Anthropic这家成立仅两年的公司推出了Claude的首个版本。当时，在经过一番测试之后，许多媒体立即将其视为”ChatGPT最强大的竞争对手”。

为什么这么说？

在对Claude 2的最新版本进行深入了解之后，我们发现用户现在可以轻松地通过Anthropic网站提前体验到Claude 2的功能，而无需经历漫长等待“候选名单”的过程。然而，目前这个便捷的使用方式仅限于美国区和英国地区的用户。

在使用某些功能时，您可能需要支付额外的费用。例如，要使用ChatGPT Plus服务，您需支付20美元。然而，令人欣慰的是，Claude 2用户可以免费使用这些功能。

而且，Anthropic 声称 Claude 2 在三个关键领域展示了进步：编码、数学和推理。他们在博客中写道：” 我们最新的模型在律师考试多项选择部分的得分为 76.5%，高于 Claude 1.3 的 73.0%。与申请研究生院的大学生相比，Claude 2 在 GRE 阅读和写作考试中的得分高于 90%，在定量推理方面与申请者的中位数类似。”

在探讨Claude 2与ChatGPT之间的对比时，人们常常问及Claude 2是否有可能超越ChatGPT。作为一款备受瞩目的AI技术产品，CSDN在第一时间就进行了深度体验和评测。

自我介绍

话不多说，先让大家对它有个基础的了解：

像其他聊天机器人一样，Claude 2具备各种功能，如上文所述，它还增添了一项名为”信息检索与提取”的特性。

相较于 Google Bard，Claude 2 至少具备处理中文的能力，然而在理解复杂内容方面仍存在一定局限。

稍微尖锐一些的话题，当问及 Claude 2 ，它和 ChatGPT 相比有何优势时，Claude 2 直白地拒绝做比较。同时，不知道是不是中文能力不太好，在回答问题的过程中出现了一些不明所以的数字内容。当问及它时，它也进行了解释，” 数字就是一段无意义的数字串。”

编码

根据 Anthropic 官方表述，在编码能力方面，Claude 2 表现出熟练程度的提高。它在 Python 编程测试 Codex HumanEval 上的得分从 56% 上升到 71.2%。

先来一道简单的编码问题。

问：用 Python 实现冒泡排序

Claude 2 最终会对代码思路进一步讲解，方便即使不太精通代码的用户也能了解。

提问：

Claude 2：

#include <iostream>#include <cmath>

class Complex {public: double real; double imag;

Complex ( double real = 0.0, double imag = 0.0 ) { this->real = real; this->imag = imag; }

// 复数加法 Complex operator+ ( const Complex& other ) { return Complex ( real + other.real, imag + other.imag ) ; }

// 复数减法 Complex operator- ( const Complex& other ) { return Complex ( real – other.real, imag – other.imag ) ; }

// 复数乘法 Complex operator* ( const Complex& other ) { return Complex ( real*other.real – imag*other.imag, real*other.imag + imag*other.real ) ; }

// 复数除法 Complex operator/ ( const Complex& other ) { double r = other.real; double i = other.imag; double denominator = r*r + i*i; return Complex ( ( real*r + imag*i ) /denominator, ( imag*r – real*i ) /denominator ) ; }

// 复数乘方 Complex pow ( int exponent ) { double r = pow ( abs ( ) , exponent ) * cos ( exponent * arg ( ) ) ; double i = pow ( abs ( ) , exponent ) * sin ( exponent * arg ( ) ) ; return Complex ( r, i ) ; }

// 复数取模 double abs ( ) { return sqrt ( real*real + imag*imag ) ; }

// 复数辐角 double arg ( ) { return atan2 ( imag, real ) ; }};

int main ( ) { Complex a ( 1.0, 2.0 ) ; Complex b ( 3.0, 4.0 ) ;

Complex c = a + b; Complex d = a – b; Complex e = a * b; Complex f = a / b; Complex g = a.pow ( 2 ) ;

std::cout << “c = ” << c.real << ” + ” << c.imag << “in”; std::cout << “d = ” << d.real << ” + ” << d.imag << “in”; std::cout << “e = ” << e.real << ” + ” << e.imag << “in”; std::cout << “f = ” << f.real << ” + ” << f.imag << “in”; std::cout << “g = ” << g.real << ” + ” << g.imag << “in”;

return 0;}

自动总结 PDF 文档

在查找并提取信息维度，我们通过上传一篇《Exploring Length Generalization in Large Language Models》的 PDF 论文，让其帮忙总结。

Claude 2 在响应速度和生成内容维度表现都不错，而且用中文提问，即使文档是全英文的论文，其生成的总结内容也是采用中文输出：

数学问题

同样，根据官方评测，Claude 2 在 GSM8k（一项包含小学数学问题的测试）上，它的得分从 85.2% 提高到 88%。

那我们便以经典的鸡兔同笼问题来检测一下 Claude 2 的能力。

有些出乎意料的是，Claude 2 给出的思路是对的，但是在计算时出现了错误。当告诉它 ” 算错了 ” 时，它也会及时明白错误，并在重新输出后给出了正确的答案：

再来一题：7 年前，妈妈年龄是儿子的 6 倍，儿子今年 12 岁，妈妈今年多少岁 ?

这一次 Claude 2 没有出错。

再试试看：同学们进行广播操比赛，全班正好排成相等的 6 行。小红排在第二行，从头数，她站在第 5 个位置，从后数她站在第 3 个位置，这个班共有 ( ) 人。

几轮下来，Claude 2 在小学数学能力表现方面还不错。

ChatGPT vs Claude 2

互为竞品，我们还让 ChatGPT 给 Claude 2 出了一道题：

Claude 2 很快给出了答案：

再让 ChatGPT 来评价一下：” 非常棒的工作，Claude 2！它成功地解决了这道问题。”

闲聊

虽然 Claude 2 说自己的中文理解能力还有限制，但是我们还是忍不住地试了一下：

通过这个示例，Claude 2 表现让我们感到了惊喜。

再试一次：

还不错！

最后

整体而言，像 Claude 2 这样的人工智能模型可以分析长而复杂的作品，但 Anthropic 仍然意识到它的局限性。毕竟，语言模型有时会凭空捏造一些东西，也会像计算数学题一样出错。

而且整体体验下来，如果说其能力超过了 ChatGPT，其实还为时尚早。具体在使用时候，还是建议大家需要对输出内容自行验证，工具只能作为辅助。

最后，如果对 Claude 2 感兴趣的小伙伴，也可以通过：https://www.anthropic.com/index/claude-2 申请注册体验。

神秘上线！Claude2聊天机器人能否成为ChatGPT的最强大对手？

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号AIGC666aigc999或上边扫码，即可拥有个人AI助手！

相关文章