Bard 是谷歌对人工智能爆炸的回应,人工智能正在迅速成为本世纪最具颠覆性的技术。生成式 AI 聊天机器人正在改变我们与技术互动的方式,科技巨头正争先恐后地分一杯羹。

让我们评估一下 Google 的努力有多好,因为我们将其与 ChatGPT 进行了正面交锋。

比较底层技术

在我们比较平台之前,了解底层技术很有用。两者都依赖大型语言模型 (LLM) 来生成“类人”响应。

这个复杂主题的简单定义可以是——LLM 是一种机器学习模型,旨在执行自然语言处理 (NLP) 任务。NLP 任务包括生成问题的对话答桉。

Google Bard 和 ChatGPT 在不同的 LLM 上运行:

  • GPT-3.5 (ChatGPT):GPT-3.5 LLM 是启动生成式 AI 聊天机器人的催化剂。该模型的一个问题是数据集的年龄。尽管它收到了一些主题更新,但该模型的数据集仅限于 2021 年。
  • LaMDAGoogle Bard:Bard 使用 Google 专有的 LLM,称为 LaMDA。最新版本的数据集包含超过 1.56 万亿个单词,几乎是 LaMDA 之前使用的单词的 40 倍。除了更新信息,Bard 还通过 Google 搜索访问实时信息。

让我们看看这两个模型的实际应用并分析它们的性能。

测试 ChatGPT  Google Bard

为了测试这些工具,我们设计了一个练习来比较它们在各种指标上的表现。但在我们深入研究细节之前,首先让工具在你的机器上运行。

  • ChatGPT:你可以通过 OpenAI 官网访问ChatGPT 。你只需在 OpenAI 上创建一个帐户即可开始使用。
  • Google Bard:你可能需要加入候补名单才能访问需要 Google 帐户的 Google Bard。您可以在Google Bard官方网站上注册或加入候补名单。

注册这两种工具都很简单,但如果你正在寻找即时访问,Google Bard 等候名单会很不方便。

比较 Google Bard  ChatGPT 的准确性

两个聊天机器人都很快指出,他们的回答的准确性不应该只看表面价值。尽管如此,由于可以访问实时信息,Google Bard 应该具有明显的优势。第一个测试旨在验证这个前提。

但公平地说,我们还将测试它们在不需要主题信息的主题上的准确性。

我们首先向这两种工具提出一个简单的问题——“有多少球迷参加了 2022 年卡塔尔世界杯?”

Google Bard 的回复为我们提供了精确的数字并添加了一些其他的出勤统计数据。

ChatGPT 无法提供最新信息。

接下来,我们尝试在非主题数据上进行测试。我们要求两个聊天机器人回答这个问题——“开车到太阳需要多长时间?”

首先是谷歌吟游诗人;它回答了一些全面的细节。

我们对 ChatGPT 的回应感到非常失望。这应该被认为是一个假设性的问题,结果只需要一些基本的算术。

为了给 ChatGPT 第二次机会,我们改写了问题的措辞并问道:“我以 65mph 的速度到达太阳需要多长时间?”

这次它确实产生了一些有意义的数字,但它把这个数字四舍五入到 150 万小时,导致答复之间相差八年。然而,造成这种差异的原因可能是地球与太阳之间的距离不同。

该测试表明,你在设计问题时仍然需要发挥创造力,才能从 ChatGPT 获得最佳结果。此外,你需要仔细检查所提供数据的完整性。

比较 Google Bard  ChatGPT 的创造力

测试这些工具的创意输出质量比较棘手。没有可以直接比较的创造力滑动尺度。因此,我们将设置相同的创意任务,并对答桉的比较情况做出个人判断。

我们要求这两种工具以 William McGonagall(一位以烂诗闻名的苏格兰诗人)风格创作一首关于聊天机器人的短诗。

Google Bard 给了我们这个:

与下面的 ChatGPT 答桉相比,这是平澹无奇的。

虽然这绝不是一个广泛的测试,但这个例子展示了我们发现的总体情况——ChatGPT 比 Google Bard 更擅长创造性任务。

哪个适合我:ChatGPT 还是 Google Bard

为工具提供支持的不同 LLM 是工具执行方式的基础。它们是测试响应差异的关键原因,每个都有自己的优点和缺点。在它们之间进行选择可能更多地取决于用户意图而不是用户偏好。

一些决定性因素包括:

  • 准确性:如果你正在寻找真实和实时的信息,那么绝对赢家一定是 Google Bard。由于与 Google 搜索的直接链接,使用 Google Bard 核查信息也更容易。但是,这两种工具都缺乏指向引用信息的直接链接。
  • 创造力:我们发现 ChatGPT 能够产生更有创意的答桉。如果你正在寻找写作建议和帮助,ChatGPT 是更好的选择。
  • 安全和安全:ChatGPT 的在线安全性一直受到关注,它使用被动的安全方法。换句话说,安全问题在出现时得到处理。Google Bard 确实有更主动的方法,但仍然使用反馈来改进流程。如果你有安全顾虑,您的孩子可以通过多种方式安全地使用 ChatGPT。
  • 易用性:这两种工具都易于使用,你与它们的交互方式也相似。但是,你的提示没有后续建议,这是我们期望 Google Bard 提供的功能。当你将 Bard 与 Microsoft 的 Bing Chat 进行比较时,这一点的相关性会更加重要。

两者都是免费的,所以最好的建议是试用它们,看看哪种适合你。我们的经验告诉我们,这两个平台都有自己的位置,你选择哪个平台很大程度上取决于你的搜索意图范围。

功能强大但仍不完美的工具

两个平台都有很多粗糙的边缘,这是可以预料的。这是一项新技术,两者都是现场测试程序在公开场合出错的例子。硬币的另一面是,如此广泛的使用及其产生的反馈将加速这两种模型的发展。

我们正处于一场技术革命的开端,这场革命的破坏性如此之大,尽管有很多猜测,但其许多影响仍有待确定。但毫无疑问,像 Bard 和 ChatGPT 这样的工具将改变我们工作、休息和娱乐的方式。