尽管 OpenAI 的 GPT-4 模型从相同的基础开始,但它们存在一些显著的差异,这意味着它们比其他任务更适合某些任务,更不用说访问它们所涉及的成本了。
那么,OpenAI 的 GPT-4 模型有什么不同?
GPT-4 与 GPT-4o 与 GPT-4o mini
OpenAI 的 GPT-4 模型包含多个变体,每个变体旨在满足不同的需求。以下是 GPT-4、GPT-4o (Omni) 和 GPT-4o mini 之间的差异概述。
GPT-4 是基础模型。它可以理解并生成复杂的句子,适用于各种应用,例如创意写作、数据分析、语言翻译和代码生成。借助 GPT-4 的 23,000-25,000 字上下文窗口,您还可以附加多个长文档并让它们回答有关您上传文件的任何疑问。由于这是该系列的基础模型,您还可以在 GPT-4 Turbo 和 GPT-4o 上访问 GPT-4 的所有有用功能。
GPT-4o迷你
GPT-4o mini 是一种小型语言模型 (SLM),可与许多大型语言模型 (LLM) 相媲美。尽管 GPT-4o mini 是在较小且更具体的数据集上进行训练的,但它在一些关键领域(例如响应速度和免费用户访问)表现优于 GPT-4。
然而,尽管 GPT-4o mini 被设计为多模态模型,但其当前的 ChatGPT 版本仅支持文本,无法使用视觉或音频。此外,与 GPT-4 和 GPT-4o 不同,ChatGPT 不允许 GPT-4o mini 附加文件。目前尚不清楚 ChatGPT 是否会在未来允许 GPT-4o mini 实现多模态功能。
GPT-4o
GPT-4o(“o”代表“omni”)是 GPT-4 系列模型的最新成员,也是 ChatGPT Free 和 Plus 用户的默认选择模型。该模型比 GPT-4 更智能,速度快四倍,非常适合实时应用。
GPT-4o 是该系列中的第一个多模态模型,能够分析各种文件格式,例如文本、音频、图像和视频,并且可以在 ChatGPT 中生成文本和图像。
此外,OpenAI 允许免费用户有限度地访问 GPT-4o,每 3 小时发送 16 条消息。此后,ChatGPT 将恢复使用 GPT-3.5。
以下是每个 GPT-4 模型的细分:
除了成本、响应时间和上下文窗口之外,我还为每个模型添加了准确度基准,以帮助比较各种任务的准确度。基准测试包括用于测试学术知识的 MMLU、用于评估一般知识的 GPQA、用于评估模型编码能力的 HumanEval 和用于解决数学问题的 MATH。在每个测试中,分数越高越好。
您应该使用哪种 GPT-4 模型?
选择正确的模型取决于您的特定需求和您打算执行的任务的性质。
GPT-4o 是该系列中最强大的模型。它在所有基准测试中都拥有最高的准确率,并且很可能在任何交互中都表现最佳。但是,您可以向 GPT-4o 发送的消息数量是有限的,尤其是对于免费套餐用户而言。这一限制是您仍应升级到 ChatGPT Plus 的一个关键原因。
不过,最好将 GPT-4o 保留用于需要多模态输入和输出的交互或需要最高准确度的情况。由于 GPT-4o mini 在数学、学术知识、编码和一般知识方面的表现优于 GPT-4,因此应将此模型用于需要更高精度的基于文本的查询。
在需要附加文档、PDF 和音频等文件的情况下,请使用 GPT-4 模型。
暂无评论