GPT-5:OpenAI最新的世代AI模型,仍在等待中

雅加达 - GPT-4目前是市场上最好的生成AI工具,但这并不意味着我们不看未来。OpenAI首席执行官Sam Altman定期就GPT-5提供线索,似乎我们很快就会看到一款新的和改进的AI模型。

GPT-5没有具体的发布日期,但许多人认为公众可能会很快看到它。但是,无论发布何时,当GPT-5推出时,我们都希望有一些关键功能。

OpenAI的GPT-5是什么?

GPT-5是OpenAI拥有的GPT-4 AI模型的备受期待的继任者,该模型有望成为市场上最强大的生成型。虽然GPT-5的发布日期尚未正式,但有迹象表明该模型可能于2024年夏季发布。目前,有关此模型的细节很小,但可以说几件事,有一定的确定性水平:

OpenAI已与美国专利商标局一起为该名称注册了商标。

一些OpenAI高管讨论或就该模型的可能能力提出指示。

OpenAI首席执行官山姆·阿尔特曼(Sam Altman)在2024年3月对雷克斯·弗里德曼(Lex Fridman)的YouTube采访中一再提及该模型。

这一切都显示出一件惊人的事实:GPT-5即将到来!但是,此时仍有许多猜测。但是,我们预计有一些事情,并且非常有信心它将出现在此模型中。以下是其中的一些:

多元化

GPT AI 模型家族最具吸引力的改进之一是多元化。多元化是AI 模型不仅能够处理文本,还能够处理其他类型的输入,如图像、音频和视频。

多元化将成为未来GPT模型家族进步的重要里程碑。GPT-4在管理图像输入和输出方面已经精通,包括音频和视频处理在内的改进是OpenAI的下一个里程碑,GPT-5是开始的正确场所。

谷歌的双子座AI模型在这种多元化产品方面取得了重大进展。OpenAI没有回应就奇了。在他的Unconfuse Me播客[PDF转版]中,比尔·盖茨向OpenAI首席执行官山姆·阿尔特曼(Sam Altman)询问了他未来两年GPT系列的成就。答案?视频处理。

因此,对于GPT-5,预计它将与视频玩弄 - 上传视频作为请求,直接制作视频,编辑带有请求文本的视频,从视频中提取片段,并从大型视频文件中找到特定场景。我们期待与音频文件类似的事情。确实,需求量很大,是的。但是,鉴于人工智能的发展有多快,这是一个非常合理的希望。

更大、更有效的背景窗口

虽然它是市场上最先进的AI模型之一,但GPT AI模型家族的背景窗口相当小。例如,Anthropic的Claude 3的背景窗口为20万个代币,而谷歌的双子座可以处理多达100万个代币(标准使用量为128,000)。

相比之下,GPT-4具有相对较小的背景窗口,约128,000个令牌,其中约32,000个令牌或更少,实际上可用于ChatGPT等界面。

高级多元化品可成像,接近窗口的升级几乎是不可避免的。也许两到四倍的升级就足够了,但我们希望看到增加约十倍。这将使GPT-5能够以更高效益的方式处理更多信息。但是,较大的背景窗口并不总是意味着更好。因此,与其仅仅改进背景窗口,我们希望看到背景处理效率的提高。

GPT 代理

GPT-5发布的最有趣的可能性之一是GPT特工的出现。虽然“游戏规则改变者”一词在AI的背景下可能被过于频繁使用,但GPT特工实际上会从几乎任何意义上改变游戏。但是,游戏的变化有多大?

今天,GPT-4等AI模型可以帮助您完成任务。他们可以写电子邮件,玩笑,解决数学问题,或为您编制博客帖子。但是,他们只能执行某些任务,也无法完成完成完成您工作的必要一组相关任务。

假设您是一个Web开发者。作为您工作的一部分,您预计将做很多事情:设计、编码、解决问题等。目前,您只能逐步将其中一些任务委托给AI模型。也许您可以要求GPT-4模型为主页编写代码,然后要求为联系人页面,然后为“关于”页面等。您需要一再完成这些任务。并且有些任务模型无法完成。

要求特定子任务的AI模型的这个渐进的过程需要时间且效率低下。在这种情况下,您 - Web开发人员 - 是人为代理人,负责协调和要求AI模型一个任务一个任务,直到您完全完成一组相关任务。

GPT代理商承诺由GPT-5协调的特殊专家机器人,希望能够自行思考并自动处理复杂任务的所有次数。强调“自我思考”和“自主”。

因此,如果GPT-5配备了GPT代理商,您可以要求他“为Maxwell Timothy创建一个投资组合网站”,而不仅仅是“为主页编码”。GPT-5将能够通过召集专家AI代理商来要求自己处理构建网站所需的各种次要任务。

也许他打电话给一个GPT,从网络收集有关麦克斯韦·蒂莫西(Maxwell Timothy)的信息,麦克斯韦·蒂莫西(Maxwell Timothy)是另一个为不同页面编写代码的代理人,另一个用于生成和优化图像的代理人,甚至其他AI代理人也用于实施该网站,所有这些都无需重复人类的指示。

较少的幻觉

尽管OpenAI在处理AI模型中的幻觉方面取得了进展,但GPT-5的真正试验将是其克服持续幻觉问题的能力,这些幻觉阻碍了AI在医疗保健,航空和网络安全等重要和关键领域的广泛采用。

这些都是从大量的人工智能参与中受益的一个领域,但目前正在避免大量采用。

更清楚地表明,本文中的幻觉化指的是,人工智能模型产生和呈现的信息,这些信息听起来合理,但完全以高程度的信念而成真。

GPT-4集成到诊断系统中以分析患者症状和医疗报告的情况。幻觉可以使人工智能自信地提供错误的诊断或根据想象的事实和错误的逻辑推荐潜在危险的治疗方法。这种在医学领域错误的后果可能非常致命。

同样的保留措施适用于其他关键领域,如航空、核能、海事运营和网络安全。我们不希望GPT-5完全解决幻觉化问题,但我们希望它能够显着减少此类事件的可能性。

私们期待着这个备受期待的人工智能模型正式推出时,有一件事是肯定的:GPT-5有可能重新定义人工智能的可能界限,在人与机器之间带来新的协作和创新时代。