
GPT-5是几周,或者更短诏安。
Foundry首席执行官贾里德·昆西·戴维斯(Jared Quincy Davis)找到了一种在不训练新模型的情况下提高人工智能输出的方法。
分层人工智能模型的成本可能更高,但对于某些问题来说,显著的改进可能是值得的。
感谢您的报名!转到时事通讯偏好
改变了一切的OpenAI语言模型的下一个版本GPT-5即将问世。Business Insider此前报道称,一些客户已经收到了新版本的演示,有关改进的猜测也很普遍。这种模式的风险很高,因为它将巩固OpenAI在人工智能领域的前沿地位,或者将其推到中间位置。
本文仅对Business Insider订阅者开放。成为业内人士,现在就开始阅读。有账户吗?.
当人工智能开发人员等待测试GPT-5时,一些人已经找到了一种新的方法,可以在没有全新模型的情况下引导他们走向更先进的人工智能。
本文作者杰瑞德·昆西·戴维斯是人工智能云服务提供商Foundry的首席执行官,该公司采用新策略提高图形处理单元的计算效率。
今年3月,这家初创公司从隐形状态中脱颖而出,获得了光速创投(Lightspeed Venture Partners)和红杉资本(Sequoia Capital)共同领投的8000万美元种子基金,估值为3.5亿美元。戴维斯曾在红杉资本担任人工智能领域的创业公司侦察员。
Foundry的策略集中在跨GPU循环AI工作负载,以最大限度地提高GPU利用率。戴维斯在周四发布的No prior播客中解释说,更少的闲置gpu将转化为更实惠的计算。
戴维斯在上个月发表的一篇研究论文中解释了提高现有大型语言模型性能的方法,该方法适合新兴的“复合人工智能系统”分类。
关键是,如果你反复问像GPT-4这样的模型同样的问题,你可以使用另一个小得多的模型来分析这些回答,并选出最好的一个。
戴维斯告诉播客主持人莎拉·郭和埃拉德·吉尔:“越来越多的时候,为了超越当今最先进模型的能力和边界,尽早获得GPT-5或GPT-6,从业者开始做这些事情,通常是含蓄地,他们会多次调用当前最先进的模型。”
戴维斯解释说,他对模型的反复“召唤”是市场上一些最聪明但最小的模型在训练过程中所做的。但是现在,这种方法只对某些类型的查询有效——本质上来说,这些问题的答案更容易检查,而不是生成。
戴维斯说:“对于你所期望的数学、物理、电气工程等学科,这种方法真的很有帮助。”
在测试中,戴维斯给GPT-4出了一道具有挑战性的数学题。该模型只在4%的情况下得到正确答案,但在90%的情况下,它都能分辨出哪些答案是正确的。当戴维斯和他的合著者使用复合人工智能方法时,分层模型产生正确答案的几率为37%,几乎增加了10倍。
Davis说,对基础模型进行引导改进并不是更有效——这种方法几乎肯定是一种更昂贵的利用人工智能模型的方法,但在某些情况下,改进的结果是值得的。
他指出,现在在训练和迭代上花更多的钱可以节省未来的推理计算。
戴维斯说:“我认为人们越来越善于从生命周期的角度来考虑成本问题。”
你测试过Chat GPT-5吗?有什么建议或见解要分享吗?联系Emma: ecosgrove@businessinsider.com或使用安全消息应用程序Signal: 443-333-9088
点击分享到









