在一轮“AI 狂欢”之后,公司们开始对飙升的账单打退堂鼓

人工智能正变得越来越昂贵,各家公司也开始重新审视自己对这一“颠覆性技术”的热情拥抱。

按硅谷一贯的剧本,在 ChatGPT 横空出世之后,AI 公司以极低价格吸引客户上车。创业孵化器 Delphi Labs 的 Kevin Simback 把这段时间称为“被补贴的智能”时代——意思是:其实一直是投资人买单,企业才能把 AI 这么便宜地提供给用户

“但潮水开始转向了。”Simback 警告说,一个 大模型巨头必须真正开始盈利 的时代已拉开序幕——OpenAI 和 Anthropic 这类领军企业正谋求在今年晚些时候上市,吸引散户投资者入场。

如今价格全面走高,其中一个重要推手就是 AI 代理(agents)

与只会回答问题的聊天机器人不同,代理会真正“干活”——预约、写代码、管理文件。而且它们的运行成本很高:单个任务就可能唤起数十个代理同时工作,每一个都在不停地产生费用。

这些费用是按 “tokens”(令牌) 计量的,这是 AI 公司向客户收费的基本单位。一个依赖代理执行的任务,消耗的 token 可能是普通聊天消息的几十倍。

与此同时,支撑这一切的 芯片和数据中心 供不应求,算力短缺给这条刚刚起步的产业链增添了更多不确定性。

“尤其是在开发者圈,用 AI 写代码之类的成本已经呈指数级上升,”技术咨询公司 Omniux 的 Mark Barton 说,“各项成本都真正在起飞了。”

有些公司对 AI 的热情高到失控,出现了一种被称为 “tokenmaxxing” 的“用量爆冲”现象。

分析师 Jack Gold(J.Gold Associates)说:“在某些案例里,人们发现一个月两个月下来,token 的成本就超过了员工本人工资,只因为他们用得太凶了。”

更加精明地花钱

就连 Meta 也开始踩刹车——今年早些时候,它还鼓励员工多用 token,把用量当生产力指标之一。

“没人应该为了用 AI 而用 AI。”首席技术官 Andrew Bosworth 在一份内部备忘录中写道(《华尔街日报》报道了这份备忘录)。

本周,Uber 的首席运营官更是更进一步,他表示,大规模的 AI 支出目前看 并没有带来明显的生产率提升,此话一出引发不少侧目。

为了削减成本,一些公司开始转向 免费的开源大模型 ——任何人都可以下载,虽然不如 ChatGPT 或 Anthropic 的 Claude 那么强,但对许多任务来说已经“够用”。(原文