200美元订阅若被用满,可能消耗上万美元算力?大模型厂商正承受不小的成本压力

研究机构SemiAnalysis近期对OpenAI和Anthropic的订阅套餐做了实际测试。结果发现,看上去价格不高的固定月费背后,其实藏着需要由大模型公司自己承担的大额算力补贴压力。

测试人员购买了这两家公司的不同订阅方案,并持续执行长时编程、智能体等高消耗任务,一直到触发每周使用上限。之后再按照公开的API定价换算这些实际调用量对应的理论成本,得出的数字相当惊人。

高强度使用会迅速放大算力补贴

测算显示,如果用户把OpenAI定价200美元的“ChatGPT Pro 20x”完全用足,对应的API计费金额最高大约可达1.4万美元。而同样定价为200美元的Anthropic“Claude Max 20x”方案,在极限使用状态下,理论上的Token成本也能接近8000美元。

这说明,只要少部分重度用户持续高频使用,就可能快速吃掉订阅模式下本就不多的利润空间,让厂商承受明显亏损。以ChatGPT Plus这类20美元的基础订阅为例,一旦用户使用率超过11.4%,OpenAI就在这类用户身上开始亏钱。

企业开始更细致地分配模型任务

在这样的背景下,以多步骤、自主调用工具为特点的智能体系统,正在进一步抬高成本压力,其Token消耗甚至能达到传统单轮对话的千倍左右。包括微软、Meta、亚马逊在内的大公司,也已经对过去鼓励员工大范围试用AI的做法有所收紧,以便控制内部快速上涨的使用账单。

为了应对高昂的算力投入,越来越多企业开始采用更细化的分流方式:把复杂任务交给高性能模型,把日常办公任务分配给更便宜或开源的模型。这种任务路由策略最高可把整体AI成本压缩95%,同时也让大模型服务商不得不在用户体验和高额基础设施成本之间艰难权衡。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享