去年,随着 ChatGPT 的推出,我们见证了基于人工智能的应用程序和 API 的激增。这引发了新的企业用例和工作流程的出现。其中许多解决方案都是作为 API 提供的,而不是传统的基于 UI 的应用程序和目标开发人员。
但是,将基于 AI 的 API 货币化需要采取战略方法来确保 API 访问成本反映为客户提供的价值。减少滥用的可能性并确保定价模型与基础设施成本相符至关重要,这对于支持这些基于人工智能的 API 来说可能是巨大的。因此,提供无限 API 访问的传统 SaaS 定价模型并不适合基于 AI 的 API。在本文中,我们将深入探讨基于 AI 的 API 货币化的潜在方法。
确保定价符合客户价值
基于人工智能的 API,例如使用大型语言模型 (LLM) 的 API,通常是上下文相关的,并根据某些输入生成响应。然而,不同的输入可能会产生截然不同的结果。
对于客户来说,生成大量信息的单个复杂请求可能比提供很少信息或根本不提供信息的请求更有价值。当然,客户可以提出大量小请求来制定与一个大请求类似的结果。
因此,将定价与结果(而不是 API 调用)保持一致可能更有意义。对于像 ChatGPT 这样的法学硕士,一种方法是根据输入和输出代币的数量进行定价。另一方面,对于音频 API,这可能意味着以分钟为单位查看音频剪辑的长度,因为客户是否进行单个 API 调用或一百个 API 调用来生成必要的结果并不重要。< /p>
考虑结果的准确性和有效性也很重要。如果生成的结果可信度较低(可能是由于幻觉),那么对于客户而言,它不如准确完整的结果有价值。
实现此目的的一种方法是通过即用即付计费方式,也称为 基于消费的计费,可以向客户收费基于他们的消费。
确保成本随定价变化
与传统 SaaS 应用程序不同,基于 AI 的应用程序的基础设施成本通常占总体运营预算的较大比例。这可能包括训练新模型的计算成本、使用 OpenAI 等其他 API 的成本以及为 API 提供服务的托管成本等。
随着客户使用更多的 API,您的直接成本通常也会上升。然而,并非所有 API 调用的成本都相同。根据请求输入、使用的模型等,不同的请求可能具有不同的单位经济性。例如,如果您正在利用 ChatGPT,则具有大量令牌的请求将比具有少量令牌的请求花费更多。
同样,不同的模型和环境有不同的价格点。使用 128k 上下文 GPT-4 Turbo 的成本高于使用具有 16k 上下文的 GPT-3.5 Turbo。因此,您还需要确保此成本差异已纳入您的 API 定价中。否则,您可能会出现价格套利。
防止意外滥用
尽管托管基于人工智能的 API 的成本很高,但每个 API 调用都可以被视为一种商品。使用您的 API 的开发人员可能不需要进行大量的设置工作就可以开始使用该 API。这可能会让您遭受滥用和套利。
实现这种情况的一种方法是使用后付费计费,即即用即付。客户可以注册,输入他们的信用卡,然后就可以增加 10,000 美元的账单。然而,当信用卡被扣款时,它就被取消了。
有几种方法可以防止这种情况发生:
探索预付费账单
预付费账单是通过要求客户预先付款来降低滥用风险的一种方法。
这可以通过要求客户购买预定义的配额或购买可以随着时间的推移消耗的积分来完成。当使用情况可预测时,配额是完美的。然而,基于人工智能的 API 的客户每月的使用情况可能会有很大差异。
预付积分在这里最有意义。客户可以在一个月内使用少量积分,并在下个月使用大量积分。
考虑基于阈值的发票
预付费账单的棘手部分是它会在入职过程中产生摩擦。您要求客户在完全成功使用 API 并了解他们计划使用多少之前购买某些东西。
解决此问题同时仍防止滥用的一种方法是结合使用后付费计费和基于阈值的发票。通过此设置,客户仍会被拖欠发票。
但是,一旦达到阈值,就会发送发票。例如,如果阈值是 500 美元,则消费满 500 美元后就会发送发票并付款,而不是等到账单日。这种模式在广告行业很流行,因为向客户提供的信用有阈值。