casos de uso imaginativos, progresso tecnológico rápido e drama da sala de reuniões dominaram as manchetes sobre Inteligência artificial generativa (Genai) Desde o lançamento do ChatGPT em novembro de 2022. Muito ausente dessas conversas, no entanto, é uma discussão sobre como as empresas de software e os desenvolvedores de aplicativos da Genai devem definir o direito Preço Modelos de estratégia e preços, dois elementos críticos que determinam a trajetória de longo prazo de qualquer nova tecnologia.
The Decisões de preços estratégicos O que as empresas fabricam hoje terão efeitos de longo alcance que determinarão a rapidez com que a adoção de Genai acelera, que se beneficia disso, quanto as organizações em dinheiro podem reinvestir em melhorias e vantagens competitivas e até o futuro da interação humana-máquina. Quanto menos consideração as empresas se dedicam à estratégia de preços e aos modelos de preços, maior o risco de limitar artificialmente o potencial de suas soluções, desencorajando os clientes a experimentar. Isso não apenas limitará os efeitos de alcance e rede que tornariam essas soluções mais valiosas, mas também deixarão a porta aberta para novos participantes com melhores opções de precificação.
The less consideration companies devote to pricing strategy and pricing models, the greater the risk that they will artificially limit the potential of their solutions by discouraging customers from experimenting.
Os preços de genai de hoje são mais expedientes do que estratégicos
A pressão para lançar uma solução obrigou muitos inovadores a escolher um modelo e um número rapidamente para seus preços. Como resultado, mesmo as empresas mais experimentais tendem a renunciar a monetizar suas ofertas da Genai por enquanto ou se formaram em um dos dois modelos de preços simples e familiares. O primeiro é um modelo de preços baseado em token que cobra os usuários pelo consumo e está vagamente alinhado com o poder de computação necessário. O segundo é um modelo de assinatura que cobra uma taxa uniforme por usuário por mês, mas levanta preocupações de que os custos subjacentes do poder de computação tornarão as ofertas não rentáveis para o fornecedor. Uma visão integrada dessas fontes oferece às empresas a base para escolher o modelo de preços que melhor reflete seus objetivos de curto e longo prazo e uma arquitetura de preços que captura e compartilha valor de acordo com sua estratégia de negócios mais ampla.
We recommend companies take a more strategic approach to GenAI pricing that starts with a thorough understanding of the three information sources for any major pricing decisions: customer value created, the competitive landscape, and the economics of the product or service. An integrated view of those sources gives firms the foundation to choose the pricing model that best reflects their short- and long-term objectives and a pricing architecture that captures and shares value in line with their broader business strategy.
A abordagem estratégica do preço para Genai
Choosing the most expedient pricing model ignores the reality that GenAI applications are fundamentally different from many other technologies, thanks to their sheer potential for value creation and their evolving ecosystem. Those differences underscore the need for the vendor to think through the following three questions carefully.
Como você cria e compartilha o valor do cliente? The exponential growth in the adoption of ChatGPT and other GenAI applications shows that it is currently impossible to define the upper limits on the technology’s potential value. While direct value to customers can vary widely, there are six key value drivers that we have observed in the evolving GenAI ecosystem (see Exhibit 1):

- Model scale and accuracy
- Proprietary data and fine-tuning
- Position in the value chain
- Especialização do domínio
- Multi-modalidade
- Uso da interface do usuário em cativeiro (CUI)
Model scale and model accuracy are common and well-known technical indicators of value, while the other value drivers are less technical and should be more visible to customers. A company can feed proprietary data into a GenAI-powered application to improve accuracy and create unique outcomes. For example, Bloomberg reportedly improved the accuracy of its GPT model for finance-specific tasks by up to a factor of four when it incorporated proprietary content.
The major differences between the foundation models, the GenAI-powered applications, and the automation workflows are the range of data that trains the models, the tasks that each application can accomplish, and the degree of human involvement. The foundation models and GenAI-powered applications either augment people’s jobs or free them up for higher-value tasks, while the automation workflows require little or no human supervision.
How differentiated are you within your competitive landscape? The competitive landscape for GenAI is rapidly evolving, too. (See Exhibit 2.) Foundation models, including large language models (LLMs), first garnered the most attention. A few big competitors—early movers like Open AI and hyperscalers like Google (Bard, Gemini), Meta (Llama), and Anthropic (Claude)—will determine the landscape for those large-scale, general-purpose models, in part because they require billions of dollars to train, refine, and operate.

À medida que os participantes de tecnologia novos e existentes entram no mercado com suas próprias ofertas de genai, a paisagem está se tornando mais fragmentada em termos de modelos menores e aplicativos e fluxos de trabalho mais especializados. Os provedores menores têm a oportunidade de se diferenciar, desde que tenham capacidades altamente especializadas ou possam segmentar suas ofertas para servir uma base de clientes diversificada e fragmentada. O modelo 8x7B da IA Mistral, lançado em dezembro de 2023, supera o GPT-3,5 na maioria dos benchmarks, embora seja muito menor que os modelos do OpenAI. Em contraste com os aplicativos de software e software como serviço (SaaS), cujos custos marginais podem ser muito baixos, o custo subjacente para servir aos modelos Genai pode ser bastante alto, dependendo do caso de uso e do modelo de preços. Em algumas estimativas, uma alta parcela da receita que a IA aberta gerou recentemente foi para cobrir os custos de computação impulsionados pela escassez das GPUs necessárias para apoiar os modelos. (Consulte Anexo 3.)
How will your costs scale and evolve? The economics of GenAI solutions remain uncertain as the costs continue to evolve. By contrast with software and software as a service (SaaS) applications, whose marginal costs can be very low, the underlying cost to serve of GenAI models can be quite high, depending on the use case and pricing model. By some estimates, a high share of the revenue that Open AI has recently generated has gone toward covering computing costs driven up by a shortage of the GPUs needed to support the models. (See Exhibit 3.)

Se uma empresa cobrar uma taxa fixa pelo acesso a uma aplicação e os custos escalam principalmente com o número de consultas, a distribuição e o escalamento de custos de consultas por usuário é um dos principais fatores de lucratividade. Uma grande parte de usuários pesados pode, portanto, tornar o modelo não lucrativo no curto prazo. As decisões estratégicas de preços, no entanto, não apenas exigem uma compreensão dos custos unitários atuais, mas também como esses custos serão escalados e mudarão com o tempo. Como mostra o Anexo 3, os custos por token para vários modelos diminuíram. Essas despesas são plotadas em uma escala logarítmica, o que significa que os custos para modelos de desempenho mais baixos são exponencialmente mais baixos, tanto em geral quanto com o tempo. Existem várias forças que aumentam os custos unitários, incluindo a lei de Moore, a lei de Huang, as melhorias no treinamento modelo e os investimentos em aceleradores. Ao mesmo tempo, novos recursos tendem a resultar em novos casos de uso que podem consumir recursos de maior e maior custo. Uma compreensão profunda das tensões nessas forças é essencial para a lente econômica ao tomar decisões de preços.
Não existe uma estratégia de preços de tamanho único para a Genai. Um desenvolvedor de modelos que enfrentam essa economia terá várias opções. Eles poderiam aumentar o preço por usuário, manter o preço atual se acreditarem que os custos diminuirão significativamente, reprojetar para oferecer um modelo de menor custo que atenda a um preço-alvo ou ajuste o preço de uma maneira que incentiva os clientes a alinhar seu comportamento com custos. Qual opção está correta dependerá do contexto do mercado (incluindo o valor do cliente e o cenário competitivo) e da estratégia de negócios do fornecedor. Os fatores mais importantes na definição de um modelo para um aplicativo Genai são a base de preços (a unidade e o tempo do preço) e a arquitetura de oferta (como empacotar as inovações).
Choosing the Right Pricing Model for a GenAI Strategy
The pricing model shapes how a company monetizes and shares the value it creates. The most important factors in setting a model for a GenAI application are the pricing basis (the unit and timing of the price) and the offer architecture (how to package the innovations).
The pricing model shapes how a company monetizes and shares the value it creates.
Duas bases de preços predominantes surgiram para Genai até agora: o consumo, que geralmente é medido por mil tokens utilizados e assinatura, que geralmente é medida por usuário por mês. O Github, por exemplo, preços seu copiloto de US $ 10 a US $ 39 por usuário por mês. Esperamos que os resultados surjam como base de preços à medida que os modelos Genai se tornam mais específicos e mais integrados às empresas. Se os aplicativos Genai mais bem -sucedidos tiverem o preço de usuário em base de assinatura, é provável que eles aprimorem o desempenho humano. Se os modelos predominantes forem baseados no consumo por tarefa ou por resultado, os aplicativos têm maior probabilidade de substituir os seres humanos ou diminuir suas funções. (Veja o Anexo 4.) Mesmo assim, a escolha do modelo não é prescritiva, mas uma decisão consciente e cuidadosa. As empresas devem pesar vários fatores conforme escolhem entre os três modelos: baseados em consumo, baseados em assinatura e baseados em resultados. Embora algumas empresas possam usar isso como uma justificativa para cobrar preços mais altos no curto prazo, esperamos que os custos caam significativamente no futuro, como os custos de fabricação de semicondutores diminuíram de acordo com a lei de Moore. O sucesso com um modelo baseado em consumo depende da capacidade de uma empresa de otimizar todos os aspectos da equação de custo internamente e influenciar o comportamento do cliente para se alinhar melhor aos custos. A Microsoft, por exemplo, define seu copiloto "Digital Companion" a US $ 30 por usuário por mês para clientes corporativos. Esses modelos de taxa fixa são fáceis para ambas as partes entenderem, mas os custos variáveis podem colocar em risco as margens desses modelos de assinatura a curto prazo. O uso de taxas fixas nos estágios iniciais de outros mercados em rápido crescimento - como o uso da Internet e a telefonia móvel - demonstraram que os custos unitários podem aumentar rapidamente se o uso varia significativamente entre os clientes. Embora alguns fornecedores possam começar com um modelo de preço simples, como preço por usuário, eles podem ter a oportunidade de mudar para os preços baseados em resultados à medida que o mercado evolui. Isso pode levar à suposição de que os preços do consumo se alinham bem com o valor e devem ser o modelo predominante para soluções genai. O exemplo simples de um chatbot automatizado de atendimento ao cliente mostra os riscos. Um modelo baseado em consumo funciona quando a métrica de preços é o número de interações que o chatbot tem com os clientes. Um modelo baseado em resultados funciona quando a métrica de preços é, por exemplo, o número de casos resolvidos que são classificados como "satisfeitos" por um cliente. O último grupo pode ser muito menor em volume, mas muito mais valioso para a empresa. Um modelo baseado em resultados cria incentivos para o desenvolvedor pensar no contexto dos negócios, integração do fluxo de trabalho e refinamentos de modelos que podem ser necessários para oferecer valor verdadeiro.
Companies’ choice of pricing model can also reveal information about the fate of their team members. If most successful GenAI applications are priced per user on a subscription basis, they are likely to enhance human performance. If the predominant models are based on consumption per task or per outcome, then the applications are more likely to replace humans or diminish their roles.
Companies can choose their pricing model strategically by integrating key insights from the three information sources (customer value, competitive landscape, and economics) into three parameters: the choice of data source to train the GenAI model, the operating environment, and the perceived value for customers. (See Exhibit 4.) Even then, the choice of model is not prescriptive but rather a conscious and careful decision. Companies must weigh several factors as they choose among the three models: consumption based, subscription based, and outcome based.

- Consumption-based model: Tokens, the main unit of consumption, are proxies for costs, and marginal costs are high for some GenAI models. While some companies may use this as a rationale to charge higher prices in the short term, we expect that costs will decline significantly in the future, akin to how semiconductor manufacturing costs declined in line with Moore’s Law. Success with a consumption-based model depends on a company’s ability to optimize all aspects of the cost equation in-house and to influence customer behavior to better align with costs.
- Subscription-based model: The less commoditized an application, the more a subscription-based pricing model makes sense. Microsoft, for example, set its Copilot “digital companion” at $30 per user per month for enterprise customers. Such flat-rate models are easy for both parties to understand, but variable costs can put the margins of these subscription models at risk in the short term. The use of flat rates in the early stages of other rapidly growing markets—such as internet usage and mobile telephony—has shown that unit costs can rise quickly if usage varies significantly among customers. While some vendors may start out with a simple pricing model such as price per user, they may have the opportunity to move to outcome-based prices as the market evolves.
- Outcome-based model: When choosing a pricing model, companies should not confuse outputs and outcomes. Doing so can lead to the assumption that consumption pricing aligns well with value and should be the predominant model for GenAI solutions. The simple example of an automated customer service chatbot shows the risks. A consumption-based model works when the pricing metric is the number of interactions the chatbot has with customers. An outcome-based model works when the pricing metric is, for example, the number of cases resolved that are rated “satisfied” by a customer. The latter group may be much smaller in volume but much more valuable for the company. An outcome-based model creates incentives for the developer to think about the business context, workflow integration, and model refinements that may be needed to deliver true value.
Depois que a empresa decidiu com base na base de preços (a unidade e o tempo do preço), ela pode passar para a segunda decisão importante para seu modelo de preços: a arquitetura da oferta, e é assim que empacotará suas inovações. Existem três arquiteturas de oferta a serem consideradas para as soluções genai:
- Plataforma Genai Single: ChatGPT foi embalado como um aplicativo gratuito independente quando foi lançado pela primeira vez. Esse tipo de modelo funciona melhor quando o valor é altamente diferenciado e impulsionado por um ou dois "recursos assassinos" que todos precisam. As melhores arquiteturas boas são uma boa opção para ofertas que possuem recursos suficientes para permitir a diferenciação entre as camadas e alcançaram a maturidade do mercado suficiente para que os segmentos de clientes surjam. Muitas empresas estão adicionando recursos da Genai como recursos aos produtos existentes. As motivações por trás dessa estrutura de embalagem são a simplicidade e a necessidade de aumentar a proposta de valor da oferta principal. Ao embalar a Genai nas ofertas existentes, no entanto, é importante que a empresa adapte seu modelo de preços para capturar um verdadeiro valor e custos diferenciais. Tais mudanças podem significar criar um subsídio para várias interações ou tokens nas ofertas da Genai e no uso de uma base de preços secundários para capturar valor quando os usuários de energia excederem esse subsídio. O mercado é tão dinâmico e as soluções são tão diferenciadas que cada fornecedor precisa se concentrar no desenvolvimento das estratégias de preços que funcionam melhor para suas próprias necessidades. Nesse espaço em constante evolução, descobrimos três movimentos de não-regra:
- Good-better-best offers: GPT and Claude both have higher (better) and lower (“good enough”) performance models with very different price points. Good-better-best architectures are a good fit for offers that have enough features to allow for differentiation across tiers and have achieved enough market maturity for customer segments to emerge.
- Enrichment of existing offers: For existing digital players who are adding GenAI capabilities, an add-on offer to existing platforms may make more sense than a standalone platform. Many companies are adding GenAI capabilities as features to existing products. The motivations behind this packaging structure are simplicity and the need to augment the core offer’s value proposition. When packaging GenAI within existing offers, however, it is important for the firm to adapt its pricing model to capture true differential value and costs. Such changes could mean building an allowance for a number of interactions or tokens into GenAI offerings and using a secondary pricing basis to capture value when power users exceed that allowance.
***
The transformative potential of GenAI is so vast that it requires a unique approach to pricing strategies. The market is so dynamic and the solutions are so differentiated that each vendor needs to focus on developing the pricing strategies that work best for their own needs. In this constantly evolving space, we have found three no-regret moves:
- Fique claro sobre o que gera valor e diferenciação. Model. The more differentiated the offer (in terms of performance, proprietary data, and domain specificity), and the more it augments rather than replaces the end user, the more you can price to value and use a subscription or outcome-based model.
- Afaste sua economia, agora e no futuro. Invista em entender como seus custos escalam e qual será sua economia em escala (em 12 a 24 meses, por exemplo). A economia de curto prazo é importante, mas não é suficiente para ajudar as empresas a tomar uma decisão estratégica de preços. Ofertas altamente diferenciadas com poucos fornecedores e muitos clientes são melhor suportados com o que chamamos de jogo de valor (uma oferta única) ou o jogo de escolha (vários jogadores com bases de clientes segmentadas). Nosso e-alert de preços e gerenciamento de receita. The cost-to-serve profile of GenAI-based solutions can vary dramatically, depending on the underlying LLM, user profile, and evolution over time. Invest in understanding how your costs scale and what your economics will be at scale (in 12 to 24 months, for example). Short-term economics are important but not sufficient to help firms make a strategic pricing decision.
- Play the right pricing game. Two factors will ultimately drive the best pricing model: the market structure—especially its growth potential and the balance of power among customers and competitors—and the differentiation of the offers. Highly differentiated offers with few vendors and many customers are best supported with what we call the Value Game (one unique offer) or the Choice Game (multiple players with segmented customer bases).
Companies will be better equipped to navigate this challenging market when they have a clearer understanding of the pricing landscape and how to set a smart pricing strategy that does justice to the transformative power of their GenAI solutions.