AI generativo cria conteúdo, mas também está criando atrito que, sem controle, pode manter o Tecnologia de perceber seu potencial. Esse conflito - empresas da GENAI versus proprietários de conteúdo - precisa se tornar uma colaboração. E em breve. Algoritmos descobrem padrões e relacionamentos - essencial para gerar novos conteúdos - por treinamento em enormes volumes de não estruturados
The problem: GenAI is a fast learner, but IP tracking and compensation aren’t its strong suits. Algorithms uncover patterns and relationships—essential for generating new content—by training on huge volumes of unstructured Dados , como artigos de notícias, imagens e até código de programação. Esses conjuntos de dados são coletados de uma maneira tão em larga escala que detalharem os direitos de IP e o pagamento geralmente se perdem no Shuffle. Essa é uma preocupação para os criadores de conteúdo. Mas também deve ser uma preocupação para quem deseja e contar com a promessa de Genai.
GenAI is a fast learner, but IP tracking and compensation aren’t its strong suits.
Na ausência de rastreamento que mostra quando e como os modelos usam conteúdo protegido e, sem compensação justa para esse uso, os detentores de direitos estão colocando seus dados em guarda. Já, muitas empresas de mídia estão tomando medidas técnicas - e entrando em tribunais - para prevenir Inteligência Artificial Empresas de treinamento em seu conteúdo. Isso ameaça dificultar a qualidade da produção da Genai, o que colocaria investimentos em Genai em risco e sufocaria o desenvolvimento de novas soluções. Essa plataforma forneceria três funções principais: visibilidade da fonte e uso de dados de treinamento, um mecanismo de licenciamento e uma solução de pagamento para remuneração justa e rápida. Embora muitas vezes seja descontado devido à sua complexidade percebida, a blockchain promove a transparência e a confiança entre partes desconhecidas. E pode lidar com pagamentos até o nível de microtransação. O Blockchain pode ser a espinha dorsal de uma plataforma - e um ecossistema - onde todos os lados se beneficiam, para o benefício de todos nós. As organizações já estão usando para
The answer is a distribution channel that recognizes the value that content creators bring to GenAI, sparking cooperation instead of collision. This platform would provide three key functions: visibility into the source and use of training data, a licensing mechanism, and a payment solution for fair and fast compensation.
Such a platform has so far been elusive, but blockchain offers a good way forward. Although it’s often discounted because of its perceived complexity, blockchain fosters transparency and trust between unfamiliar parties. And it can handle payments down to the microtransaction level. Blockchain can be the backbone for a platform—and an ecosystem—where all sides benefit, to the benefit of us all.
Fair Use Versus Fair Pay
Generative AI is a game changer—literally. Already, organizations are using it to Escreva o código mais rápido , gerar pontos de discussão para chamadas de vendas, até mesmo Crie arte conceitual para jogos de computador . Os casos de uso continuam crescendo e com eles o mercado para tudo o que Genai: servidores e armazenamento, infraestrutura como serviço para modelos de treinamento, anúncios digitais impulsionados pela tecnologia, software assistente de genai especializado e assim por diante. De acordo com a Bloomberg Intelligence, a Genai está pronta para ser um negócio de US $ 1,3 trilhão até 2032.
The immense value of the market is prompting creators to question the fairness of how GenAI uses their content. It’s not only that models may be training, free of charge, on a creator’s IP but also that the models may generate new content that infringes upon or competes with their own works. The counterargument—given voice in OpenAI’s response to a copyright infringement lawsuit filed by The New York Times—is that training GenAI models on publicly available internet materials is fair use. While the courts work that out (with some 25 lawsuits pending, according to the Copyright Alliance), rights holders are taking a more technical and more immediate approach: blocking the crawlers that forage the Web for training data.
Research by the Reuters Institute for the Study of Journalism found that by the end of 2023, 48% of the most widely used news websites were blocking OpenAI’s crawlers and 24% were blocking Google’s AI crawler. Those figures are almost certainly trending upward. In August 2024, Wired relatou que quem é quem das empresas de mídia, incluindo Facebook, Instagram, The New York Times, Financial Times, eWired’s own parent, Condé Nast, were excluding their data from Apple’s AI training.
The off-limits signs take high-quality content off the table but also mean a shortage of diverse data. And that’s a problem, even as the overall volume of information continues to grow exponentially. Training on 200 pictures of a cat won’t help GenAI produce a picture of a dog. Models need both quality and diversity in their data sets. As content owners take more data out of circulation, we may see a downward spiral in the quality of GenAI output.
As content owners take more data out of circulation, we may see a downward spiral in the quality of GenAI output.
Outra preocupação: À medida que os criadores usam cada vez mais o Genai em seu próprio trabalho (para aumentar e acelerar seu processo), a produção de baixa qualidade afeta seus produtos finais. Por fim, não são apenas os modelos que estão famintos por trabalhos novos e convincentes. Somos todos nós. Os primeiros motores já coletaram dados de treinamento e, à medida que as torneiras fecham - e os seguidores rápidos acham mais difícil acessar conteúdo suficiente - sua vantagem só aumentará. Se os novos participantes não puderem ganhar posição, as soluções promissoras podem nunca chegar ao mercado.
Finally, there’s concern about what this all means for GenAI innovation. First movers have already collected training data and as the spigots close—and fast followers find it harder to access sufficient content—their advantage will only increase. If new entrants can’t gain footholds, promising solutions may never make it to market.
é necessário um ecossistema
The key to moving ahead—and ensuring that diverse, high-quality content remains available—is recognizing that at its core, this is really an ecosystem problem, with interdependencies between the participants. Ecossistemas prósperos , seja na natureza ou nos negócios, são sobre equilíbrio. Os participantes são incentivados à colaboração e não à concorrência. Para que o ecossistema de Genai prospere, é preciso haver um sistema para direitos de conteúdo e uso em que empresas genai e criadores de conteúdo se beneficiam: onde trabalhar juntos é uma opção melhor do que trabalhar com probabilidades. Garanta a visibilidade sobre onde os modelos Genai obtêm seus dados de treinamento e como eles usam esses dados. Isso permite que os proprietários de direitos acompanhem o uso de seu conteúdo. Também ajuda os desenvolvedores da Genai a confirmar a qualidade de seus dados de treinamento, pois cria certeza sobre a fonte.
An ecosystem for GenAI would need to offer at least the following functionality:
- Transparency. Ensure visibility into where GenAI models source their training data and how they use that data. This enables rights owners to track the use of their content. It also helps GenAI developers confirm the quality of their training data, since it creates certainty about the source.
- Licenciamento. Defina direitos de uso claro e justo para o conteúdo que os modelos podem usar para treinamento. E crie um mecanismo automatizado para estabelecer e revogando os contratos de licenciamento.
- compensação. Implementar um sistema robusto para micropagamentos de acordo com os termos de licenciamento.
Atualmente, nenhuma solução aborda todos esses elementos. As abordagens legislativas, por exemplo, concentraram-se na transparência. Ele também exige que um escritório de IA recém -criado desenvolva um modelo "simples e eficaz" para resumir essas informações. Dada a grande quantidade de dados de treinamento envolvidos, a transparência total promete ser um desafio. E mesmo no melhor cenário, os proprietários de direitos sabem apenas que os modelos estão treinando seu conteúdo, não como esses modelos usam os dados para criar um novo conteúdo. A Lei também não fornece um mecanismo de licenciamento e compensação. No nível federal, a Lei de Divulgação Geral de Direitos AI generativos proposta tem um foco de IP, mas, como a legislação da UE, para na transparência. O projeto de lei exige a divulgação de trabalhos protegidos por direitos autorais em conjuntos de dados de treinamento, permitindo que os proprietários de direitos busquem compensação, mas não aborda como é a compensação justa ou fornecer um caminho para obtê -lo. Quando um modelo treina sobre conteúdo - padrões e relacionamentos de aprendizagem - esse é apenas o começo da história. Para uma determinada consulta, o modelo baseia sua saída em peças específicas de dados de treinamento. Digamos, por uma questão de simplicidade, o modelo treina em dez peças de conteúdo. Ao responder a uma consulta e criar um novo conteúdo, o modelo pode depender de quatro dessas dez peças. Complicando ainda mais, cada uma dessas quatro peças pode contribuir para um grau diferente, exigindo o pagamento proporcional a esse uso. Os acordos de licenciamento convencionais, memorizados em documentos legais por escrito, não foram projetados para rastrear esta intrincada rede de distribuição.
The European Union’s Artificial Intelligence Act, which came into initial effect in August 2024 (with its provisions to be rolled out over a three-year period), requires the disclosure of copyrighted works that GenAI models use in their training phase. It also calls for a newly created AI Office to develop a “simple and effective” template for summarizing this information. Given the vast amount of training data involved, full transparency promises to be a challenge. And even in the best-case scenario, rights owners would know only that models are training on their content, not how those models then use the data to create new content. Nor does the act provide a mechanism for licensing and compensation.
In the US, legislation is fragmented, with most laws governing AI enacted at the state level—and typically focusing on consumer protection. At the federal level, the proposed Generative AI Copyright Disclosure Act does have an IP focus, but like the EU legislation, stops at transparency. The bill requires the disclosure of copyrighted works in training data sets, enabling rights owners to seek compensation, but it doesn’t address what fair compensation looks like or provide a path for obtaining it.
Traditional licensing mechanisms, meanwhile, are poorly suited for a GenAI world. When a model trains on content—learning patterns and relationships—that’s just the start of the story. For a given query, the model bases its output on specific pieces of training data. Say, for the sake of simplicity, the model trains on ten pieces of content. In responding to a query and creating a new piece of content, the model may rely on four of those ten pieces. Complicating matters further, each of those four pieces may contribute to a different degree, requiring payment proportional to that use. Conventional licensing agreements, memorialized in written legal documents, aren’t designed to track this intricate web of distribution.
Da mesma forma, as plataformas de conteúdo centralizado são uma solução menos do que ideal. Concedido, muitos desses repositórios - até uma fonte privilegiada de dados de treinamento, dadas suas grandes coleções de imagens, texto ou vídeo - facilitam o gerenciamento de direitos e a compensação para os criadores. Mas as plataformas centralizadas também apresentam desvantagens. A casa "corte" pode ser alta, reduzindo a renda do criador. A confiança em um intermediário pode levar a atrasos no pagamento. E esse intermediário, que executa o programa, muitas vezes tem controle sobre a distribuição e o preço do conteúdo, com criadores tendo pouca visão de como os ganhos são calculados e distribuídos. O que também está claro é que a tecnologia é fundamental. Novos padrões e plataformas técnicas já estão enfrentando alguns dos desafios que amplo acesso a - e distribuição de -
Blockchain Unshackles Content
If the old ways won’t cut it, a novel approach becomes essential. What’s also clear is that technology is key. New technical standards and platforms are already tackling some of the challenges that widespread access to—and distribution of— Mídia digital conteúdo presente. Por exemplo, para ajudar os editores e consumidores a verificar a autenticidade do conteúdo on -line e impedir a disseminação de desinformação, a Coalizão de Proveniência e Autenticidade do Conteúdo (C2PA) desenvolveu um padrão aberto para certificar a origem e o histórico de qualquer conteúdo. Dados de proveniência, como quem criou o trabalho e como ele pode ter sido editado posteriormente, viaja com o conteúdo à medida que flui pela Internet. Uma startup chamada Prorata.ai está desenvolvendo uma plataforma Genai que rastrearia o conteúdo específico que ele usa para responder a um prompt e compartilhar receita com os proprietários de conteúdo de acordo. Levando essa idéia adiante, nivelando o campo de jogo entre todas as empresas da Genai e todos os proprietários de conteúdo exigirá uma solução tecnológica que promova o crescimento do ecossistema.
Closer to home—for those on both sides of GenAI’s copyright clash—is an effort to use technology to tackle the attribution challenge. A startup called ProRata.ai is developing a GenAI platform that would track the specific content it uses to answer a prompt and share revenue with content owners accordingly.
Platforms like ProRata spotlight the need for—and viability of—a symbiotic approach: one where content owners and GenAI companies both benefit. Taking this idea further, leveling the playing field between all GenAI companies and all content owners will require a technological solution that fosters ecosystem growth.
Blockchain é um principal candidato. Um banco de dados distribuído que registra informações e transações, mas proíbe alterações nos registros existentes, o Blockchain garante confiança e justiça. As organizações o usam para rastrear e trocar certificados de pegada de carbono do produto, facilitar transações financeiras (até o nível de micropagamento) e registrar a propriedade dos ativos digitais e do mundo real, entre outras aplicações. Os genes podem ser baseados em milhares de insumos de treinamento, resultando em um grande volume de pagamentos muito baixos). Em suma, atinge a trifecta de transparência, licenciamento e compensação.
These capabilities mean blockchain can track the origin and use of training data, provide an efficient means for licensing, and support microtransactions on a macro-level scale (crucial because each piece of content a GenAI model generates can be based on thousands of training inputs, resulting in a massive volume of very low payments). In short, it hits the trifecta of transparency, licensing, and compensation.
Blockchain hits the solution trifecta of transparency, licensing, and compensation.
Um contraponto - e é razoável - é o custo computacional dessa solução. É verdade que as soluções genai atuais não são otimizadas para acompanhar o que os modelos de dados de treinamento usam ao gerar novos conteúdos, e estimamos que o processo poderia aumentar os requisitos de recursos computacionais em até 30%. Mas as soluções Genai otimizadas devem ser capazes de rastrear o uso de dados de treinamento com muito mais eficiência e exigir apenas 1% a 5% mais recursos computacionais. (Consulte “Scutando a discussão.”)
SPARING A DISCUSSÃO
Some counterpoints we heard while developing this article:
Why does it need to be an ecosystem? Does that really offer value for incumbent model developers? Wouldn’t they be more likely to enter into exclusive agreements to gain a data advantage?
Não estamos supercomplicando o mecanismo de compensação? Por que não dizer "vou pagar US $ 100 para usar seu trabalho, independentemente do uso em inferência"? Mais certeza, menor variação. Quando os ecossistemas são bem executados, eles podem pressionar os titulares enquanto incentivam os criadores de conteúdo. E embora nosso modelo seja complexo, nenhuma das idéias já em cima da mesa parece o ajuste perfeito. Com o foco e o esforço corretos, os custos computacionais podem diminuir com o tempo. Para citar alguns criadores de conteúdo bem conhecidos: podemos resolvê-lo.
If we did have an “at inference” or “pay per use” system, would we really be able to lower the computational costs enough to justify variable over fixed payments?
Our view is that current efforts tend to favor GenAI companies. When ecosystems are well executed, they can put pressure on incumbents while incentivizing content creators. And although our model is complex, none of the ideas already on the table feel like the perfect fit. With the right focus and effort, the computational costs can come down over time.
Seeking out—and hearing—all views is the key. To quote some well-known content creators: we can work it out.
também é verdade que o blockchain não é uma tecnologia plug-and-play. Os orquestradores iniciais da plataforma - os provedores de conteúdo e as empresas da Genai liderando a acusação - precisarão fazer parceria com um empreendimento tecnológico
, mas a tecnologia por si só não é suficiente. Construir com sucesso uma plataforma de IP baseada em blockchain-e um ecossistema próspero-, alinhando os participantes, garantindo a governança e dirigindo a escala da maneira certa. Os orquestradores assumirão o ponto aqui: definir as regras, coordenar os esforços e gerar custos e riscos significativos. Os melhores candidatos ao papel possuirão recursos suficientes, serão investidos no sucesso do ecossistema e poderão gerenciar relacionamentos com outros membros do ecossistema. Para convencer os criadores e as empresas da Genai a participar, divulgue a proposta de valor. Para os criadores, isso é transparência, proteção de IP e compensação. Para empresas da Genai, é acesso a dados. Sem esses principais colaboradores, a plataforma não prosperará. Abertura do equilíbrio (para atrair uma ampla variedade de participantes) com mecanismos de controle que garantem a segurança dos dados e o uso justo de IP. A governança deve proteger os direitos dos criadores, fornecendo transparência em como o conteúdo é usado, licenciado e monetizado na plataforma. Comece resolvendo um problema específico - como rastrear a proveniência do conteúdo e o licenciamento para os criadores - e construir uma escala antes de expandir para outros serviços. Isso pode incluir recursos mais avançados, como curadoria de dados personalizados e seleção, em que os proprietários de IP podem especificar quais dados devem ser incluídos e quais devem ser excluídos, dando -lhes mais controle sobre qual conteúdo está disponível para treinamento e quem pode usá -lo. O sucesso inicial gerará credibilidade e atrairá mais usuários. Para construir massa crítica, priorize o lado da plataforma que precisa da tração mais imediata. Por exemplo, oferecendo incentivos aos criadores-para que eles a bordo de seu conteúdo-podem ajudar a atrair empresas de genai que procuram dados de alta qualidade. Implemente três mecanismos de reforço: dados, crescimento e custo. À medida que mais criadores e empresas genai se ingressam, os efeitos da rede aumentarão, criando conjuntos de dados mais ricos que aprimoram a proposta de valor. No processo, a escalabilidade da plataforma significará mais custos de transação - separando ainda mais a participação. (Veja a exposição.)
To make it all work, orchestrators should take five critical steps:
- Ensure that essential partners join. To persuade creators and GenAI companies to participate, get the word out on the value proposition. For creators, that’s transparency, IP protection, and compensation. For GenAI companies, it’s access to data. Without these core contributors, the platform won’t thrive.
- Establish the right governance model. Balance openness (to attract a wide variety of participants) with control mechanisms that ensure data security and fair IP usage. Governance must protect creators’ rights while providing transparency in how content is used, licensed, and monetized on the platform.
- Focus on scale before scope. Start by solving a specific problem—like tracking content provenance and licensing for creators—and build scale before expanding to other services. These could include more advanced features such as custom data curation and selection, whereby IP owners can specify which data should be included and which should be excluded, giving them more control over what content is available for training and who can use it. Early success will drive credibility and attract more users.
- Solve the chicken-or-egg problem. To build critical mass, prioritize the side of the platform that needs the most immediate traction. For example, offering incentives to creators—so they onboard their content—can help attract GenAI companies looking for high-quality data.
- Create three flywheels. Implement three reinforcing mechanisms: data, growth, and cost. As more creators and GenAI companies join, network effects will increase, creating richer data sets that enhance the value proposition. In the process, the platform’s scalability will mean lower transaction costs—sparking still more participation. (See the exhibit.)

Cultivando uma economia do criador
As empresas de genai prosperam quando os criadores de conteúdo prosperam. A situação atual provou ser insustentável, e as empresas da Genai parecem reconhecer isso. Eles estão tentando várias estratégias para obter dados de alta qualidade, cumprir novos regulamentos e evitar mais ações judiciais. O que eles podem estar perdendo é a oportunidade de promover uma economia do criador. Recompensando o conteúdo de alta qualidade levará à criação de obras mais de alta qualidade: as empresas de genai combustível precisam continuar gerando novo conteúdo em escala. Bill ”?
Ironically, AI itself can rate submitted content on uniqueness and attractiveness and offer compensation accordingly, encouraging content creators to produce new and exciting works that meet GenAI needs.
But who “pays the bill”?
Existem vários caminhos em direção à compensação justa da criação de conteúdo. A remuneração pode ser paga aos criadores que contribuíram para a geração de novos conteúdos, respeitando os modelos de negócios de taxa plana das empresas da Genai, muito parecidas com a forma como os serviços de transmissão musical funcionam nos dias de hoje. Alternativas também são possíveis. Por exemplo, o conteúdo gerado pode permanecer livre para uso individual, mas exige uma taxa de licença para pedidos comerciais. Isso permitiria que as empresas da Genai compartilhassem o fluxo de receita adicional com os criadores e o acesso seguro a quantidades crescentes de conteúdo único e diferenciador - o que os ajudará a tomar Genai e seus negócios, mais adiante. As empresas da Genai podem atender à sua crescente demanda por novos dados de treinamento, enquanto os proprietários de conteúdo podem tocar em uma oportunidade significativa de se beneficiar de seu IP. Trabalhando juntos, em vez de em desacordo, ambos os grupos podem sustentar o crescimento e a prosperidade. Ao criar uma plataforma baseada em blockchain para rastrear e monetizar o conteúdo, um ecossistema pode florescer-e o impacto de Genai pode continuar crescendo. Inscreva -se
Recognizing the value that creators bring to GenAI, and ensuring fair compensation for using their works, is in the interest of all players in the GenAI space. GenAI companies can meet their growing demand for new training data, while content owners can tap a significant opportunity to benefit from their IP. Working together, instead of at odds, both groups can sustain growth and prosperity. By creating a blockchain-based platform for tracking and monetizing content, an ecosystem can flourish—and GenAI’s impact can keep growing.
The authors thank Marco Badur, Cathy Hackl, Daniel Sack, and Stefan Wang for their contributions to this article.