Os modelos de inteligência artificial (IA), especialmente aqueles com arquiteturas abertas, têm demonstrado um impacto significativo em mercados digitais e na competitividade das empresas que os utilizam. A possibilidade de acesso a modelos pré-treinados ou mesmo a adaptação desses modelos de código aberto (open-source) permite a diversas empresas não só melhorar seus próprios produtos, mas também reduzir custos operacionais. No entanto, esses desenvolvimentos não são isentos de riscos, especialmente quando se trata de práticas de concorrência e manutenção de um ambiente competitivo saudável.

Uma das rotas de entrada no mercado de modelos de IA abertos ocorre através de plataformas de modelos ou hubs de modelos. Nesses hubs, as empresas podem treinar e personalizar seus próprios modelos com base em arquiteturas de IA abertas ou aprimorar modelos pré-existentes para gerar soluções altamente especializadas. O mercado de IA, portanto, é marcado por fortes efeitos de rede, onde a popularidade de uma solução ou modelo atrai mais desenvolvedores e consumidores, criando um ciclo auto-reforçado que beneficia as empresas estabelecidas. No entanto, embora isso possa reduzir barreiras de entrada, ele também levanta questões sobre a concentração do mercado e a regulação de entidades dominantes.

Outro ponto crucial a ser destacado é o impacto que os modelos de IA podem ter na proteção de dados sensíveis e na privacidade empresarial. Ao interagir com sistemas de IA, as empresas podem inadvertidamente compartilhar informações confidenciais ou dados proprietários, o que pode resultar na exposição de segredos comerciais. Além disso, o uso generalizado de IA pode levar à "collusão" tácita, onde diferentes sistemas começam a alinhar suas práticas de negócios com base em dados coletados do mercado, criando uma uniformidade que prejudica a concorrência saudável. Este tipo de comportamento é difícil de detectar e regular, pois não envolve acordos explícitos entre concorrentes, o que complica as ações antitruste tradicionais.

A natureza dos mercados digitais e da IA está também fortemente associada a economias de escala e efeitos de rede. A partir do momento em que mais usuários se envolvem com uma plataforma ou modelo de IA, a utilidade da plataforma cresce, atraindo mais usuários e criando um ciclo que beneficia as grandes empresas que já dominam o mercado. Um exemplo claro disso pode ser observado na integração de soluções de IA em produtos como o Microsoft Copilot, que utiliza a IA para melhorar a experiência do usuário no pacote de software Microsoft 365. À medida que a plataforma aumenta sua base de usuários, o valor do serviço também cresce, atraindo mais desenvolvedores e empresas que desejam se integrar ao ecossistema, criando um efeito de rede que torna difícil a concorrência para empresas menores ou iniciantes.

Além disso, o conceito de "economias de escopo" se aplica diretamente ao desenvolvimento de soluções baseadas em IA. As empresas podem usar dados de uma área de negócios para melhorar e expandir suas ofertas em outras, o que cria um diferencial competitivo significativo. Empresas com acesso a grandes volumes de dados conseguem melhorar a qualidade de seus produtos e expandir suas atividades para novas áreas com muito mais eficácia do que empresas menores, criando barreiras adicionais para novos entrantes. Isso contribui para a concentração do mercado, onde as grandes empresas, com acesso a vastas quantidades de dados, dominam a inovação e a competição.

A descentralização e o controle de acesso aos modelos de IA abertos, bem como a exploração de modelos com práticas de código aberto, não visam apenas uma melhora no serviço, mas também geram um efeito indireto importante: atraem mais desenvolvedores e parceiros comerciais, ampliando ainda mais a adoção de suas soluções. Este ciclo de adoção acelerada pode gerar melhorias incrementais, mas também cria um tipo de "efeito de rede", onde empresas dominantes incentivam indiretamente o uso de suas tecnologias, exacerbando as disparidades de poder entre grandes e pequenas empresas.

No nível dos mercados digitais, os efeitos de rede desempenham um papel central na dinâmica competitiva, uma vez que as plataformas com grandes bases de usuários se tornam cada vez mais valiosas. Isso cria uma competição desigual, onde as novas empresas enfrentam dificuldades significativas para competir com os incumbentes. A exploração de redes digitais também amplia o acesso a dados, que é fundamental para a melhoria contínua dos modelos de IA. Este cenário configura uma situação onde, embora os custos marginais de produção de serviços digitais sejam quase nulos, os benefícios de possuir uma plataforma de dados robusta se tornam cada vez mais importantes.

Esses fatores combinados podem levar ao surgimento de práticas monopolistas ou anticompetitivas, onde as grandes empresas dominam o mercado digital com pouco espaço para inovação ou diversidade de oferta. Além disso, a habilidade de as empresas se integrarem a múltiplas áreas de negócios e aproveitarem as economias de escala e escopo pode gerar um impacto profundo na estrutura competitiva do mercado. Por isso, é necessário que se considerem formas de regulamentação que possam lidar com essas complexidades e assegurar que a competição no mercado digital se mantenha justa e equilibrada.

Como a inteligência artificial pode identificar cláusulas abusivas em contratos online?

O uso da inteligência artificial (IA) para análise de documentos jurídicos tem revelado um potencial disruptivo no campo do direito do consumidor, sobretudo no que diz respeito à detecção automatizada de cláusulas abusivas em contratos eletrônicos e políticas de privacidade. Em um contexto onde consumidores raramente leem os termos de serviço e têm pouca ou nenhuma capacidade de negociar suas condições, ferramentas como o projeto CLAUDETTE mostram-se fundamentais para reequilibrar as assimetrias informacionais entre partes contratantes.

CLAUDETTE (sigla para CLAUse DETection Tool) é um sistema de aprendizado supervisionado treinado para identificar cláusulas potencialmente injustas em termos de uso online. Para isso, uma base de dados composta inicialmente por 50 documentos foi anotada por especialistas jurídicos, categorizando sentenças conforme sua legalidade e equidade. Essa base foi expandida posteriormente para 150 documentos, e serviu como material de treinamento para o sistema. A abordagem utilizada é baseada na classificação de sentenças individuais, mas incorpora também o contexto textual — ou seja, sentenças anteriores e posteriores — para aprimorar a precisão do modelo.

O pipeline do sistema começa com a segmentação dos documentos em sentenças, seguida de uma tokenização para identificar as palavras e expressões, e uma análise sintática para extrair a estrutura gramatical de cada frase. Na fase de representação textual, CLAUDETTE utiliza modelos clássicos como bag-of-words (BoW) e tree kernels (TK). O BoW representa o conteúdo por meio da frequência de palavras e suas combinações — bigramas e trigramas, por exemplo — ignorando a ordem original, mas preservando padrões léxicos recorrentes. Já os TKs avaliam a semelhança estrutural entre sentenças através da comparação de suas árvores sintáticas, mensurando o número de subestruturas comuns.

Com essas representações, o modelo aprende a associar certas formas linguísticas a classificações jurídicas específicas, como cláusulas de jurisdição, de limitação de responsabilidade ou de rescisão unilateral. Um exemplo extraído dos termos de uso da Amazon ilustra bem a sensibilidade do sistema: “As licenças concedidas pela Amazon terminam se você não cumprir estas Condições de Uso ou quaisquer Termos de Serviço.” — tal cláusula, unilateralmente imposta, é tipicamente considerada injusta sob o prisma do direito do consumidor.

Os resultados experimentais do CLAUDETTE indicam uma taxa de acerto em torno de 80% na identificação de cláusulas abusivas, com variações entre categorias: de 72,7% em cláusulas arbitrais até 89,7% em cláusulas de jurisdição. Esses resultados foram obtidos com base em validação cruzada, garantindo que o sistema fosse testado em dados distintos dos usados para seu treinamento.

A capacidade do sistema de generalizar seu desempenho também foi investigada: tanto em contextos contratuais de mercados distintos daqueles presentes no conjunto de treinamento quanto em diferentes idiomas. Embora os resultados variem conforme a estrutura linguística e jurídica local, a promessa de uma IA capaz de navegar por múltiplos contextos legais é significativa.

A aplicação dessa metodologia também foi testada em políticas de privacidade à luz do Regulamento Geral de Proteção de Dados da União Europeia (GDPR). Contudo, os resultados foram menos conclusivos, principalmente devido à complexidade e ambiguidade inerentes a esses documentos. A ausência de estrutura padronizada e o uso intencional de linguagem vaga dificultam a extração automática de informações e o mapeamento preciso de obrigações e direitos.

Apesar dessas limitações, o potencial da IA para analisar e validar conteúdos jurídicos se estende além da proteção ao consumidor. Ferramentas semelhantes podem ser utilizadas para identificar práticas discriminatórias em concessão de crédito, contratação de trabalho e distribuição de benefícios sociais. Além disso, ao evidenciar casos de coleta excessiva ou desnecessária de dados, sistemas baseados em processamento de linguagem natural (NLP) contribuem para a promoção da transparência e da conformidade legal em ambientes digitais.

É fundamental compreender que, por mais eficazes que esses sistemas sejam, eles não substituem a atuação jurídica humana. A anotação dos dados por especialistas, a interpretação normativa dos resultados e a adaptação a contextos específicos continuam sendo indispensáveis. No entanto, a automação de tarefas repetitivas e a análise em larga escala de documentos trazem uma eficiência inédita, abrindo espaço para uma atuação jurídica mais estratégica, proativa e centrada na proteção de direitos fundamentais.