Mateus Schmitz
Posts

A métrica que incentiva desperdício em nome da produtividade

Recentemente, conversando com um amigo que trabalha como engenheiro de software, ele comentou que a empresa onde trabalha passou a medir o desempenho com base no volume de consumo de tokens. Essa conversa aconteceu há cerca de duas semanas, quando comecei a escrever esta reflexão.

Na hora, o que me veio à cabeça foi o incentivo perverso que isso se tornaria ao longo do tempo, mas, aparentemente, as coisas andaram bem mais rápido do que eu imaginava. Só nesta semana vi um vídeo do OPrimoDev e reportagens no UOL e no Ars Technica falando exatamente sobre esse efeito.

A empresa de que falávamos não é a única, conheço pelo menos mais uma dezena de empresas que adotam esse tipo de métrica, e muitas delas também as têm utilizado em ciclos de avaliação de desempenho. Enquanto eu acho que esse indicador pode ser uma ótima métrica para avaliar o engajamento, ele é péssimo pra avaliar o desempenho. No fim, estamos medindo atividade e não resultado ou entrega de valor.

Métricas não são neutras. Elas moldam o comportamento, muitas vezes de forma mais rápida e profunda do que qualquer discurso cultural.

Métricas não são neutras. Elas moldam o comportamento, muitas vezes de forma mais rápida e profunda do que qualquer discurso cultural. Quando uma organização decide acompanhar o volume de uso como indicador, ela sinaliza, ainda que indiretamente, que "usar mais" é melhor do que "usar melhor".

O efeito prático disso tende a ser previsível. Pessoas passam a interagir com ferramentas mesmo quando não há necessidade clara, refinam menos suas entradas, repetem ciclos desnecessários e priorizam o volume em detrimento da eficiência. Não porque sejam ineficientes, mas porque estão respondendo exatamente ao sistema de incentivos que foi criado.

Esse tipo de métrica também introduz uma distorção econômica relevante. Em vez de orientar a organização para o ganho de eficiência, ela pode estimular o aumento dos custos operacionais sem contrapartida proporcional no valor entregue. É uma dinâmica sutil, mas perigosa: o indicador cresce, a percepção de produtividade melhora, mas o impacto real permanece estável ou, em cenários extremos, diminui.

O ponto central é que indicadores de esforço e/ou de atividade raramente são bons indicadores de desempenho. Número de commits, pull requests abertos, chamados respondidos ou volume de tokens utilizados são, em essência, métricas de atividade. Isoladamente, elas dizem muito pouco sobre desempenho real. A medição precisa estar em outra camada, no impacto real no negócio, qualquer coisa além disso é complementar.

Adotar métricas inadequadas não apenas gera leituras equivocadas, mas também incentiva comportamentos que vão na direção oposta àquela que se pretende construir. No limite, cria-se um ambiente em que o "teatro de produtividade" substitui a desejada produtividade real.

No fim, a discussão não é necessariamente sobre a tecnologia em si, mas sim sobre os incentivos que estamos criando ao usar essas ferramentas. É muito mais sobre diferenciar o que é fácil de medir do que o que de fato deveria ser medido.

E cedo ou tarde, toda empresa se transforma naquilo que incentiva.

Pronto para discutir seu contexto?

Compartilhe o estágio atual da sua empresa, o formato do time e os desafios de execução. Eu respondo em até 1 dia útil com uma recomendação de próximo passo.

Compartilhe seu contexto