Nos últimos tempos, a presença da inteligência artificial tem se tornado cada vez mais forte em diversas indústrias. Recentemente, a OpenAI lançou um novo benchmark chamado GDPval, que busca avaliar a performance dos seus modelos de IA, como o GPT-5, em comparação com profissionais humanos em várias áreas. E, olha, os resultados são intrigantes!

Introdução

O GDPval é uma tentativa inicial de entender o quão próximo esses modelos estão de superar a qualidade do trabalho humano. A OpenAI afirma que o GPT-5 e o Claude Opus 4.1 da Anthropic estão se aproximando da qualidade produzida por especialistas em suas áreas. É um marco importante na jornada em direção à Inteligência Geral Artificial, ou AGI, como muitos conhecem. Mas, será que estamos prontos para ver as máquinas ocuparem o espaço dos humanos no mercado de trabalho?

O que é o GDPval?

Esse benchmark foi projetado para medir a performance de modelos de IA em 44 ocupações em nove indústrias que mais contribuem para o PIB dos EUA, como saúde, finanças e manufatura. Através de comparações feitas por profissionais experientes, a OpenAI conseguiu determinar que o GPT-5 foi classificado como melhorr ou igual a especialistas humanos em 40,6% dos casos testados. Isso é um avanço significativo se comparado ao GPT-4o, que obteve apenas 13,7% há cerca de um ano e meio atrás.

Como foi feito o teste

No primeiro teste, o GDPval-v0, a OpenAI pediu a profissionais que avaliassem relatórios gerados pela IA em comparação com aqueles produzidos por humanos. Por exemplo,, um prompt solicitou que banqueiros de investimento criassem um panorama competitivo para a indústria de entrega de última milha e comparassem com os relatórios gerados pela IA. A média do “win rate” da IA em relação aos humanos foi então calculada, e os números são promissores.

Dicas para aproveitamento da IA no trabalho

Se você é um profissional em uma dessas indústrias, aqui vão algumas dicas para começar a aproveitar a IA no seu dia a dia:

Conclusão

Embora a OpenAI reconheça que o GDPval ainda cobre uma quantidade limitada de tarefas, os resultados são um indicativo claro do progresso que a IA tem feito. A ideia de que profissionais possam usar esses modelos para se livrar de tarefas repetitivas e se concentrar em atividades mais significativas é, sem dúvida, atraente. Contudo, é fundamental lembrar que a IA deve ser vista como uma ferramenta, não como um substituto.

Estamos vivendo um momento de transição. Não é questão de substituir humanos, mas sim de potencializar suas capacidades. E você, o que acha? Está pronto para trabalhar lado a lado com a IA?