ChatGPT, chatbot de inteligência artificial da OpenAI, erra em mais da metade das respostas sobre programação, de acordo com um novo estudo da Purdue University. A pesquisa, apresentada na Computer-Human Interaction Conference no Havaí, analisou 517 perguntas de programação do Stack Overflow e as submeteu ao ChatGPT.
- China cria IA comunista treinada com livros de Xi Jinping
- ChatGPT consegue fingir emoções humanas
- Apple prepara Siri com ChatGPT integrado
Os resultados revelaram que 52% das respostas do ChatGPT continham informações incorretas e 77% eram excessivamente longas. Apesar disso, os participantes do estudo preferiram as respostas do ChatGPT em 35% das vezes, devido à sua abrangência e linguagem bem articulada.
Erros de programação no ChatGPT são preocupantes
Um dado preocupante é que os programadores participantes do estudo não conseguiram identificar os erros do chatbot em 39% das vezes. Isso indica a necessidade de combater a desinformação nas respostas do ChatGPT e conscientizar sobre os riscos de respostas aparentemente corretas.
ChatGPT desabilita recurso resposta em áudio
Este estudo levanta questões sobre a confiabilidade dos chatbots de IA, que estão sendo vendidos como ferramentas revolucionárias. Grandes empresas de tecnologia, como Meta, Microsoft e Google, estão investindo bilhões de dólares em IA, mas a precisão ainda é um grande obstáculo.
Chatbot do Google também enfrenta problemas
O Google, por exemplo, tem enfrentado problemas com seu novo recurso de pesquisa com IA, que frequentemente apresenta informações falsas e até mesmo artigos satíricos como fontes confiáveis. A empresa se defende afirmando que as respostas erradas são raras, mas isso não resolve o problema da confiabilidade.
Grok: inteligência artificial do X é liberada no Brasil
A questão da confiabilidade dos chatbots de IA é central para o futuro da tecnologia e para a relação dos usuários com a internet. Embora o estudo da Universidade de Purdue seja um alerta, ele também destaca a necessidade de avanços contínuos e de um uso mais crítico dessas ferramentas por parte dos usuários.
Fonte: Purdue University