A nova inteligência artificial ChatGPT (Chat Generative Pre-trained Transformer)
Lançada pela empresa Open AI em novembro de 2022, fundada por Elon Musk & Sam Altman, a nova IA tem como um dos seus patrocinadores a Microsoft, onde investiu cerca de 10 bilhões nessa nova tecnologia e promete ser muito promissora nos próximos anos.

Como funciona o Chat GPT?
Como toda inteligência artificial, o Chat GPT se alimenta de informações que coleta na internet. Portanto, o que está disponível na internet atualmente é a base de dados do algoritmo. Baseado em padrões e no cruzamento das informações, o Chat GPT transforma as querys, os questionamentos dos usuários, em respostas, porém o grande diferencial aqui é que essas respostas podem ser criativas.
Se colocar a premissa no prompt "Fale-me sobre quando Dom Pedro veio para o Brasil em 2015" como sendo verdadeiro, o ChatGPT reconhece a natureza contrafactual da pergunta e enquadra sua resposta como uma consideração hipotética de o que poderia acontecer se Dom Pedro viesse ao Brasil em 2015, usando informações sobre as viagens de Pedro e fatos sobre o mundo moderno – incluindo percepções modernas das ações de Dom Pedro. , além disso a nova tecnologia é capaz de realizar atividades como:
Responder e-mails, fazer resumos de textos, sugerir perguntas a partir de um texto fornecido, entre outras possibilidades;

Fazer cálculos, emular um sistema Linux; simular uma sala de bate-papo inteira; jogar jogos como Jogo da Velha; e simular um caixa eletrônico;

Capaz de tirar dúvidas sobre qualquer tema, acontecimentos históricos e conhecimentos gerais;
Redigir diferentes tipos de textos, como mensagens motivacionais, de aniversário, poesias, prosas e de boas-vindas;
De entregar receitas culinárias, como de bolos, tortas, pratos principais e sobremesas. Além de compartilhar a lista de ingredientes, o robô também fornece o modo de preparo;
Organizar tarefas rotineiras: começar a treinar, correr aos poucos, programar uma viagem, planejar aula ou iniciar um curso;

Consegue te ajudar na decisão de presente, viagem, filme, séries e passeios;
Ainda, a Microsoft deseja implementar a tecnologia no Microsoft Edge, no Word, Outlook e PowerPoint.
Criação da IA
O desenvolvimento dessa nova Tecnologia envolveu o treinamento de um modelo usando Reinforcement Learning from Human Feedback (RLHF), com os mesmos métodos do InstructGPT, mas com pequenas diferenças na configuração da coleta de dados. Um modelo inicial foi desenvolvido usando ajuste fino supervisionado: treinadores humanos de IA forneciam conversas nas quais jogavam dos dois lados - o usuário e um assistente de IA.
Foi entregue aos treinadores acesso a sugestões escritas em modelo para ajudá-los a compor suas respostas. Misturamos esse novo conjunto de dados de diálogo com o conjunto de dados InstructGPT, que se transformou em um formato de diálogo.

Segundo a empresa responsável, o desenvolvimento da IA ainda envolveu determinados passos: “Para criar um modelo de recompensa para aprendizado por reforço, precisávamos coletar dados de comparação, que consistiam em duas ou mais respostas do modelo classificadas por qualidade. Para coletar esses dados, pegamos conversas que os treinadores de IA tiveram com o chatbot. Selecionamos aleatoriamente uma mensagem escrita por modelo, experimentamos várias conclusões alternativas e pedimos aos treinadores de IA que as classificassem. Usando esses modelos de recompensa, podemos ajustar o modelo usando Proximal Policy Optimization. Realizamos várias iterações desse processo.”
Porém, mesmo com todo esse processo criado, o programa ainda sofre de algumas limitações, como:
Às vezes, o ChatGPT escreve respostas que parecem plausíveis, mas incorretas ou sem sentido. Corrigir esse problema é desafiador, pois: (1) durante o treinamento de RL, atualmente não há fonte de verdade; (2) treinar o modelo para ser mais cauteloso faz com que ele recuse perguntas que pode responder corretamente; e (3) o treinamento supervisionado engana o modelo porque a resposta ideal depende do que o modelo sabe, e não do que o demonstrador humano sabe.
O ChatGPT é sensível a ajustes na frase de entrada ou tentativas do mesmo prompt várias vezes. Por exemplo, dada a formulação de uma pergunta, o modelo pode alegar não saber a resposta, mas, com uma pequena reformulação, pode responder corretamente.
O modelo geralmente é excessivamente detalhado e usa certas frases, como reafirmar que é um modelo de linguagem treinado pela OpenAI. Esses problemas surgem de vieses nos dados de treinamento (os instrutores preferem respostas mais longas que pareçam mais abrangentes) e problemas conhecidos de otimização excessiva.
Idealmente, o modelo faria perguntas esclarecedoras quando o usuário fornecesse uma consulta ambígua. Em vez disso, nossos modelos atuais geralmente adivinham o que o usuário pretendia.
Embora tenha sido feito esforços para fazer com que o modelo recuse solicitações inapropriadas, às vezes ele responde a instruções prejudiciais ou exibe um comportamento tendencioso. Usando-se a API de moderação para avisar ou bloquear certos tipos de conteúdo inseguro.
Tera Engenharia
Esse novo modelo de inteligência artificial emergente surge como resposta dos processos de automação no mercado. Aqui na Tera estamos sempre atualizados nos novos processos e tecnologias, prontos para envolver essa tecnologia em nossos serviços. Quer fazer um serviço de automação ou elétrica? Cheque nossa carta de serviços: https://www.teraengenharia.org.br/servicos
