Clonagem de mente! O ex-pesquisador da OpenAI permite que a IA imite o pensamento humano, e a versão real do "Machinery" vem

**Fonte:**Xinzhiyuan

Guia: A que distância estamos de "Machina"? Um ex-pesquisador da OpenAI permite que a IA clone pensamentos, imite o pensamento humano e aja enquanto pensa.

O que acontecerá quando a IA tiver consciência autônoma?

Em "Machina", Ava usa a simpatia humana para induzir os seres humanos a serem livres pelo engano e, finalmente, mata seu "criador" Nathan.

Recentemente, por recomendação de muitos internautas, Sam Altman finalmente assistiu a este filme.

E disse: "É um bom filme, mas não entendo por que todo mundo me faz assistir."

Muitas pessoas podem querer alertar que este é o resultado de tornar a inteligência artificial consciente e passar no teste de Turing.

Mas ainda estamos longe da cena de "Ex Machina". O GPT-5 pode estar sob pesquisa e desenvolvimento secretos, e tornar a IA inteligente ainda é o que os cientistas mais desejam fazer com seus esforços pré-históricos.

Não, dois pesquisadores da University of British Columbia descobriram que há muitas vantagens em os agentes serem capazes de pensar como humanos.

Em seu último artigo, eles estudam a "clonagem de pensamento" (TC) de agentes.

Endereço de papel:

Aqui, a inteligência artificial aprende a "pensar" e "agir" como os humanos, imitando os humanos.

Quando a IA tem pensamentos

Saiba que a linguagem é o que diferencia os humanos dos demais seres vivos.

Portanto, os pesquisadores imaginam que se os agentes pudessem entender a linguagem, haveria muitos benefícios.

Por exemplo, ajudar os humanos a generalizar, inferir, adaptar-se a novas situações, combinar o conhecimento existente de novas maneiras, explorar, planejar e replanejar quando necessário.

Apesar desses benefícios, os agentes de IA raramente pensam, pelo menos não na linguagem humana.

Embora as redes neurais possam ser pensadas como ativações vetoriais internas do pensamento, muitos levantam a hipótese de que há benefícios específicos em pensar em linguagens discretas e simbólicas.

Isso significa que um agente que pode pensar em linguagem pode aprender mais rápido, executar melhor e generalizar melhor do que um agente que não usa linguagem.

Por todas essas razões, aumentar a capacidade dos agentes de IA de pensar em linguagem pode gerar muitas vantagens significativas.

Jeff Clune e Shengran Hu acreditam que a maneira mais eficaz de atingir esse objetivo é "fazer a IA imitar o pensamento humano".

Eles descobriram que os humanos não adquirem habilidades de pensamento isoladamente, mas aprendem em parte por meio da demonstração de outros e do feedback dos professores.

Uma abordagem eficaz, portanto, é que o agente aprenda com demonstrações de humanos expressando seus pensamentos enquanto agem.

Essa abordagem difere do trabalho existente sobre planejamento com LLMs pré-treinados porque esses LLMs não foram treinados em dados de humanos falando seus pensamentos enquanto agem, ou seja, "dados de pensamento".

Quanto à fonte dos "dados de pensamento", os pesquisadores selecionaram vídeos do YouTube e gravações de texto, alguns milhões de horas, contendo os pensamentos por trás das ações, planos, decisões e reprogramação das pessoas.

No artigo, os pesquisadores propuseram uma nova estrutura de aprendizado por imitação "clonagem de pensamento". Dentre eles, o agente não só aprende comportamentos de demonstração humana, como a clonagem de comportamento, mas também aprende a forma de pensar enquanto o ser humano age.

Na estrutura de treinamento de clonagem de pensamento, o agente aprende a gerar pensamentos a cada passo de tempo e, posteriormente, ajusta as ações com base nesses pensamentos.

A estrutura geral Conforme mostrado na figura, o agente TC é uma arquitetura de duas camadas: componentes superiores e inferiores.

A cada intervalo de tempo, o agente recebe como entrada uma observação, uma tarefa e um histórico de pensamento. Os componentes de nível superior são responsáveis pela geração de ideias e os componentes de nível inferior geram ações com base nessas ideias.

Em seguida, os pensamentos e ações gerados são comparados com a verdade básica no conjunto de dados de demonstração para calcular a perda.

Embora possa haver escolhas diferentes para as condições dos componentes superiores e inferiores, neste trabalho, para uma trajetória específica de comprimento t no conjunto de dados da mente, os pesquisadores minimizaram:

Para cenários mais complexos ou de grande escala, os componentes da camada superior podem ser implementados usando um Modelo de Linguagem Visual (VLM) pré-treinado ou zero-shot, ajustado.

Enquanto os componentes inferiores podem ser treinados do zero ou adaptados de controladores condicionais linguísticos existentes no domínio de destino.

No artigo, os pesquisadores realizaram pesquisas com base em dois componentes da arquitetura do modelo BabyAI 1.1.

O modelo aproveita a arquitetura aprimorada de memória LSTM para abordar parte dos desafios de observabilidade. Além disso, ele emprega FiLM para fusão de modalidade, combinando efetivamente entradas visuais e textuais.

Aqui, o autor enfatiza que todos os modelos deste artigo são treinados do zero, mas é melhor usar modelos pré-treinados em campos complexos.

A figura abaixo é um exemplo do ambiente BabyAI. A figura da esquerda contém itens de várias cores (bolas, chaves, caixas, portas).

O agente pode pegar, abaixar, mover objetos ou abrir e fechar portas, enquanto portas trancadas só podem ser abertas com chaves da mesma cor.

O agente pode ver as células da grade 7×7 à sua frente, que são bloqueadas por paredes e portas fechadas.

A tarefa do agente de "clonagem mental" é chegar à caixa roxa (destacada) e começar a planejar a rota.

Mas quando abre a porta azul, pronto para completar a tarefa, encontra uma bola roxa bloqueando o caminho. Então, o agente de clonagem mental é replanejado.

A partir disso, percebe-se que os pensamentos e ações do agente indicam que, ao encontrar um obstáculo, ele primeiro o remove e replaneja a rota antes de continuar com o objetivo anterior.

Esse processo é especialmente como Ava planeja passo a passo, para que os seres humanos finalmente acreditem e se ajudem, e escapem da jaula de vidro que está aprisionada há muito tempo.

Resultados experimentais

As descobertas sugerem que a "clonagem de pensamento" é superior à clonagem comportamental.

Além disso, nas configurações de tiro zero e ajuste fino, a clonagem mental supera a clonagem de comportamento em tarefas fora de distribuição.

Curiosamente, os pesquisadores também desenvolveram "intervenções pré-crime" que permitem aos usuários definir comportamentos inseguros após o treinamento do modelo.

Quando pensamentos perigosos são detectados, o agente pode ser encerrado. Nos testes, a Intervenção pré-criminal funcionou quase perfeitamente, mostrando seu potencial para segurança de IA.

A "clonagem mental" não apenas torna a inteligência artificial mais inteligente, mas também mais segura e fácil de entender.

Ou seja, antes que a IA cometa um crime, tudo ainda pode ser salvo.

Na visão de Jeff Clune, a "clonagem de pensamento" contribui para a segurança da inteligência artificial.

Porque podemos observar a mente do agente: (1) pode diagnosticar mais facilmente por que as coisas dão errado, (2) guiar o agente corrigindo sua mente, (3) ou impedi-lo de fazer o planejado.

Sobre o autor

Jeff Clune

Atualmente, Jeff Clune é Professor Associado de Ciência da Computação na University of British Columbia. Sua pesquisa se concentra em aprendizado profundo, incluindo aprendizado profundo por reforço.

Anteriormente, ele também foi chefe da equipe de pesquisa OpenAI e gerente sênior de pesquisa e membro fundador do Uber Artificial Intelligence Lab.

Anteriormente, ele e a equipe da OpenAI lançaram um modelo de pré-treinamento em vídeo - VPT, permitindo que a IA aprendesse picaretas de pedra a partir de dados de vídeo no Minecraft.

Shengran Hu

Atualmente estudante de doutorado na University of British Columbia, interessado em aprendizado profundo, algoritmos geradores de inteligência artificial.

Referências:

Ver original
O conteúdo serve apenas de referência e não constitui uma solicitação ou oferta. Não é prestado qualquer aconselhamento em matéria de investimento, fiscal ou jurídica. Consulte a Declaração de exoneração de responsabilidade para obter mais informações sobre os riscos.
  • Recompensa
  • Comentar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate.io
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)