A nova fronteira da IA: modelos de base, gêmeos cerebrais e inteligência no mundo físico
- há 13 horas
- 10 min de leitura
Este é o segundo artigo da série sobre o São Paulo Innovation Week 2026, realizado entre 13 e 15 de maio, na Mercado Livre Arena Pacaembu e na FAAP. A proposta da série é transformar anotações de palestras e painéis em análises acessíveis sobre inteligência artificial, inovação e transformação digital. O evento se apresenta como um festival global de tecnologia e inovação e ocorreu nesses dois espaços em São Paulo. No primeiro artigo desta série, a discussão partiu da diferença entre chatbot, assistente e agente de IA. A segunda anotação do SP Innovation Week 2026 amplia o horizonte: a inteligência artificial já não aparece apenas como ferramenta de conversa ou automação de tarefas. Ela começa a ser discutida como uma infraestrutura de base, capaz de interpretar múltiplos tipos de dados, operar com outros agentes, interagir com o mundo físico e apoiar humanos diante de uma sobrecarga crescente de informação. A mudança central pode ser resumida assim: estamos saindo de uma IA especialista, criada para resolver tarefas específicas, para uma IA de base, adaptável a diferentes contextos.
Da IA especialista à IA de base
Durante muitos anos, boa parte das aplicações de IA foi construída em torno de modelos especializados. Um sistema classificava imagens. Outro reconhecia voz. Outro traduzia textos. Outro recomendava produtos. Cada solução tinha um escopo relativamente limitado.
A nova fase da IA é diferente. Modelos treinados em grande escala passam a funcionar como uma base sobre a qual diferentes aplicações podem ser construídas. Eles não resolvem apenas uma tarefa isolada. Podem ser adaptados para escrever, resumir, classificar, interpretar imagens, responder perguntas, gerar código, analisar documentos, apoiar decisões ou coordenar ações com outros sistemas.
É essa passagem que torna a discussão mais estratégica. A pergunta deixa de ser apenas “qual ferramenta de IA usar?” e passa a ser: que tipo de infraestrutura cognitiva a organização está construindo?
TRIBE v2 e a ideia de um gêmeo cerebral
Um dos exemplos exibidos na palestra foi o TRIBE v2, da Meta Research. O slide apresentava o modelo como um Predictive Foundation Model treinado para compreender como o cérebro humano processa estímulos complexos.
A Meta descreve o TRIBE v2 (figura 1) como um modelo preditivo de fundação voltado a prever respostas cerebrais humanas diante de estímulos complexos, como imagens, vídeos, áudio e texto. O modelo combina diferentes componentes, incluindo modelos para visão, áudio e linguagem, com o objetivo de aproximar inteligência artificial e neurociência computacional.
Na palestra, esse ponto apareceu associado à ideia de gêmeo cerebral. O termo deve ser tratado com cuidado. Não se trata de afirmar que já existe uma cópia perfeita do cérebro humano. A ideia é mais precisa e mais interessante: modelos capazes de representar, prever ou simular padrões de resposta cerebral diante de determinados estímulos.
Essa fronteira é relevante porque desloca a IA para um território mais profundo. Não estamos falando apenas de máquinas que classificam dados externos, mas de modelos que tentam relacionar estímulos, linguagem, percepção e atividade cerebral.
Para maiores informações sobre a criaçao de gêmeo cerebral, tem paper disponível em https://ai.meta.com/research/publications/a-foundation-model-of-vision-audition-and-language-for-in-silico-neuroscience/
O modelo está catalogado no Hugging Face, confira em https://huggingface.co/facebook/tribev2
O código do projeto está no github: https://github.com/facebookresearch/tribev2
Do pensamento ao texto: promessa, fronteira e cautela
A expressão think-to-text, ou “do pensamento para o texto”, também apareceu no evento. Ela provoca fascínio imediato, porque sugere um cenário em que uma intenção mental poderia ser convertida diretamente em linguagem escrita.
Mas aqui é preciso evitar o sensacionalismo. A questão não é imaginar, de forma simplista, celulares lendo pensamentos no cotidiano. O ponto mais sério é acompanhar pesquisas que tentam relacionar sinais cerebrais, linguagem e modelos preditivos.
Esse campo pode ter aplicações importantes, especialmente em acessibilidade, saúde e interfaces cérebro-computador. Ainda assim, exige cuidado conceitual, ético e jurídico. Quando a IA se aproxima de dados neurais, privacidade e consentimento deixam de ser detalhes técnicos e passam a ser questões centrais.
A University of Technology Sydney (UTS) está trabalhando com pesquisas sobre leitura de mentes e trasncrição para texto desde 2023, confira em:
Physical AI: quando a IA precisa entender o mundo físico
Outro bloco importante da palestra foi a chamada Physical AI. Se a IA generativa popularizou modelos que escrevem, resumem, conversam e programam, a Physical AI desloca a discussão para sistemas capazes de perceber e atuar no mundo real.
A NVIDIA usa o termo Physical AI (figura 2) para se referir a uma nova geração de sistemas autônomos capazes de perceber, compreender e executar ações complexas no mundo físico, como robôs, veículos autônomos e máquinas industriais inteligentes. Trata-se de combinar a compreensão do conhecimento abstrato nos LLMs, juntamente com uma compreensão da física do mundo para, em seguida, produzir tokens de ação. A empresa acredita que uma vez que resolvemos esse problema de Physical AI, podemos melhorar tudo, desde fábricas e armazéns até todo o transporte, e humanóides e outros robôs podem fazer o equivalente ao trabalho físico humano.

Para uma pessoa, uma bola quicando no chão continua sendo a mesma bola em movimento. Para um sistema de IA mal treinado, cada subida, descida, sombra, deformação ou mudança de posição pode parecer um novo estado difícil de interpretar.
O mundo físico é ambíguo, contínuo e imprevisível. Objetos mudam de posição, luzes variam, superfícies refletem, pessoas se movem, sensores falham e pequenos erros podem ter consequências concretas. Por isso, aplicar IA ao mundo físico é muito diferente de gerar um texto ou responder a uma pergunta em uma tela.
Dados sintéticos e simulação
Essa dificuldade ajuda a explicar o interesse por dados sintéticos e ambientes simulados. Em vez de depender apenas de dados coletados no mundo real, empresas e pesquisadores podem criar cenários virtuais para treinar modelos.
Eventos atípicos são, por natureza, difíceis de documentar. Um exemplo claro é o comportamento de um indivíduo em atitude suspeita, realizando uma campana para identificar vulnerabilidades em um imóvel. Diferente do reconhecimento facial, amplamente presente em sistemas de IA tradicionais, o desafio aqui não é identificar quem é o indivíduo, mas sim interpretar a intenção da ação.
Em centrais de monitoramento, a fadiga humana impede que um vigilante identifique anomalias em tempo real diante de dezenas de telas. No entanto, sistemas treinados para a análise comportamental podem emitir alertas preditivos, direcionando a atenção do operador para eventos críticos.
Durante sua apresentação, Arlindo Galvão, diretor do CEIA-UFG, destacou o papel fundamental dos dados sintéticos gerados em simuladores e motores de jogos, como o Grand Theft Auto (GTA). Ambientes virtuais permitem a criação de:
Eventos raros e anomalias: Acidentes e comportamentos criminosos difíceis de capturar massivamente na realidade.
Escalabilidade: Geração de grandes volumes de dados para treinamento de modelos de visão computacional.
Diversidade de cenários: Simulação de variações climáticas, iluminação e contextos urbanos.
Essa abordagem é essencial para o avanço de setores como veículos autônomos, robótica, segurança pública e análise de risco, permitindo que a IA aprenda a reagir a situações imprevistas antes mesmo que elas ocorram no mundo físico.
SLMs, IA local e eficiência
A palestra também tocou em SLMs, os Small Language Models. O tema é importante porque nem toda aplicação precisa de um modelo gigantesco rodando na nuvem.
Modelos menores podem ser mais eficientes para tarefas específicas. Podem reduzir custo, latência e dependência de infraestrutura externa. Em alguns casos, também podem favorecer privacidade, já que parte do processamento pode ocorrer localmente.
Os SLMs são a grande tendência para 2025 e 2026, pois resolvem o problema do custo e da privacidade. Diferente dos gigantes como o GPT-4, eles são "leves" o suficiente para rodar localmente (no celular ou no computador) sem precisar de internet.
Aqui estão alguns exemplos de aplicações de SLMs:
Smartphones e Assistentes Pessoais (On-device AI)
Esta é a aplicação mais comum. As fabricantes usam SLMs para que o celular entenda o que você diz sem enviar seus dados para a nuvem.
Google Gemini Nano: Roda nativamente em aparelhos Android (como a linha Pixel e o Galaxy S24/S25). Ele é usado para resumir gravações de voz, sugerir respostas inteligentes no teclado e revisar textos sem usar Wi-Fi.
Apple Intelligence: Utiliza modelos compactos (estimados em 3 bilhões de parâmetros) que rodam no chip do iPhone para priorizar notificações e ajudar na escrita.
Atendimento ao Cliente e Suporte Técnico
Empresas não precisam de um modelo que saiba física quântica para resolver um problema de rastreio de pacote.
Microsoft Phi-3 / Phi-4: São modelos minúsculos da Microsoft que as empresas instalam em seus próprios servidores. Um e-commerce pode usar o Phi-3 para ler manuais de produtos e responder dúvidas específicas de clientes com rapidez e baixo custo computacional.
Setores de Saúde e Jurídico (Privacidade Estrita)
Em hospitais ou escritórios de advocacia, os dados são sensíveis e não podem sair da rede local.
Llama 3 (versão 8B) ou Mistral 7B: Embora sejam "populares", suas versões menores são consideradas SLMs no contexto corporativo. Eles são usados para resumir prontuários médicos ou analisar contratos dentro de servidores privados (offline), garantindo que nenhuma informação vaze para Big Techs.
Internet das Coisas (IoT) e Indústria
Imagine uma câmera de segurança ou um robô industrial que precisa tomar decisões rápidas.
Modelos de Visão-Linguagem Pequenos: Como citado no seu texto anterior sobre o CEIA-UFG, modelos compactos podem ser embutidos em câmeras inteligentes para identificar se alguém está "rondando" um portão e disparar um alerta imediato, sem depender da latência da internet.
O gargalo da infraestrutura
Esse ponto leva a uma questão brasileira importante. A palestra trouxe a provocação de que não temos infraestrutura suficiente no Brasil para parte dessa nova geração de IA.
Eu não transformaria isso em uma afirmação absoluta, porque depende do setor, da organização e do tipo de aplicação. Mas a preocupação é legítima. IA avançada exige poder computacional, dados organizados, conectividade, segurança, equipes qualificadas e capacidade de atualizar hardware e arquitetura com frequência. Recentemente conversei com Ana Estela Haddad, secretária de informação e saúde digital, vinculada ao Ministério da Saúde e ela disse existir um grande esforço por parte do governo federal em trazer grandes data centers para o Brasil.
A própria evolução do hardware cria pressão. Arquiteturas de IA mudam rapidamente, e o que hoje parece moderno pode se tornar limitado em poucos anos. Isso afeta universidades, empresas, hospitais, laboratórios e governos.
Quantum to business: quando a fronteira encontra o mercado
A expressão quantum to business apareceu na palestra como outro sinal dessa tentativa de aproximar tecnologias profundas do ambiente empresarial. Tecnologias antes restritas ao laboratório começam a entrar na agenda de executivos, gestores, universidades e áreas de inovação. O desafio é traduzir potencial científico em aplicação real, sem cair em promessas vagas.
Esse é um problema recorrente em inovação. Nem toda tecnologia emergente está pronta para uso amplo. E nem toda organização tem maturidade para absorvê-la.
Por isso, a ponte entre pesquisa e negócio precisa passar por experimentação, formação, infraestrutura e governança.
Universidades e formação de quadros
A palestra também levantou uma pergunta essencial: como formar pessoas para esse novo cenário?
Não basta ensinar ferramentas. É preciso formar profissionais capazes de compreender modelos, dados, processos, riscos, infraestrutura, ética e domínio de aplicação. A IA deixa de ser apenas um assunto de programadores e passa a atravessar saúde, direito, administração, educação, indústria, finanças, comunicação e setor público.
Um exemplo brasileiro relevante é o Bacharelado em Inteligência Artificial da UFG. Segundo a própria universidade, o curso tem duração de oito semestres, turno integral e sede no Câmpus Samambaia. A página do Instituto de Informática afirma que o objetivo é formar profissionais aptos a resolver problemas complexos por meio da IA, incluindo sistemas embarcados e autônomos.
Esse tipo de formação aponta para uma necessidade maior: criar quadros capazes de trabalhar tanto com fundamentos quanto com aplicações. A demanda não será apenas por usuários de IA, mas por pessoas capazes de projetar, avaliar, auditar e adaptar sistemas inteligentes.
O contraste com organizações ainda analógicas
Um ponto de destaque nas discussões recentes é o paradoxo de instituições hospitalares que buscam implementar Inteligência Artificial, mas ainda dependem de prontuários físicos. No entanto, observa-se um movimento de modernização: no SUS, a transição para o formato digital é gradual e contínua, enquanto na saúde suplementar, a digitalização já é uma realidade consolidada em grande parte das redes.
Essa frase revela um problema comum. Muitas organizações desejam aplicar inteligência artificial sem antes resolver etapas básicas de transformação digital. Querem modelos preditivos, agentes e automação, mas ainda convivem com dados fragmentados, processos manuais, baixa interoperabilidade e registros pouco estruturados.
A IA não corrige sozinha a desorganização institucional. Em alguns casos, ela apenas expõe o problema. Para usar IA com responsabilidade, a organização precisa saber onde estão seus dados, quem pode acessá-los, como são atualizados, quais sistemas conversam entre si e quais decisões podem ser automatizadas.
Racismo algorítmico, legislação e guardrails
Quanto mais a IA avança para decisões reais, maior a importância de discutir racismo algorítmico, viés, legislação e guardrails.
Se modelos são treinados com dados históricos marcados por desigualdades, podem reproduzir ou ampliar discriminações. Isso é especialmente grave em áreas como crédito, recrutamento, segurança, saúde, educação e acesso a serviços públicos.
Por isso, guardrails não devem ser vistos apenas como filtros técnicos. Eles fazem parte de uma arquitetura de responsabilidade. Envolvem limites de uso, auditoria, documentação, explicabilidade, avaliação de impacto, supervisão humana e conformidade com normas legais.
A pergunta não é apenas “a IA funciona?”. É também: para quem funciona, em quais condições, com quais dados e sob qual responsabilidade?
A principal mensagem da palestra
Essa palastra mostrou uma IA em expansão. Ela já não cabe apenas na imagem do chatbot, nem mesmo na do agente corporativo. A discussão agora alcança modelos de base, gêmeos cerebrais, dados sintéticos, Physical AI, SLMs, computação local, infraestrutura, formação universitária e riscos sociais.
Essa ampliação é fascinante, mas também exige prudência. Quanto mais a IA se aproxima do cérebro, do corpo, do mundo físico e das decisões institucionais, maior precisa ser o cuidado com governança, ética e responsabilidade.
A pergunta, portanto, não é apenas como usar IA. É que tipo de infraestrutura, formação e controle social precisamos construir para que essa tecnologia amplie capacidades humanas sem reproduzir, em escala, os erros das nossas organizações.
Este é o segundo artigo da série sobre o SP Innovation Week 2026. No próximo texto, sigo acompanhando as discussões do evento e seus impactos para empresas, universidades e profissionais que precisam entender a inteligência artificial para além do discurso da moda.
Glossário rápido
IA especialista | Sistema de inteligência artificial desenvolvido para uma tarefa específica, como classificar imagens, reconhecer voz ou recomendar produtos. |
Modelo de base | Modelo treinado em larga escala que pode ser adaptado para diferentes tarefas e contextos. |
TRIBE v2 | Modelo da Meta Research voltado à previsão de respostas cerebrais humanas diante de estímulos complexos. |
Gêmeo cerebral | Metáfora para modelos que tentam representar ou simular padrões de resposta do cérebro. Não significa uma cópia completa do cérebro humano. |
Think-to-text | Campo de pesquisa relacionado à conversão de sinais ou intenções cerebrais em linguagem textual. |
Physical AI | IA aplicada ao mundo físico, como robôs, veículos autônomos, máquinas industriais e sistemas capazes de perceber e agir no ambiente real. |
Dados sintéticos | Dados criados artificialmente, muitas vezes por simulações, para treinar ou testar modelos de IA. |
SLM | Small Language Model, ou modelo de linguagem menor, geralmente usado para tarefas mais específicas e com menor custo computacional. |
Guardrails | Regras, limites e mecanismos de segurança que orientam o que um sistema de IA pode ou não pode fazer. |
Racismo algorítmico | Reprodução ou ampliação de desigualdades raciais por sistemas automatizados, geralmente por causa de dados enviesados, escolhas de modelagem ou ausência de auditoria. |




Comentários