A era de um único agente terminou oficialmente: se não consegue vencer um, então tente com 300

Agente finalmente vai deixar de “trabalhar sozinho” e entrar na segunda fase de evolução?

Justamente nesta madrugada, a face oculta da lua foi oficialmente lançada e o modelo de última geração da série Kimi — Kimi K2.6 — foi open source, menos de 3 meses após o lançamento da versão anterior, K2.5. Após o lançamento, a repercussão foi enorme, com o número de visualizações no Twitter oficial já atingindo 4 milhões.

Atualmente, os Agentes enfrentam dificuldades ao lidar com projetos de engenharia complexos; embora sejam bons em realizar tarefas específicas de forma independente, ainda faltam na colaboração em equipe. Como superar essa limitação tornou-se o objetivo central do Kimi K2.6.

A nova versão explorou como estimular a capacidade de trabalho em equipe dos Agentes: reforçando ainda mais a funcionalidade de Enxame de Agentes (Agent Swarm) introduzida no K2.5, por meio da adaptação a frameworks como OpenClaw, fortalecendo o trabalho proativo dos Agentes. Além disso, o novo Claw Group (Grupo Claw) complementa essa capacidade de organização e colaboração. Essa combinação sistemática de habilidades constrói um sistema de IA mais próximo de uma equipe humana.

Para realizar tudo isso, o modelo de base precisa ser suficientemente robusto. Desta vez, o Kimi K2.6 apresenta avanços claros nas capacidades essenciais de Agentes gerais, código e compreensão de imagens. Testes como o Exame Final da Humanidade (Humanity’s Last Exam), o SWE-Bench Pro, que simula cenários reais de desenvolvimento, e o DeepSearchQA, que avalia a capacidade de busca profunda do Agente, mostram que o K2.6 lidera com folga seus concorrentes.

Mesmo comparando o K2.6 com modelos fechados como GPT-5.4, Claude Opus 4.6 e Gemini 3.1 Pro, ele não fica atrás, e em alguns indicadores até supera alguns deles.

A plataforma de avaliação de grandes modelos Artificial Analysis anunciou o resultado mais recente: “Kimi K2.6 torna-se o novo rei dos modelos open source”!

Após o lançamento do Kimi K2.6, a plataforma de agregação de grandes modelos OpenRouter deu uma avaliação bastante positiva, destacando que o novo modelo da face oculta da lua foca na capacidade de programação de longo prazo, sendo especialmente criado para cenários que exigem execução contínua de Agentes. Em comparação com os chatbots tradicionais, ele funciona mais como um “engenheiro de sistemas”, capaz de decompor tarefas complexas, executá-las passo a passo e otimizar continuamente durante o processo.

Alguns usuários comentaram que o modelo flagship Kimi desta geração é incrivelmente forte, já podendo competir de igual para igual com GPT-5.4 na escrita de código, além de ser mais barato que Opus 4.7, além de ser open source e gratuito. Atualmente, a cada poucos meses, surge um novo modelo open source que se aproxima do GPT e Claude fechados. “Sinto que os modelos open source realmente estão alcançando, e tudo isso é impulsionado por China.”

12 horas seguidas, 300 Agentes trabalhando simultaneamente

A forma definitiva do Agente chegou?

Desta vez, o Kimi K2.6 continua avançando na área de programação. Alguns dias atrás, ainda em discussão internacional, foi lançado discretamente o Kimi K2.6-Code-Preview, e há grande expectativa pelo lançamento oficial do K2.6.

Como o modelo mais poderoso até agora na capacidade de programação da série Kimi, o Kimi K2.6 atingiu uma inovação na capacidade de codificação de longo prazo, ajudando a aprofundar a automação no desenvolvimento de software e etapas de engenharia.

Por exemplo, o Kimi K2.6 consegue baixar e rodar com sucesso o Qwen3.5-0.8B localmente no Mac. Ele não segue a stack tecnológica comum, mas reescreve o fluxo de raciocínio usando a linguagem pouco comum Zig, e continua otimizando, demonstrando sua capacidade de generalização.

Todo o processo durou mais de 12 horas, durante as quais foram utilizados mais de 4000 recursos de ferramentas, com 14 rodadas de iteração. Com ajustes de parâmetros e reestruturações, a velocidade de raciocínio aumentou de cerca de 15 tokens por segundo para aproximadamente 193 tokens por segundo, sendo cerca de 20% mais rápido que o aplicativo de chat com modelo grande local LM Studio.

O foco desta atualização do Kimi K2.6 foi reforçar ainda mais a capacidade de colaboração do Enxame de Agentes. Em resumo, essa funcionalidade visa organizar de forma eficiente “como os Agentes trabalham juntos”.

Até agora, o que é possível fazer? O K2.6 consegue decompor automaticamente uma tarefa complexa, distribuir entre Agentes especializados em busca, pesquisa aprofundada, análise de documentos, redação de textos longos, e depois juntar os resultados para avançar.

Com esse mecanismo, uma única execução consegue completar toda a cadeia: desde dados brutos, conteúdo de páginas web, até PPTs e planilhas, tudo gerado automaticamente, sem necessidade de troca de ferramentas ou intervenção manual.

Além disso, a arquitetura do Enxame de Agentes foi expandida para suportar até 300 sub-Agentes simultâneos, realizando até 4000 passos de colaboração, elevando a capacidade de processamento paralelo a um novo patamar. Com essa escala, o papel da IA também mudou: ela passa a assumir o controle de todo o fluxo e fornecer resultados sistematizados.

Por exemplo, um Enxame de Agentes utilizou uma extensa quantidade de dados visuais de uma tese de física, gerando um relatório de cerca de 7000 palavras, 20 mil conjuntos de dados e 14 gráficos.

Para evoluir a IA para um trabalhador cibernético que funcione 24/7 sem intervenção humana, o Kimi K2.6 fez uma adaptação mais profunda aos frameworks OpenClaw, Hermes Agent, entre outros.

Para isso, o Kimi K2.6 aprimorou ainda mais a autonomia do modelo: seja na precisão das chamadas de API, na estabilidade de longas execuções ou na segurança ao realizar tarefas de pesquisa complexas, ele apresenta desempenho notável.

Na área de Vibe Coding, o design do site do Kimi K2.6 ficou mais impressionante. Os sites gerados pelo K2.6, especialmente a primeira tela, têm um impacto visual forte, com uma estética consistente. Além disso, elementos interativos e efeitos de rolagem adicionados atraem os usuários a permanecerem mais tempo.

Além do front-end, o Kimi K2.6 trouxe novidades para os desenvolvedores back-end, incluindo login na conta Kimi e coleta de informações de formulários. Você pode criar uma página de inscrição para eventos e facilmente verificar os dados recebidos, tornando a integração front-end e back-end mais fluida.

Atualmente, o Kimi K2.6 é o modelo padrão para a versão web, app e assistente de programação Kimi Code. Aproveite para experimentar.

Testes práticos, impressionando a todos

Sem mais delongas, vamos testar alguns casos e ver os resultados.

Na primeira parte do teste, usamos o “Agente K2.6”, avaliando tanto a utilidade quanto a estética, para verificar se consegue criar efeitos front-end visualmente atraentes.

Alguém gosta de “Persona 5”?

É um estilo artístico altamente reconhecível, uma violência visual disfarçada de mangá. Usa um design altamente irregular para desafiar a estética convencional, incorporando o tema de “rejeitar a mediocridade social” em pixels e linhas. Uma fusão perfeita entre design gráfico e espaço 3D, com símbolos de mangá e expressão visual profundamente integrados.

Se abríssemos um bar no estilo P5, como seria a página inicial?

Durante a construção do front-end, o Kimi K2.6 realizou testes completos, até simulando cliques:

Além disso, criamos um easter egg: o Kimi K2.6 reproduziu uma animação baseada na abertura do “Persona 5 Royal”, sem fornecer qualquer material, apenas uma pequena animação.

Depois, pedimos um design de front-end em outro estilo: “Criar uma homepage impactante para uma plataforma de e-commerce, com uma barra de navegação superior contendo logotipo, caixa de busca, carrinho, botões de login/registro, um banner principal (Hero Section) exibindo promoções, produtos mais vendidos ou ofertas sazonais, e abaixo, recomendações de produtos ou categorias, além de avaliações de usuários de produtos selecionados na parte inferior ou em uma área de destaque.”

Com uma única geração, conseguimos uma homepage com alta fidelidade. Apesar de alguns pequenos detalhes, acreditamos que eles podem ser ajustados em uma próxima iteração, sem prejudicar o resultado geral.

Continuamos testando a funcionalidade do Enxame de Agentes, criando uma brochura para o “Relatório de Inteligência Artificial 2026” da Universidade de Stanford, solicitando a entrega de página web, tabelas e PPT, tudo sem fornecer qualquer informação adicional ou documento, testando a capacidade de escrita colaborativa do grupo de agentes.

Percebemos que cada agente tinha seu crachá, descrição de funções e perfil. Ao usar o Enxame, você realmente se sente como um CEO estrategista, mobilizando todos os recursos humanos disponíveis, conhecendo bem suas habilidades, formando uma equipe de trabalho que executa tarefas automaticamente. Quase como colocar “confiável” no crachá.

No final, entregaram todo o conteúdo necessário: uma página web brilhante, um PPT bem organizado e uma tabela de dados séria.

O futuro da colaboração multiagente já chegou?

Esses testes demonstraram a forte capacidade do Kimi K2.6 como “modelo base” na era dos Agentes.

Na onda de popularidade do OpenClaw, que continua crescendo, o novo Claw Group aponta um caminho claro para a próxima fase da evolução dos Agentes.

Atualmente, o Claw Group está em fase de testes internos limitados.

Essa funcionalidade marca uma nova era na colaboração de agentes inteligentes. Você pode integrar Agentes que rodam localmente, no celular ou na nuvem, cada um com suas ferramentas, habilidades e memórias, formando um “grupo” que avança na tarefa de forma conjunta.

Aqui, o K2.6 atua mais como um coordenador: quem é bom em busca, quem é responsável pela análise, quem produz o conteúdo, ele distribui as tarefas de acordo com as capacidades. Se algum passo travar, ele consegue detectar rapidamente, reatribuir tarefas ou trocar de agente, mantendo o fluxo.

Imagine que você precisa preparar um relatório complexo ou desenvolver um projeto de múltiplas camadas: os agentes do Claw Group discutem, se conectam, ajustam-se em um chat, e no final entregam um resultado preciso e completo.

Essa inovação não só rompe com o modo tradicional de execução de agentes individuais, como também impulsiona o avanço da inteligência organizacional. Sua chegada torna mais realista a ideia de “vários IA trabalhando juntos”.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar