Dez agentes ouvindo a mesma chamada: a arquitetura de tempo real do VTIX for Sales
11/06/2026 · Alexandre
Durante uma chamada de vendas no VTIX for Sales, dez agentes especializados escutam a conversa ao mesmo tempo: oportunidade, objeção, compliance, assuntos, sentimento, próxima ação e outros. Cada um tem um recorte próprio do problema. Este post conta como essa orquestra funciona sem atrapalhar quem está vendendo — porque o desafio aqui não é de prompt, é de arquitetura.
Regra número um: a conversa nunca espera a máquina
A primeira decisão estrutural foi separar dois caminhos com orçamentos de latência diferentes. O caminho rápido leva o áudio transcrito até a tela — a legenda ao vivo — e precisa responder em frações de segundo. O caminho de raciocínio carrega o trabalho caro: consultar a memória do cliente, caminhar no grafo, avaliar regras de compliance, compor sugestões.
Numa versão inicial, os dois caminhos compartilhavam a mesma fila — e o raciocínio pesado represava a legenda: a transcrição “travava” vários segundos atrás da fala. A correção foi desacoplar: a transcrição segue direto para a interface, enquanto o raciocínio roda em segundo plano com a política de single-flight — se uma análise ainda está em curso quando chega texto novo, não se enfileira outra; a próxima rodada já parte do estado mais recente. Latência da legenda e profundidade da análise deixaram de competir.
Especialistas em paralelo, não um generalista gigante
Por que dez agentes em vez de um prompt enorme que faz tudo? Três razões práticas:
Recorte cognitivo. Um agente que só procura objeções é mais preciso do que um faz-tudo. Cada agente tem instruções, contexto e ferramentas próprios — o de compliance carrega as regras vigentes da organização; o de assuntos, os interesses e momentos de vida do cliente; o de oportunidade, o grafo e o catálogo.
Isolamento de falha. Se o agente de notícias degrada (a fonte externa caiu), os outros nove seguem operando. Degradação graciosa por construção.
Evolução independente. Ligar, desligar e ajustar um agente por organização sem tocar nos demais — cada cliente da plataforma escolhe sua formação.
O funil que protege o vendedor
Dez agentes produzindo achados em paralelo criariam um problema novo: ruído. Ninguém vende olhando para dez notificações. Por isso os insights não vão direto à tela — passam por um funil de priorização e deduplicação:
Cada insight carrega uma impressão digital (fingerprint) por agente e conteúdo; o que já foi mostrado, aceito ou dispensado não reaparece. A decisão do profissional — aceitar, dispensar, adiar — é fonte de verdade e alimenta a memória: dispensou a sugestão, o sistema aprende e respeita. No topo da pilha, a interface mostra um destaque por vez, com o restante numa fila discreta. O vendedor mantém o controle da conversa; o copiloto sussurra, não grita.
Um transcript, qualquer canal
Essa malha inteira lê de um único contrato de dados: o transcript canônico. Chamada de voz, vídeo, ligação de WhatsApp ou mensagens — tudo é normalizado para o mesmo envelope (quem falou, quando, em qual canal, com que confiança) antes de chegar aos agentes. Adicionar um canal novo é ensinar a captura a preencher o envelope; os dez agentes nem ficam sabendo.
Depois da chamada, o bastão passa
Quando a conversa termina, os agentes de tempo real entregam o bastão a uma segunda bateria — os extratores offline — que relê o transcript com calma: memórias estruturadas, oportunidades perdidas, objeções não tratadas, avaliação de qualidade contra a régua do time. O tempo real otimiza a próxima frase; o offline otimiza a próxima conversa.
Quer ver os dez agentes na sua operação comercial? Conheça o VTIX for Sales — ou explore a tecnologia por trás da plataforma.
