Acabei de conversar com alguém que afirma ter encontrado uma arbitragem simples na Polymarket. SIM a $0,62, NÃO a $0,33, soma $0,95... lucro fácil de $0,05, certo? Errado. Quando eles colocam essas ordens, a arbitragem real já desapareceu. Aqui está o porquê.



Enquanto traders de varejo fazem cálculos básicos, sistemas quantitativos estão simultaneamente escaneando 17.218 condições de mercado em 2^63 combinações possíveis de resultados. Eles encontram contradições de precificação em milissegundos usando programação inteira ao invés de enumeração por força bruta. Calculam tamanhos de posição ótimos considerando a profundidade do livro de ordens. Executam tudo em paralelo. Depois passam para a próxima oportunidade. A diferença não é velocidade. É infraestrutura matemática.

Passei um tempo entendendo como isso realmente funciona, e é muito mais sofisticado do que a maioria das pessoas percebe. Deixe-me explicar a mecânica real.

Primeiro, a armadilha óbvia de arbitragem. Você vê dois mercados com dependências lógicas. Mercado A: Trump vence a Pensilvânia por $0,48 SIM. Mercado B: Republicanos vencem por 5+ pontos na Pensilvânia por $0,32 SIM. Ambos somam $1,00, então parecem limpos. Mas aqui está o ponto—se os Republicanos vencem por 5+ pontos, isso é um subconjunto de Trump vencer. O preço do subconjunto não pode exceder o preço do superset. Quando os mercados violam isso, há arbitragem. Exceto que encontrar essas relações manualmente é impossível. Para apenas 305 mercados de eleição nos EUA, há 46.360 combinações possíveis de dependência. A equipe de pesquisa usou DeepSeek AI para triagem inicial, depois três camadas de verificação. Resultado: 40.057 pares independentes, 1.576 pares dependentes, 374 atenderam condições estritas, 13 realmente exploráveis.

Segundo, o problema matemático do qual ninguém fala. Quando você identifica um erro de precificação, como calcula a negociação ótima? A resposta intuitiva—minimizar a distância Euclidiana ao preço justo—está errada. Ela trata uma mudança de $0,50 para $0,60 do mesmo modo que de $0,05 para $0,15. Mas elas são completamente diferentes. A segunda é uma mudança massiva na probabilidade implícita. É como ganhar 10kg quando você pesa 70kg versus 30kg. Mesma mudança, significado totalmente diferente.

A Polymarket usa preços do LMSR (Regra de Pontuação Logarítmica de Mercado), o que significa que os preços representam distribuições de probabilidade. A métrica de distância correta aqui é a divergência KL—ela mede a distância teórica de informação entre distribuições de probabilidade. Diferente da simples distância Euclidiana, a divergência KL pondera automaticamente movimentos próximos a preços extremos de forma mais pesada. Uma mudança de $0,05 para $0,15 parece muito maior usando divergência KL. Isso se alinha com a realidade—movimentos extremos de preço sinalizam choques de informação maiores.

Aqui está a percepção: o lucro máximo que você pode extrair é igual à distância de divergência KL do estado atual do mercado até a fronteira de ausência de arbitragem. Essa distância indica o que comprar, o que vender e quanto você pode ganhar.

Terceiro, calcular isso de fato. O problema é que calcular diretamente a projeção de divergência KL é inviável computacionalmente para mercados grandes. O espaço sem arbitragem tem vértices exponencialmente muitos. Você não consegue checar todos. Entra o algoritmo Frank-Wolfe. Em vez de resolver tudo de uma vez, ele funciona iterativamente. Começa com um pequeno conjunto de resultados válidos. Otimiza nesse conjunto. Usa programação inteira para encontrar um novo resultado válido. Adiciona ao conjunto. Repete até convergir. Após 100 iterações, você rastreou apenas 100 vértices ao invés de 2^63 combinações.

A equipe de pesquisa usou o solucionador Gurobi como motor de programação inteira. Nas primeiras iterações (poucos jogos resolvidos): menos de 1 segundo. No meio do processo (30-40 jogos): 10-30 segundos. Na fase final (50+ jogos): menos de 5 segundos. Por que mais rápido depois? O espaço de soluções viáveis encolhe à medida que os resultados se esclarecem. Menos variáveis, restrições mais apertadas, resolução mais rápida.

Há um detalhe técnico, porém. Os preços LMSR se aproximam de valores extremos (perto de $0 ou $1), e os gradientes explodem. Solução: Barrier Frank-Wolfe. Em vez de otimizar na fronteira completa, otimiza em uma versão levemente reduzida. O parâmetro de redução diminui de forma adaptativa— inicialmente mais longe da fronteira (estável), depois se aproximando da fronteira verdadeira (precisa). Na prática, 50-150 iterações atingem a convergência.

Quarto, a execução mata a maioria das estratégias. Você calculou a negociação ótima. E agora? A Polymarket usa CLOB (Livro de Ordens de Limite Central), ou seja, as ordens são executadas sequencialmente, não de forma atômica. Seu plano de arbitragem: comprar SIM a $0,30, comprar NÃO a $0,30, custo total de $0,60, recuperar $1,00 independentemente do resultado, lucro de $0,40. A realidade: a ordem de SIM é executada a $0,30. Sua ordem moveu o mercado. A ordem de NÃO agora é executada a $0,78. Custo total de $1,08, recuperação de $1,00, resultado real: perda de $0,08. Você está exposto.

Por isso, a pesquisa só considera spreads superiores a $0,05. Spread menor é consumido pelo risco de execução. Traders reais calculam VWAP (preço médio ponderado por volume) de todas as transações em cada bloco. Se a soma desvia mais de $0,02 de $1,00, é registrada como oportunidade. VWAP leva em conta a profundidade real do livro de ordens. Se você quer 10.000 tokens, mas só há 2.000 disponíveis a $0,30, 3.000 a $0,32, 5.000 a $0,35, seu VWAP é $0,326, não $0,30.

O sistema completo combina cinco camadas. Dados em tempo real via WebSocket da API da Polymarket. Dados históricos de consulta ao contrato via nó Alchemy. Detecção de dependências usando triagem com LLM mais três camadas de verificação. Otimização em três níveis: restrições lineares simples (milissegundos), programação inteira com Frank-Wolfe mais Gurobi (motor principal), validação de execução contra o livro de ordens atual. Tamanho da posição usando fórmula Kelly modificada, ajustando para a probabilidade de risco de execução com base na profundidade do livro, limitada a 50% da profundidade disponível.

Os resultados de abril de 2024 a abril de 2025: arbitragem de condição única extraiu $10,58 milhões, reequilíbrio de mercado extraiu $29,01 milhões, arbitragem de portfólio entre mercados extraiu $95 mil. Total de $39,69 milhões. Os 10 maiores arbitradores capturaram $8,13 milhões (20,5%). O maior arbitrador lucrou $2,01 milhões em 4.049 negociações, com média $496 por negociação$40M .

Enquanto traders leem artigos sobre técnicas de previsão, sistemas quantitativos examinam dependências usando programação inteira, calculam negociações ótimas com projeção de divergência KL, executam algoritmos Frank-Wolfe, estimam slippage com VWAP, operam em paralelo e extraem sistematicamente $40M em lucros garantidos.

A diferença não é sorte ou timing. É infraestrutura matemática. O artigo é público. Os algoritmos são conhecidos. Os lucros são reais. A questão é se traders de varejo podem construir essa infraestrutura antes que a próxima oportunidade se feche.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar