Torygreen

vip
Idade 2.7 Ano
Nível máximo 0
Ainda sem conteúdo
não se pode fazer uma emissão aberta e tratar a parte aberta como opcional uma vez que o dinheiro aparece
o julgamento começou com uma questão: pode-se criar uma organização sem fins lucrativos, chamar a OpenAI de sua missão, atrair 10 anos de engenheiros motivados pela missão e capital de doações com essa promessa, e depois converter para uma estrutura com limite de lucro e chamá-la de uma evolução?
elon deixou a OpenAI em 2018. os danos que $130b está pedindo vão para a organização sem fins lucrativos. seja qual for a sua opinião sobre ele como litigante, a questão que o caso força a entrar
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
a nvidia é agora maior do que toda a economia do Japão e a sua conta de IA é a razão
cada dólar que você gasta em IA agora passa por chips de uma única empresa, em três nuvens que os revendem com uma margem
> startups de IA queimam cerca de 80% do seu capital levantado apenas para alugar computação
> já vi equipes em estágio inicial pagando 700 mil dólares por mês a um único fornecedor de chips
> centros de dados operam com 12-18% de capacidade enquanto a sua conta aumenta a cada trimestre
toda a indústria acabou de concordar em ficar numa fila e entregar dinheiro ao mesmo posto de pedágio
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
a multidão de que acredita que a IA está sobreconstruída nunca tentou comprar um h100 neste trimestre
passar uma semana tentando comprar h100s agora significa: compromisso de 12 meses na aws (utilização 24/7 bloqueada antes de você ver um único gpu), lista de espera no gcp sem ETA, lambda e coreweave ambos esgotados, todos os provedores menores dando a mesma resposta em palavras diferentes
a construção de hyperscalers é medida em anos, as escassezes de CPU estão parando as GPUs que existem, e a demanda continua crescendo enquanto os hyperscalers solicitam permissões
equipes de IA em está
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Aparentemente, a Nvidia visitou discretamente empresas de equipamentos elétricos coreanas, pedindo-lhes que redesenhassem a infraestrutura de centros de dados em torno de uma arquitetura de 800V DC.
Isso é uma admissão de que o modelo de IA centralizado atingiu uma parede física, e que cada nova geração de chips agora exige uma retrofit de subestação em algum lugar na cadeia.
Os centros de dados globais já operam com uma utilização de 12 a 18 por cento.
Fazendas de mineração de criptomoedas têm GPUs poderosas paradas, desde a fusão do Ethereum.
Sistemas de jogos para consumidores com 4
ETH-1,89%
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
muitas pessoas ainda estão arquitetando em torno de uma dependência de computação que saiu de cena
qwen3 32b, por exemplo, está ao vivo em GPUs comunitárias distribuídas neste momento, paralelismo de pipeline rodando entre nós sem que um único operador controle, inferência sem permissão pela internet aberta
três camadas, todas abertas: pesos abertos (Alibaba os lançou), computação sem permissão (hardware comunitário, sem custódia), transporte aberto (sem cluster privado, sem porta de API). propriedade não se aplica a nenhuma delas
o modelo mental de que inferência compatível com frontier
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
a próxima semana começa o google cloud next e cada touro de hyperscaler está prestes a comemorar o movimento exato que historicamente mata a margem que eles estão longos
antes: o google pagou à nvidia uma margem sobre cada h100. margem fluindo para santa clara.
agora: o google está em negociações com a marvell sobre silício personalizado mais uma nova variante de TPU específica para inferência. o capex está se movendo internamente.
a amazon fez isso com graviton em 2018. a microsoft anunciou a maia em 2023. cada vez que o hyperscaler deixou de pagar a margem ao seu fornecedor porque a margem s
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
ainda estamos discutindo quantos data centers construir, enquanto a oferta já está estacionada em cada entrada de garagem
a resposta ao desenvolvimento é planejar campus de 50 acres em ciclos de construção de vários anos
trilhões de agentes transacionam continuamente, 24/7, contra sensores físicos, máquinas e uns aos outros
penso no PC de jogos 4090 parado às 2 da manhã, no chip Apple M fechado numa secretária, no Tesla estacionado desde quinta-feira, e as contas começam a parecer diferentes
isso é computação obscura, oferta não explorada que o usuário já pagou, estacionada na borda,
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
A avaliação do Figma sofreu um impacto porque a Anthropic tweetou uma página de destino.
> O que mudou: o nome da marca e as vibrações.
> O que não mudou: o modelo subjacente, o preço da API, a qualidade da saída ou como a sua equipe de design realmente trabalha amanhã.
O mercado acabou de passar o fim de semana tendo um ataque de pânico completo sobre marketing, não tecnologia.
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Aqui está algo interessante que encontrei: 33% dos centros de dados planejados nos EUA estão realmente a ser enviados neste momento.
> Os outros 67%: atrasados ou cancelados de imediato
> Meta a construir 10 usinas de gás só para alimentar uma instalação
> A China duplicou a sua capacidade de computação de IA em 2 meses sem um único chip dos EUA
> +220% de procura de energia projetada para 2030, com uma fila de licenças que se move em anos
O obstáculo é físico. licenças, filas de interligação de energia, prazos de construção.
Os costuradores que agregam computação distribuída atrav
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Dario precisa que o mythos seja uma fosso
Os laboratórios fecham lacunas de capacidade com mais computação, melhor pós-treinamento e ciclos de avaliação mais rápidos
Modelos de peso aberto como llama, qwen e deepseek ENTREGAM capacidades comparáveis às de modelos fechados alguns meses depois, como downloads gratuitos
Para si, isso significa um modelo melhor a cada trimestre e nenhum laboratório tentando persuadi-lo a aderir aos seus planos máximos
O fosso é o cálculo descentralizado onde milhares de GPUs funcionam como um supercomputador na Singapura, nos EUA, na Noruega, etc
O argumento do Da
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Estás a pagar à OpenAI $20 por uma passagem rápida e a @Meta acabou de lançar 1 modelo que fez os últimos 12 modelos da OpenAI parecerem correções de bugs
A OpenAI lançou mensalmente, anunciando cada atualização e publicando cada benchmark
O Muse Spark da Meta foi lançado ao vivo e atingiu pontuações de avaliação que a maioria das pessoas não achava que a Meta pudesse alcançar
Pior na estreia, silencioso durante meses, depois uma única versão parou todos em seu caminho... confundiste silêncio com fracasso e lançamentos mensais com progresso
Os doze registos de alterações do Sam tornaram-se do
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
o laboratório individual mais forte já não consegue mais segurar a fronteira sozinho.
a lacuna de valor é o mercado a admiti-lo, e os fundadores que ainda leem benchmarks de modelos estão lendo a página errada.
o prémio privado de valor da Anthropic é o mercado a precificar a margem de manobra.
o delta mede qual laboratório está menos preso à estrutura de custos subjacente a ambos.
a infraestrutura de computação é a camada de sistemas: a diferença entre o que os laboratórios de fronteira pagam pelo tempo H100 e o que o mercado agregado de centros de dados mantém ocioso é o piso que nen
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
As pessoas ainda pensam que programar é o trabalho.
Não é.
Código era apenas a interface que usávamos para expressar soluções. Era o gargalo, não o valor.
A IA remove esse gargalo.
Agora a restrição muda:
- Consegue definir o problema claramente?
- Consegue decompor em partes solucionáveis?
- Consegue verificar se a saída está realmente correta?
Percebi que os engenheiros que têm dificuldades com IA são aqueles que vinculavam sua identidade à velocidade de digitação ou à memória de sintaxe.
Isso nunca foi o recurso escasso.
Definição do problema é.
Verificação é.
Gosto
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
claude mythos revelou milhares de zero-days porque tem uma coisa que a sua equipa de segurança não tem:
nenhuma participação na precisão do código
ele lê bases de código inteiras de forma fria. não entende a política da sua organização, a pressão de prazos ou os egos envolvidos na implementação
o modelo não tem motivo para ignorar as partes difíceis "humanas"... por isso, é pior ao fazer briefings a um CISO, mas imbatível naquilo que realmente encontra bugs
a Anthropic bloqueou-o porque um modelo acabou de dar a cada base de código a sua primeira auditoria honesta
a sua equipa de resposta rápi
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Sam Altman é a última pessoa que deveria estar a escrever a regulamentação de IA e sabe disso.
Sam pediu um "novo contrato social" entre as empresas de IA e a sociedade, enquanto a sua empresa lança o gpt-5.4, o3, e agentes de classe operador a um ritmo que nenhuma legislação na Terra consegue acompanhar.
a aws não pode descentralizar sem canibalizar as suas próprias margens, e toda a "estrutura de autorregulação" na história da tecnologia terminou com as mesmas poucas entidades a escrever as regras que concordaram em seguir.
se estás a executar o teu modelo na aws ou azure, estás a uma
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
a proposta de "iterações infinitas" assume computação infinita.
cada chamada custa dinheiro, passa pela infraestrutura de alguém, e consome tokens, quer o resultado seja brilhante ou lixo.
a iteração só é barata se já souberes exatamente o que procuras.
> alguém com 10 anos de bom gosto acumulado faz 3 iterações e lança a versão final.
> alguém sem esse conhecimento faz 300 e ainda assim não consegue distinguir qual é boa.
e ninguém considerou isto ainda:
quanto mais saídas de IA, mais verificação humana precisas, então 10x os rascunhos significam 10x as pessoas a verificá-los.
... exceto pela
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
chamar o encerramento do openclaw da anthropic de um rugo é a coisa mais honesta que a comunidade de construtores de IA disse sobre si mesma em meses
o arnês do openclaw permitia que utilizadores intensivos executassem de $1k a $5k por dia de computação num plano de $200/mês
uma decisão de produto, e quem construiu a sua estrutura de custos em torno dessa diferença foi reprecificado da noite para o dia
o fornecedor controla o medidor... anthropic, openai, quem quer que seja
não tens lugar à mesa quando o modelo de preços muda
não és enganado pelo teu martelo, és enganado por um senho
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
sam construiu a openai com UMA suposição
executar o seu próprio modelo seria sempre demasiado caro
llama e mistral estão arruinando a sua tese e ameaçando o seu modelo de negócio
sam consegue ver isso, lê os mesmos tópicos de leaks que tu estás a ler... e ainda assim não consegue reestruturar
no momento em que a openai abre os pesos, eles matam a barreira que justifica a avaliação e qualquer um pode fazer inferência localmente sem chamada à API, sem assinatura, sem evento de receita para a openai
cada fork e ajuste fino é um cliente a menos a pagar as margens do sam
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Sam Altman levantou $122b e ninguém quer comprar $600m dele
$600m em ações da OpenAI sentadas no mercado secundário sem ofertas
> bancos isentando taxas apenas para mover a oferta
> vendedores competindo pelo preço para sair
Os mercados primários são controlados por alocação: os investidores de risco são chamados às rodadas quando a tabela de capital está limpa
mas os mercados secundários funcionam com demanda voluntária: ninguém é obrigado a manter ou a fazer ofertas
Anthropic superou a sua última avaliação de rodada, enquanto a OpenAI não consegue ultrapassar um teto de $600m
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
  • Fixar