El 12 de junio de 2023, Gensyn, un protocolo de mercado de potencia informática AGI basado en blockchain, anunció la finalización de una ronda de financiamiento Serie A de $ 43 millones, liderada por a16z, con la participación de Eden Block, CoinFund, Galaxy y Protocol Labs.
¿Qué tipo de proyecto es Gensyn? ¿Por qué puede obtener una gran inversión de los mejores VC? Golden Finance lo llevará a comprenderlo en un artículo.
a16z: ¿Por qué liderar la financiación Serie A de $43 millones de Gensyn?
a16z publicó un artículo explicando por qué lideró la ronda de financiamiento Serie A de $43 millones de Gensyn. a16z dijo que el progreso reciente de la inteligencia artificial es increíble y tiene el poder de salvar el mundo (consulte el informe anterior de Jinse Finance "artículo extenso del fundador de a16z: Por qué la IA salvará el mundo"). Pero construir sistemas de IA requiere implementar una potencia informática mucho mayor para entrenar y razonar sobre los modelos más grandes y potentes disponibles en la actualidad. Eso significa que las grandes empresas de tecnología tienen una ventaja sobre las nuevas empresas en la carrera por extraer valor de la inteligencia artificial, gracias al acceso privilegiado a la potencia informática y las economías de escala de los grandes centros de datos. Para competir en igualdad de condiciones, las nuevas empresas deben poder utilizar de forma asequible su propia potencia informática masiva.
Las cadenas de bloques, como un nuevo tipo de computadora, son únicas en el sentido de que los desarrolladores pueden escribir código que hace promesas firmes sobre cómo se comportará el código en el futuro. Este componente sin permiso de la cadena de bloques podría crear un mercado para que los compradores y vendedores de potencia informática, o cualquier otro tipo de recurso digital, como datos o algoritmos, comercien globalmente sin intermediarios.
**Gensyn, un protocolo de mercado de computación AGI basado en blockchain, conecta a los desarrolladores (cualquiera que pueda entrenar modelos de aprendizaje automático) con solucionadores (Solver, cualquiera que quiera usar sus propias máquinas para entrenar modelos de aprendizaje automático). Gensyn puede aumentar la potencia informática disponible para el aprendizaje automático entre 10 y 100 veces al aprovechar la cola larga de dispositivos informáticos con capacidad de aprendizaje automático que no se utilizan en todo el mundo, como pequeños centros de datos, PC para juegos, Mac M1 y M2 e incluso teléfonos inteligentes. **
Problemas que enfrenta AGI (Inteligencia Artificial General): Altamente Centralizado
Después de casi medio año de desarrollo, el mercado generalmente reconoce que AGI es el futuro. Pero la industria AGI actualmente luce altamente monopolizada**, entre países es una guerra comercial y de talento entre China y Estados Unidos, y entre empresas es el juego de las grandes tecnológicas (Microsoft, Google, Meta). **Porque los tres recursos clave de AGI (poder de cómputo, conocimiento y datos) están actualmente altamente centralizados. **
Potencia de cómputo: Los modelos cada vez más grandes y complejos requieren procesadores de cómputo avanzados para el entrenamiento. Entre países: la guerra de chips entre China y Estados Unidos, Estados Unidos ha estado impidiendo activamente que China obtenga chips de alta potencia. Entre empresas: capacidad de producción insuficiente, algunos grandes clientes compran los últimos chips de IA de Nvidia y otras empresas no pueden comprarlos en absoluto. En la pila tecnológica: algunas empresas incluso crean su propio hardware dedicado para el aprendizaje profundo, como los clústeres de TPU de Google. Estos superan a las GPU estándar para el aprendizaje profundo y no están a la venta, solo para alquiler.
Conocimiento: Muchos avances públicos se derivan de nuevas arquitecturas modelo a gran escala desarrolladas por investigadores, pero existe una batalla por la propiedad intelectual y el talento subyacentes. Por ejemplo, Estados Unidos atrae a más del 50 % de los talentos de IA de China, y las grandes empresas que utilizan estos talentos para desarrollar modelos a gran escala reducen cada vez más la accesibilidad de esta tecnología; el GPT-3.5 o 4 de OpenAI está nominalmente disponible públicamente, pero se encuentra detrás de una API y solo Microsoft tiene acceso a su código fuente.
Datos: Los modelos de aprendizaje profundo de AGI requieren grandes cantidades de datos, tanto etiquetados como sin etiquetar, y normalmente mejoran con más datos. GPT-3 fue entrenado en 300 mil millones de palabras. Los datos etiquetados son particularmente importantes, y los conjuntos de datos necesarios para capacitar a AGI se concentran en manos de algunas grandes empresas. Por ejemplo, un poco de buen conocimiento: cada vez que visitas un sitio web resolviendo reCaptcha, estás etiquetando datos de entrenamiento para mejorar Google Maps.
Dificultades en la computación AGI descentralizada
La computación descentralizada puede crear una base más barata y libre para investigar y desarrollar inteligencia artificial. Pero hay un problema de verificación de trabajo en AGI descentralizado ¿Cómo sabes que el tercero ha completado el cálculo que solicitaste?
El rompecabezas de la prueba de trabajo tiene dos factores: dependencia del estado y alto costo computacional.
Dependencia del estado: cada capa de una red neuronal está conectada a todos los nodos de la capa anterior. Esto significa que necesita el estado de la capa anterior. Para empeorar las cosas, todos los pesos de cada capa están determinados por el paso de tiempo anterior. Entonces, si desea verificar que alguien entrenó un modelo, por ejemplo, seleccionando un punto aleatorio en la red y viendo si obtiene el mismo estado, debe seguir entrenando el modelo hasta ese punto, lo cual es computacionalmente costoso.
Altos gastos computacionales: El costo de una sola sesión de capacitación de GPT-3 en 2020 es de aproximadamente $12 millones, que es más de 270 veces mayor que el valor estimado de aproximadamente $43 000 para la capacitación de GPT-2 en 2019. En general, la complejidad del modelo (tamaño) de las mejores redes neuronales actualmente se duplica cada tres meses. La sobrecarga de validación, posiblemente de las dependencias de estado, es aceptable si la red neuronal es más económica y/o si el entrenamiento representa menos proceso de desarrollo de modelos.
Si desea abaratar la capacitación en aprendizaje profundo y descentralizar el control, necesita un sistema que gestione sin confianza la validación relacionada con el estado y, al mismo tiempo, sea económico en términos de gastos generales y recompense a quienes contribuyen con el cálculo.
Cómo Gensyn descentraliza la computación AGI
El protocolo Gensyn une toda la informática del mundo en un supercúmulo global de aprendizaje automático que está disponible para cualquier persona. Permite el entrenamiento sin confianza de redes neuronales a gran escala y a bajo costo al combinar dos cosas:
1. Sistema de verificación innovador
Un sistema de verificación que resuelve de manera eficiente el problema de la dependencia del estado en el entrenamiento de redes neuronales de escala arbitraria. El sistema combina puntos de control de entrenamiento modelo con controles probabilísticos que terminan en cadena. Hace todo esto sin confianza con una sobrecarga que escala linealmente con el tamaño del modelo (manteniendo constantes los costos de validación).
Según Gensyn Litepaper, Gensyn resuelve principalmente el problema de verificación a través de tres conceptos: prueba de aprendizaje probabilística (usando metadatos en el proceso de optimización basado en gradientes para construir un certificado del trabajo realizado y verificarlo rápidamente a través de la replicación de ciertas etapas) , Protocolo de identificación basado en gráficos (utiliza un protocolo de identificación basado en gráficos multigrano y ejecución de consenso de evaluadores cruzados para permitir que el trabajo de validación se vuelva a ejecutar y se compare para verificar la coherencia y, en última instancia, lo confirme la propia cadena), estilo Truebit incentivado juegos (utilizando staking y slashing para crear un juego de incentivos que asegure que cada jugador racional desde el punto de vista financiero actúe con honestidad y realice las tareas previstas)
**El sistema consta principalmente de cuatro participantes principales: remitentes, solucionadores, verificadores y denunciantes. **Remitente: el usuario final del sistema, que proporciona la tarea a calcular y paga por la unidad de trabajo completada; solucionador: la parte principal de trabajo del sistema, realiza la capacitación del modelo y genera pruebas para la verificación por parte del verificador; verificador : el no determinista El proceso de entrenamiento está vinculado a un cálculo lineal determinista, replicando parte de la prueba del solucionador y comparando la distancia con un umbral esperado; el denunciante: la última línea de defensa, verificando el trabajo del verificador y desafiando por un bote.
2. Nuevo suministro
Aproveche los recursos de dispositivos informáticos subutilizados, subutilizados/suboptimizados. Estos dispositivos van desde GPU para juegos actualmente sin usar hasta mineros de GPU de la era anterior a Ethereum PoW. Y la descentralización del protocolo significa que, en última instancia, será gobernado por una mayoría comunitaria y no se puede "cerrar" sin el consentimiento de la comunidad; a diferencia de su contraparte web2, esto lo hace resistente a la censura.
Escala + bajo costo: el protocolo Gensyn ofrece un costo similar al de las GPU propias del centro de datos, que pueden escalar más allá de AWS
Ver originales
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
a16z lidera una inversión de $43 millones en Gensyn, un mercado de potencia informática AGI, para comprender a Gensyn
El 12 de junio de 2023, Gensyn, un protocolo de mercado de potencia informática AGI basado en blockchain, anunció la finalización de una ronda de financiamiento Serie A de $ 43 millones, liderada por a16z, con la participación de Eden Block, CoinFund, Galaxy y Protocol Labs.
¿Qué tipo de proyecto es Gensyn? ¿Por qué puede obtener una gran inversión de los mejores VC? Golden Finance lo llevará a comprenderlo en un artículo.
a16z: ¿Por qué liderar la financiación Serie A de $43 millones de Gensyn?
a16z publicó un artículo explicando por qué lideró la ronda de financiamiento Serie A de $43 millones de Gensyn. a16z dijo que el progreso reciente de la inteligencia artificial es increíble y tiene el poder de salvar el mundo (consulte el informe anterior de Jinse Finance "artículo extenso del fundador de a16z: Por qué la IA salvará el mundo"). Pero construir sistemas de IA requiere implementar una potencia informática mucho mayor para entrenar y razonar sobre los modelos más grandes y potentes disponibles en la actualidad. Eso significa que las grandes empresas de tecnología tienen una ventaja sobre las nuevas empresas en la carrera por extraer valor de la inteligencia artificial, gracias al acceso privilegiado a la potencia informática y las economías de escala de los grandes centros de datos. Para competir en igualdad de condiciones, las nuevas empresas deben poder utilizar de forma asequible su propia potencia informática masiva.
Las cadenas de bloques, como un nuevo tipo de computadora, son únicas en el sentido de que los desarrolladores pueden escribir código que hace promesas firmes sobre cómo se comportará el código en el futuro. Este componente sin permiso de la cadena de bloques podría crear un mercado para que los compradores y vendedores de potencia informática, o cualquier otro tipo de recurso digital, como datos o algoritmos, comercien globalmente sin intermediarios.
**Gensyn, un protocolo de mercado de computación AGI basado en blockchain, conecta a los desarrolladores (cualquiera que pueda entrenar modelos de aprendizaje automático) con solucionadores (Solver, cualquiera que quiera usar sus propias máquinas para entrenar modelos de aprendizaje automático). Gensyn puede aumentar la potencia informática disponible para el aprendizaje automático entre 10 y 100 veces al aprovechar la cola larga de dispositivos informáticos con capacidad de aprendizaje automático que no se utilizan en todo el mundo, como pequeños centros de datos, PC para juegos, Mac M1 y M2 e incluso teléfonos inteligentes. **
Problemas que enfrenta AGI (Inteligencia Artificial General): Altamente Centralizado
Después de casi medio año de desarrollo, el mercado generalmente reconoce que AGI es el futuro. Pero la industria AGI actualmente luce altamente monopolizada**, entre países es una guerra comercial y de talento entre China y Estados Unidos, y entre empresas es el juego de las grandes tecnológicas (Microsoft, Google, Meta). **Porque los tres recursos clave de AGI (poder de cómputo, conocimiento y datos) están actualmente altamente centralizados. **
Potencia de cómputo: Los modelos cada vez más grandes y complejos requieren procesadores de cómputo avanzados para el entrenamiento. Entre países: la guerra de chips entre China y Estados Unidos, Estados Unidos ha estado impidiendo activamente que China obtenga chips de alta potencia. Entre empresas: capacidad de producción insuficiente, algunos grandes clientes compran los últimos chips de IA de Nvidia y otras empresas no pueden comprarlos en absoluto. En la pila tecnológica: algunas empresas incluso crean su propio hardware dedicado para el aprendizaje profundo, como los clústeres de TPU de Google. Estos superan a las GPU estándar para el aprendizaje profundo y no están a la venta, solo para alquiler.
Conocimiento: Muchos avances públicos se derivan de nuevas arquitecturas modelo a gran escala desarrolladas por investigadores, pero existe una batalla por la propiedad intelectual y el talento subyacentes. Por ejemplo, Estados Unidos atrae a más del 50 % de los talentos de IA de China, y las grandes empresas que utilizan estos talentos para desarrollar modelos a gran escala reducen cada vez más la accesibilidad de esta tecnología; el GPT-3.5 o 4 de OpenAI está nominalmente disponible públicamente, pero se encuentra detrás de una API y solo Microsoft tiene acceso a su código fuente.
Datos: Los modelos de aprendizaje profundo de AGI requieren grandes cantidades de datos, tanto etiquetados como sin etiquetar, y normalmente mejoran con más datos. GPT-3 fue entrenado en 300 mil millones de palabras. Los datos etiquetados son particularmente importantes, y los conjuntos de datos necesarios para capacitar a AGI se concentran en manos de algunas grandes empresas. Por ejemplo, un poco de buen conocimiento: cada vez que visitas un sitio web resolviendo reCaptcha, estás etiquetando datos de entrenamiento para mejorar Google Maps.
Dificultades en la computación AGI descentralizada
La computación descentralizada puede crear una base más barata y libre para investigar y desarrollar inteligencia artificial. Pero hay un problema de verificación de trabajo en AGI descentralizado ¿Cómo sabes que el tercero ha completado el cálculo que solicitaste?
El rompecabezas de la prueba de trabajo tiene dos factores: dependencia del estado y alto costo computacional.
Dependencia del estado: cada capa de una red neuronal está conectada a todos los nodos de la capa anterior. Esto significa que necesita el estado de la capa anterior. Para empeorar las cosas, todos los pesos de cada capa están determinados por el paso de tiempo anterior. Entonces, si desea verificar que alguien entrenó un modelo, por ejemplo, seleccionando un punto aleatorio en la red y viendo si obtiene el mismo estado, debe seguir entrenando el modelo hasta ese punto, lo cual es computacionalmente costoso.
Altos gastos computacionales: El costo de una sola sesión de capacitación de GPT-3 en 2020 es de aproximadamente $12 millones, que es más de 270 veces mayor que el valor estimado de aproximadamente $43 000 para la capacitación de GPT-2 en 2019. En general, la complejidad del modelo (tamaño) de las mejores redes neuronales actualmente se duplica cada tres meses. La sobrecarga de validación, posiblemente de las dependencias de estado, es aceptable si la red neuronal es más económica y/o si el entrenamiento representa menos proceso de desarrollo de modelos.
Si desea abaratar la capacitación en aprendizaje profundo y descentralizar el control, necesita un sistema que gestione sin confianza la validación relacionada con el estado y, al mismo tiempo, sea económico en términos de gastos generales y recompense a quienes contribuyen con el cálculo.
Cómo Gensyn descentraliza la computación AGI
El protocolo Gensyn une toda la informática del mundo en un supercúmulo global de aprendizaje automático que está disponible para cualquier persona. Permite el entrenamiento sin confianza de redes neuronales a gran escala y a bajo costo al combinar dos cosas:
1. Sistema de verificación innovador
Un sistema de verificación que resuelve de manera eficiente el problema de la dependencia del estado en el entrenamiento de redes neuronales de escala arbitraria. El sistema combina puntos de control de entrenamiento modelo con controles probabilísticos que terminan en cadena. Hace todo esto sin confianza con una sobrecarga que escala linealmente con el tamaño del modelo (manteniendo constantes los costos de validación).
Según Gensyn Litepaper, Gensyn resuelve principalmente el problema de verificación a través de tres conceptos: prueba de aprendizaje probabilística (usando metadatos en el proceso de optimización basado en gradientes para construir un certificado del trabajo realizado y verificarlo rápidamente a través de la replicación de ciertas etapas) , Protocolo de identificación basado en gráficos (utiliza un protocolo de identificación basado en gráficos multigrano y ejecución de consenso de evaluadores cruzados para permitir que el trabajo de validación se vuelva a ejecutar y se compare para verificar la coherencia y, en última instancia, lo confirme la propia cadena), estilo Truebit incentivado juegos (utilizando staking y slashing para crear un juego de incentivos que asegure que cada jugador racional desde el punto de vista financiero actúe con honestidad y realice las tareas previstas)
**El sistema consta principalmente de cuatro participantes principales: remitentes, solucionadores, verificadores y denunciantes. **Remitente: el usuario final del sistema, que proporciona la tarea a calcular y paga por la unidad de trabajo completada; solucionador: la parte principal de trabajo del sistema, realiza la capacitación del modelo y genera pruebas para la verificación por parte del verificador; verificador : el no determinista El proceso de entrenamiento está vinculado a un cálculo lineal determinista, replicando parte de la prueba del solucionador y comparando la distancia con un umbral esperado; el denunciante: la última línea de defensa, verificando el trabajo del verificador y desafiando por un bote.
2. Nuevo suministro
Aproveche los recursos de dispositivos informáticos subutilizados, subutilizados/suboptimizados. Estos dispositivos van desde GPU para juegos actualmente sin usar hasta mineros de GPU de la era anterior a Ethereum PoW. Y la descentralización del protocolo significa que, en última instancia, será gobernado por una mayoría comunitaria y no se puede "cerrar" sin el consentimiento de la comunidad; a diferencia de su contraparte web2, esto lo hace resistente a la censura.
Escala + bajo costo: el protocolo Gensyn ofrece un costo similar al de las GPU propias del centro de datos, que pueden escalar más allá de AWS