¡Memoria de video 4G con baja configuración para jugar AIGC! El nuevo trabajo del autor de ControlNet alcanzó lo más alto de la lista caliente de GitHub
Juega a AI Painting, ¡ahora no tienes que preocuparte de que las habilidades con el cuchillo del Old Huang te "apuñalen por la espalda"!
Todo lo que necesita es una GTX 1650 (memoria de video de 4 GB) de hace 4 años, y el efecto de renderizado de IA es comparable al mejor modelo actual de código abierto, SDXL.
** **△ Fuente: Twitter @ナビ
Este es un nuevo proyecto Fooocus que ha dominado la lista TOP 1 en GitHub durante varios días seguidos. Ha sido marcado con 4K en tres días. Es producido por autor de ControlNet.
Antes, si desea ejecutar el último modelo XL de Stable Diffusion sin problemas, debe usar el 4060ti con memoria de video de 16G (el 3060 original con memoria de video de 12G es muy reacio a ejecutarse).
A diferencia de otras herramientas de inteligencia artificial de código abierto, Fooocus "se centra en la generación misma", no solo tiene bajos requisitos de hardware, sino que también es fácil de usar, muy amigable para los principiantes——
No es necesario ajustar ningún parámetro en todo el proceso, simplemente haga clic con el mouse y se podrá generar una imagen en 3 pasos.
** ****△**Fuente de la imagen Twitter @Photogenic Weekend
Algunos internautas gritaron: "Esto es simplemente la culminación de Stable Diffusion y Midjourney":
¡Diga adiós a la sintonización manual! Sin conexión, de código abierto y gratuito, ¡solo indica palabras e imágenes y deja que suceda la magia!
Algunos internautas se lamentaron: incluso Xiaobai puede aprovechar al máximo el efecto del modelo Stable Diffusion XL.
Entonces, ¿cuál es el efecto de generación real de esta nueva herramienta de IA de imágenes? Lo probamos.
Colab dibuja la imagen en medio minuto, el efecto es comparable a SD
Desde la perspectiva de la interfaz en ejecución, Fooocus tiene más de cien estilos integrados para elegir.
** ****△**Fuente de la imagen Twitter @camenduru
En cuanto a eficiencia, Fooocus también es muy rápido dibujando. En Colab, se tarda aproximadamente medio minuto en hacer un dibujo en modo de prioridad de velocidad:
El tiempo que se muestra en el registro es el tiempo de dibujo, pero antes hubo un proceso de análisis de texto que tomó aproximadamente 40 segundos en total:
** **### △La imagen ha sido acelerada.
Luego, déjelo dibujar primero una caricatura y vea cómo será la "Guerra de Mazar" desde la perspectiva de la IA. (No este Mazaha)
Debido a la generación directa de retratos con IA, todavía existen algunos problemas con el manejo de las manos, por lo que simplemente dejamos que Musk y Zuckerberg usen guantes:
El efecto parece ser bastante bueno. No sé si tienen alguna apuesta, pero también podría dejar que el perdedor venga a disfrazarse.
(Recordatorio: no hay ganador en una pelea)
Al final, los dos "se dan la mano y hacen las paces", y esta preciosa escena también fue grabada por el fotógrafo ¿Tiene la imagen general ese sabor?
Después de que terminó la "Batalla de Mazar", Lao Ma regresó obedientemente a la empresa y vendió Tesla.
Si ignora el LOGOTIPO, el sentido del diseño de póster está bastante en línea.
De hecho, cada estilo integrado de Fooocus es muy interesante, así que echemos un vistazo a estas imágenes en vivo de diferentes estilos:
Cuando se trata de imitar obras famosas, hay una versión Cyberpunk, una versión Zelda, una versión Minecraft e incluso una versión Pokémon de Musk para ver.
En cuanto a otras formas de arte, hay estilos Pixel y Lowpoly, así como versiones Nendoroid y Scissorial...
Por supuesto, hay un sinfín de ejemplos, los lectores y amigos de más estilos pueden experimentarlo por sí mismos.
(Hay que decir que el texto en el dibujo de la IA finalmente no es un dibujo fantasma)
¿Los grandes pintores ya están impacientes y quieren probarlo? ¡Presentaremos cómo jugar Fooocus en un momento!
La interfaz de Fooocus pertenece a la tía Jiang y se puede decir que es muy concisa:
Si recién está probando algo nuevo y no tiene requisitos especiales, este cuadro de aviso es completamente suficiente.
Debido a que el autor ha internalizado muchas habilidades complejas en el programa, estas operaciones de ajuste de parámetros ya no necesitan realizarse manualmente.
Ingrese directamente en el cuadro a continuación, haga clic en el botón generar y espere a que se produzca el dibujo.
(De forma predeterminada, se generan dos imágenes a la vez, el tamaño es 1152 × 896, el estilo es cinematográfico predeterminado y se prioriza la velocidad)
Si se requieren configuraciones avanzadas, marque Avanzado en la esquina inferior izquierda y la información de configuración aparecerá en el lado derecho de la página, dividida en tres pestañas:
Las cosas que se pueden ajustar incluyen tamaño, cantidad, estilo, rendimiento y más.
Si eres un jugador profesional, también puedes elegir la versión del modelo e incluso ajustar los parámetros de LoRA.
Además, hay un juego de alta gama para ajustar la nitidez.
Para el mismo contenido, el siguiente GIF muestra el cambio de nitidez de 2 a 10 y luego a 20. Se puede ver que a medida que aumenta la nitidez, los detalles de la imagen se vuelven cada vez más abundantes:
Sin embargo, en cuanto a si Fooocus es compatible con chino, también lo hemos probado, pero es una pena que aún no esté disponible.
Por ejemplo, ingresamos la palabra "manzana" y el resultado es una niña.
Esto... ¿está intentando decir "Eres la niña de mis ojos"?
Si tiene una máquina Windows con una tarjeta gráfica Nvidia, puede usar la versión lista para usar. (Probablemente esta sea la 114514ª vez que Lao Huang gana mahjong)
Al mismo tiempo, el hardware debe cumplir con los requisitos mínimos de configuración: memoria de video de 4 GB + memoria de 8 GB.
Descargue directamente desde aquí primero:
Después de la descompresión, haga doble clic en run.bat para ejecutar, el sistema descargará automáticamente el modelo y lo implementará, y podrá usarlo una vez completada la configuración.
Los requisitos de configuración de la versión de Linux son los mismos que los de Windows, pero el proceso de configuración es más complicado.
(Si tiene Jupyter, también puede consultar el archivo de notas utilizado en Colab)
Primero, instale las dependencias del entorno:
clon de git
cd fooocus
conda env crear -f entorno.yaml
conda activar fooocus
pip install -r requisitos_versiones.txt
Luego descargue el archivo del modelo y guárdelo en el directorio especificado:
** **△ Para más detalles, consulte la página de GitHub.
Por supuesto, también puedes dejar que el sistema descargue automáticamente el modelo:
lanzamiento de Python.py
Si está utilizando una Mac o la configuración del hardware no cumple con los requisitos, también puede ejecutarlo directamente con Colab.
(Portal:
Sin embargo, de lo que todavía tengo que quejarme es de que la versión de Colab fallará varias veces de vez en cuando, ya sea deteniéndose automáticamente o desbordándose la memoria...
Si desea ejecutar Fooocus sin problemas en Mac o en una computadora con tarjeta A, puede esperar la actualización del autor.
En general, el efecto de salida de imagen de Fooocus es bueno. Si la palabra de aviso se selecciona bien, incluso se puede utilizar como difusión estable. La clave es que los requisitos de configuración del hardware no son altos.
¿Cómo diablos es esto posible?
Del último proyecto del autor de ControlNet
En términos de diseño arquitectónico, Fooocus se divide principalmente en dos partes: interfaz interactiva y modelo de IA.
Entre ellos, interfaz interactiva se refiere a dos proyectos, a saber, stable-diffusion-webui y ComfyUI.
stable-diffusion-webui es principalmente el diseño frontal de la interfaz interactiva:
ComfyUI tiene GUI y diseño de back-end de Stable Diffusion:
En cuanto al modelo AI, se puede ver que se utiliza el nuevo modelo SDXL de Difusión Estable:
Esta es actualmente una de las mejores versiones de Stable Diffusion y el efecto de generación se ha mejorado mucho en comparación con la versión anterior 1.5.
Sin embargo, aunque el modelo y el diseño de la interfaz de usuario de Fooocus se refieren al proyecto de código abierto Stable Diffusion ya preparado, el autor incorporó gran parte de su propio diseño de optimización al crearlo, lo que hizo que el modelo funcionara con mayor fluidez.
Por ejemplo, el autor adoptó cuidadosamente el método avanzado de muestreo de difusión k diseñado por él mismo en Fooocus, que puede mejorar la continuidad del muestreo, reducir la pérdida de rendimiento y mejorar la eficiencia del muestreo;
Además, el autor también ajustó cuidadosamente los parámetros del sampler (Sampler) y modificó y agregó algunas configuraciones nuevas, incluido el estilo de la película, según la versión original.
La razón por la que se agrega la opción LoRA a Fooocus es que el autor descubrió que el modelo SDXL con LoRA (configuración de peso inferior a 0,5) casi siempre es mejor que el modelo SDXL sin LoRA.
El autor que desarrolló el proyecto Fooocus se llama Lvmin Zhang, se graduó de la Universidad de Soochow en 2021 y actualmente es estudiante de doctorado en la Universidad de Stanford.
Varios proyectos que ha realizado, incluidos ControlNet y style2paints, casi todos explotaron:
Ahora, el último proyecto, Fooocus, parece ser igualmente popular.
En las redes sociales, algunos internautas han compilado espontáneamente la versión Fooocus de una colección de palabras clave en diferentes estilos de Excel.
Si no sabe qué tipo de imagen generar, simplemente consulte las palabras clave en este documento:
¿Has descubierto qué tipo de imágenes quieres generar con Fooocus?
dirección del proyecto:
Link de referencia:
[1]
[2] Colección de palabras clave:
[3]
[4]
Ver originales
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
¡Memoria de video 4G con baja configuración para jugar AIGC! El nuevo trabajo del autor de ControlNet alcanzó lo más alto de la lista caliente de GitHub
Fuente del artículo: Qubit
Texto: Cressy Xiaoxiao
Juega a AI Painting, ¡ahora no tienes que preocuparte de que las habilidades con el cuchillo del Old Huang te "apuñalen por la espalda"!
Todo lo que necesita es una GTX 1650 (memoria de video de 4 GB) de hace 4 años, y el efecto de renderizado de IA es comparable al mejor modelo actual de código abierto, SDXL.
**
**△ Fuente: Twitter @ナビ
Este es un nuevo proyecto Fooocus que ha dominado la lista TOP 1 en GitHub durante varios días seguidos. Ha sido marcado con 4K en tres días. Es producido por autor de ControlNet.
A diferencia de otras herramientas de inteligencia artificial de código abierto, Fooocus "se centra en la generación misma", no solo tiene bajos requisitos de hardware, sino que también es fácil de usar, muy amigable para los principiantes——
No es necesario ajustar ningún parámetro en todo el proceso, simplemente haga clic con el mouse y se podrá generar una imagen en 3 pasos.
**
****△**Fuente de la imagen Twitter @Photogenic Weekend
Algunos internautas gritaron: "Esto es simplemente la culminación de Stable Diffusion y Midjourney":
Colab dibuja la imagen en medio minuto, el efecto es comparable a SD
Desde la perspectiva de la interfaz en ejecución, Fooocus tiene más de cien estilos integrados para elegir.
**
****△**Fuente de la imagen Twitter @camenduru
En cuanto a eficiencia, Fooocus también es muy rápido dibujando. En Colab, se tarda aproximadamente medio minuto en hacer un dibujo en modo de prioridad de velocidad:
**
**### △La imagen ha sido acelerada.
Luego, déjelo dibujar primero una caricatura y vea cómo será la "Guerra de Mazar" desde la perspectiva de la IA. (No este Mazaha)
(Recordatorio: no hay ganador en una pelea)
Si ignora el LOGOTIPO, el sentido del diseño de póster está bastante en línea.
Cuando se trata de imitar obras famosas, hay una versión Cyberpunk, una versión Zelda, una versión Minecraft e incluso una versión Pokémon de Musk para ver.
Por supuesto, hay un sinfín de ejemplos, los lectores y amigos de más estilos pueden experimentarlo por sí mismos.
(Hay que decir que el texto en el dibujo de la IA finalmente no es un dibujo fantasma)
La interfaz de Fooocus pertenece a la tía Jiang y se puede decir que es muy concisa:
Si recién está probando algo nuevo y no tiene requisitos especiales, este cuadro de aviso es completamente suficiente.
Debido a que el autor ha internalizado muchas habilidades complejas en el programa, estas operaciones de ajuste de parámetros ya no necesitan realizarse manualmente.
(De forma predeterminada, se generan dos imágenes a la vez, el tamaño es 1152 × 896, el estilo es cinematográfico predeterminado y se prioriza la velocidad)
Si se requieren configuraciones avanzadas, marque Avanzado en la esquina inferior izquierda y la información de configuración aparecerá en el lado derecho de la página, dividida en tres pestañas:
Si eres un jugador profesional, también puedes elegir la versión del modelo e incluso ajustar los parámetros de LoRA.
Para el mismo contenido, el siguiente GIF muestra el cambio de nitidez de 2 a 10 y luego a 20. Se puede ver que a medida que aumenta la nitidez, los detalles de la imagen se vuelven cada vez más abundantes:
Por ejemplo, ingresamos la palabra "manzana" y el resultado es una niña.
Esto... ¿está intentando decir "Eres la niña de mis ojos"?
Si tiene una máquina Windows con una tarjeta gráfica Nvidia, puede usar la versión lista para usar. (Probablemente esta sea la 114514ª vez que Lao Huang gana mahjong)
Al mismo tiempo, el hardware debe cumplir con los requisitos mínimos de configuración: memoria de video de 4 GB + memoria de 8 GB.
Descargue directamente desde aquí primero:
Después de la descompresión, haga doble clic en run.bat para ejecutar, el sistema descargará automáticamente el modelo y lo implementará, y podrá usarlo una vez completada la configuración.
(Si tiene Jupyter, también puede consultar el archivo de notas utilizado en Colab)
Primero, instale las dependencias del entorno:
clon de git cd fooocus conda env crear -f entorno.yaml conda activar fooocus pip install -r requisitos_versiones.txt
Luego descargue el archivo del modelo y guárdelo en el directorio especificado:
**
**△ Para más detalles, consulte la página de GitHub.
Por supuesto, también puedes dejar que el sistema descargue automáticamente el modelo:
lanzamiento de Python.py
Si está utilizando una Mac o la configuración del hardware no cumple con los requisitos, también puede ejecutarlo directamente con Colab.
(Portal:
Sin embargo, de lo que todavía tengo que quejarme es de que la versión de Colab fallará varias veces de vez en cuando, ya sea deteniéndose automáticamente o desbordándose la memoria...
En general, el efecto de salida de imagen de Fooocus es bueno. Si la palabra de aviso se selecciona bien, incluso se puede utilizar como difusión estable. La clave es que los requisitos de configuración del hardware no son altos.
¿Cómo diablos es esto posible?
Del último proyecto del autor de ControlNet
En términos de diseño arquitectónico, Fooocus se divide principalmente en dos partes: interfaz interactiva y modelo de IA.
Entre ellos, interfaz interactiva se refiere a dos proyectos, a saber, stable-diffusion-webui y ComfyUI.
stable-diffusion-webui es principalmente el diseño frontal de la interfaz interactiva:
Sin embargo, aunque el modelo y el diseño de la interfaz de usuario de Fooocus se refieren al proyecto de código abierto Stable Diffusion ya preparado, el autor incorporó gran parte de su propio diseño de optimización al crearlo, lo que hizo que el modelo funcionara con mayor fluidez.
Por ejemplo, el autor adoptó cuidadosamente el método avanzado de muestreo de difusión k diseñado por él mismo en Fooocus, que puede mejorar la continuidad del muestreo, reducir la pérdida de rendimiento y mejorar la eficiencia del muestreo;
Además, el autor también ajustó cuidadosamente los parámetros del sampler (Sampler) y modificó y agregó algunas configuraciones nuevas, incluido el estilo de la película, según la versión original.
La razón por la que se agrega la opción LoRA a Fooocus es que el autor descubrió que el modelo SDXL con LoRA (configuración de peso inferior a 0,5) casi siempre es mejor que el modelo SDXL sin LoRA.
El autor que desarrolló el proyecto Fooocus se llama Lvmin Zhang, se graduó de la Universidad de Soochow en 2021 y actualmente es estudiante de doctorado en la Universidad de Stanford.
Varios proyectos que ha realizado, incluidos ControlNet y style2paints, casi todos explotaron:
En las redes sociales, algunos internautas han compilado espontáneamente la versión Fooocus de una colección de palabras clave en diferentes estilos de Excel.
Si no sabe qué tipo de imagen generar, simplemente consulte las palabras clave en este documento:
dirección del proyecto:
Link de referencia: [1] [2] Colección de palabras clave: [3] [4]