Memori video 4G dengan konfigurasi rendah untuk memainkan AIGC! Karya baru penulis ControlNet mencapai puncak daftar panas GitHub

2023-08-27 02:02:26

Sumber Artikel: Qubit

Teks: Cressy Xiaoxiao

Mainkan AI Painting, sekarang Anda tidak perlu khawatir "ditusuk dari belakang" oleh keterampilan pisau Old Huang!

Yang Anda butuhkan hanyalah GTX 1650 (memori video 4GB) dari 4 tahun lalu, dan efek rendering AI sebanding dengan model sumber terbuka terbaik SDXL saat ini.

** **△ Sumber: Twitter @ナビ

Ini adalah proyek baru Foocus yang mendominasi daftar TOP 1 di GitHub selama beberapa hari berturut-turut. Telah ditandai dengan 4K dalam tiga hari. Ini diproduksi oleh penulis ControlNet.

Ternyata, jika ingin menjalankan Stable Diffusion model XL terbaru dengan lancar, Anda harus menggunakan 4060ti dengan memori video 16G (3060 asli dengan memori video 12G sangat enggan dijalankan).

Tidak seperti alat AI sumber terbuka lainnya, Fooocus "berfokus pada generasi itu sendiri", tidak hanya memiliki persyaratan perangkat keras yang rendah, tetapi juga mudah digunakan, sangat ramah bagi pemula——

Tidak perlu menyesuaikan parameter apa pun di seluruh proses, cukup klik mouse, dan gambar dapat dibuat dalam 3 langkah.

** ****△**Sumber gambar Twitter @Photogenic Weekend

Beberapa netizen berseru, "Ini hanyalah puncak dari Difusi Stabil dan Perjalanan Tengah":

Ucapkan selamat tinggal pada penyetelan manual! Offline, open source dan gratis, cukup masukkan kata-kata dan gambar dan biarkan keajaiban terjadi!

Beberapa netizen menyesalkan: Bahkan Xiaobai dapat memberikan efek penuh pada model Stable Diffusion XL.

Jadi, apa sebenarnya efek generasi dari alat AI gambar baru ini? Kami mencobanya.

Colab menggambar dalam setengah menit, efeknya sebanding dengan SD

Dari perspektif antarmuka yang berjalan, Fooocus memiliki lebih dari seratus gaya bawaan untuk dipilih.

** ****△**Sumber gambar Twitter @camenduru

Sedangkan untuk efisiensi, Fooocus juga sangat cepat dalam menggambar. Di Colab, diperlukan waktu sekitar setengah menit untuk menggambar dalam mode prioritas kecepatan:

Waktu yang ditampilkan di log adalah waktu menggambar, tetapi sebelumnya ada proses penguraian teks yang memakan waktu total sekitar 40 detik:

** **### △Gambar telah dipercepat

Kemudian biarkan ia menggambar karikatur terlebih dahulu, dan lihat seperti apa "Perang Mazar" dari sudut pandang AI. (Bukan Mazaha ini)

Karena pembuatan potret langsung dengan AI, masih ada beberapa masalah dengan penanganan tangan, jadi kami membiarkan Musk dan Zuckerberg memakai sarung tangan:

Efeknya tampaknya cukup bagus. Saya tidak tahu apakah mereka punya taruhan, tapi sebaiknya biarkan yang kalah datang untuk berdandan.

(Pengingat: Tidak ada pemenang dalam pertarungan)

Pada akhirnya, keduanya "berjabat tangan dan berdamai", dan pemandangan berharga ini juga direkam oleh sang fotografer.Apakah keseluruhan gambarnya memiliki cita rasa seperti itu?

Setelah "Pertempuran Mazar" berakhir, Lao Ma dengan patuh kembali ke perusahaan dan menjual Tesla.

Jika Anda mengabaikan LOGO, kesan desain poster cukup online.

Faktanya, setiap gaya bawaan Fooocus sangat menarik, jadi mari kita lihat gambar langsung gaya berbeda ini:

Dalam hal meniru karya terkenal, ada versi Cyberpunk, versi Zelda, versi Minecraft, dan bahkan versi Musk Pokémon yang harus ditonton.

Sedangkan untuk bentuk seni lainnya, ada gaya Pixel dan Lowpoly, serta versi Nendoroid dan Scissorial…

Tentu saja, ada banyak sekali contoh, pembaca dan teman dengan lebih banyak gaya dapat mengalaminya sendiri.

(Harus dikatakan bahwa teks dalam gambar AI pada akhirnya bukanlah gambar hantu)

Apakah para pelukis hebat sudah tidak sabar dan ingin mencobanya? Kami akan memperkenalkan cara bermain Fooocus sebentar lagi!

Antarmuka Fooocus milik Bibi Jiang, yang bisa dikatakan sangat ringkas:

Jika Anda hanya mencoba sesuatu yang baru dan tidak memiliki persyaratan khusus, kotak prompt ini sudah cukup.

Karena penulis telah menginternalisasikan banyak keterampilan kompleks ke dalam program, pengoperasian parameter penyetelan ini tidak perlu lagi dilakukan secara manual.

Langsung masuk ke kotak di bawah, klik tombol generate dan tunggu gambarnya dihasilkan.

(Secara default, dua gambar dikeluarkan sekaligus, ukurannya 1152×896, gaya default sinematik, dan kecepatan diprioritaskan)

Jika pengaturan lanjutan diperlukan, centang Lanjutan di sudut kiri bawah, dan informasi konfigurasi akan muncul di sisi kanan halaman, dibagi menjadi tiga tab:

Hal-hal yang dapat disesuaikan meliputi ukuran, kuantitas, gaya, performa dan lainnya.

Jika Anda seorang pemain profesional, Anda juga dapat memilih versi model dan bahkan menyesuaikan parameter LoRA.

Selain itu, ada permainan kelas atas menyesuaikan ketajaman.

Untuk konten yang sama, GIF berikut menunjukkan perubahan ketajaman dari 2 menjadi 10 lalu menjadi 20. Terlihat bahwa seiring dengan meningkatnya ketajaman, detail gambar menjadi semakin melimpah:

Namun, apakah Fooocus mendukung China, kami juga sudah mencobanya, tetapi sayangnya belum tersedia.

Misalnya, kita memasukkan kata prompt "apel", dan hasilnya adalah perempuan.

Ini... apakah dia mencoba mengatakan "Kamu adalah biji mataku"?

Sekarang Anda mungkin tahu cara memainkan Fooocus, jadi bagaimana cara mengkonfigurasinya?

Jika Anda memiliki mesin Windows dengan kartu grafis Nvidia, Anda dapat menggunakan versi siap pakai. (Mungkin ini yang ke 114514 kalinya Lao Huang memenangkan mahjong)

Pada saat yang sama, perangkat keras harus memenuhi persyaratan konfigurasi minimum - memori video 4GB + memori 8GB.

Download langsung dari sini dulu:

Setelah dekompresi, klik dua kali run.bat untuk menjalankan, sistem akan secara otomatis mengunduh model dan menerapkannya, dan dapat digunakan setelah konfigurasi selesai.

Persyaratan konfigurasi versi Linux sama dengan Windows, namun proses konfigurasinya lebih rumit.

(Jika Anda memiliki Jupyter, Anda juga dapat merujuk ke file catatan yang digunakan di Colab)

Pertama, instal dependensi lingkungan:

git klon CD Fooocus conda env buat -f lingkungan.yaml conda aktifkan fooocus instalasi pip -r persyaratan_versions.txt

Kemudian unduh file model dan simpan di direktori yang ditentukan:

** **△ Untuk detailnya, silakan merujuk ke halaman GitHub

Tentu saja, Anda juga dapat membiarkan sistem mengunduh model secara otomatis:

peluncuran python.py

Jika Anda menggunakan Mac, atau konfigurasi perangkat kerasnya tidak memenuhi persyaratan, Anda juga dapat menjalankannya langsung dengan Colab.

(Pintu gerbang:

Namun, yang masih harus saya keluhkan adalah versi Colab akan crash beberapa kali dari waktu ke waktu, baik berhenti otomatis atau memori meluap...

Jika Anda ingin menjalankan Fooocus lebih lancar di Mac atau komputer kartu, Anda dapat menunggu pembaruan dari pembuatnya.

Secara keseluruhan, efek keluaran gambar Fooocus bagus, jika kata prompt dipilih dengan baik, bahkan dapat digunakan sebagai Difusi Stabil, kuncinya adalah persyaratan konfigurasi perangkat keras tidak tinggi.

Bagaimana ini mungkin?

Dari proyek terbaru penulis ControlNet

Dalam hal desain arsitektur, Fooocus terutama dibagi menjadi dua bagian: antarmuka interaktif dan model AI.

Diantaranya, antarmuka interaktif mengacu pada dua proyek, yaitu stable-diffusion-webui dan ComfyUI.

stable-diffusion-webui pada dasarnya adalah desain front-end dari antarmuka interaktif:

ComfyUI memiliki GUI dan desain back-end Difusi Stabil:

Sedangkan untuk model AI, terlihat bahwa model Difusi Stabil SDXL baru digunakan:

Saat ini merupakan salah satu versi Difusi Stabil terbaik, dan efek generasinya telah banyak ditingkatkan dibandingkan versi 1.5 sebelumnya.

Namun, meskipun model dan desain UI Fooocus mengacu pada proyek open source Stable Diffusion yang sudah jadi, penulis banyak memasukkan desain pengoptimalannya sendiri saat membuatnya, membuat model berjalan lebih lancar.

Misalnya, penulis dengan hati-hati mengadopsi metode pengambilan sampel difusi k tingkat lanjut yang dirancang sendiri di Fooocus, yang dapat meningkatkan kontinuitas pengambilan sampel, mengurangi kehilangan kinerja, dan meningkatkan efisiensi pengambilan sampel;

Selain itu, penulis juga dengan hati-hati menyesuaikan parameter sampler (Sampler), dan memodifikasi serta menambahkan beberapa pengaturan baru termasuk gaya film berdasarkan versi aslinya.

Alasan mengapa opsi LoRA ditambahkan ke Fooocus adalah karena penulis menemukan bahwa model SDXL dengan LoRA (pengaturan bobot kurang dari 0,5) hampir selalu lebih baik daripada model SDXL tanpa LoRA.

Penulis yang mengembangkan proyek Fooocus bernama Lvmin Zhang, lulus dari Universitas Soochow pada tahun 2021 dan saat ini menjadi mahasiswa PhD di Universitas Stanford.

Beberapa proyek yang pernah dikerjakannya, antara lain ControlNet dan style2paints, hampir semuanya meledak:

Kini, proyek terbaru, Fooocus, tampaknya juga tak kalah populernya.

Di media sosial, beberapa netizen secara spontan menyusun kumpulan kata-kata cepat versi Fooocus dalam berbagai gaya Excel.

Jika Anda tidak tahu jenis gambar apa yang akan dihasilkan, lihat saja kata-kata petunjuk dalam dokumen ini:

Sudahkah Anda mengetahui jenis gambar apa yang ingin Anda hasilkan dengan Fooocus?

alamat proyek:

Tautan referensi: [1] [2] Kumpulan kata-kata cepat: [3] [4]

Lihat Asli

Konten ini hanya untuk referensi, bukan ajakan atau tawaran. Tidak ada nasihat investasi, pajak, atau hukum yang diberikan. Lihat Penafian untuk pengungkapan risiko lebih lanjut.

1 Suka

Hadiah
1
Komentar
Bagikan

Komentar

0/400

Tidak ada komentar

Topik
#BTC#
207k postingan
#PI#
152k postingan
#ETH#
131k postingan
4#GateioInto11#
78k postingan
5#ContentStar#
65k postingan
6#BOME#
60k postingan
7#GT#
59k postingan
8#DOGE#
55k postingan
9#MAGA#
52k postingan
10#SLERF#
51k postingan

Sematkan

peta situs