AI Painting oynayın, artık İhtiyar Huang bıçak becerileri tarafından "arkadan bıçaklanma" konusunda endişelenmenize gerek yok!
İhtiyacınız olan tek şey, 4 yıl öncesinden kalma bir GTX 1650 (4 GB video belleği) ve AI oluşturma etkisi, mevcut en iyi açık kaynak modeli SDXL ile karşılaştırılabilir.
** **△ Kaynak: Twitter @ナビ
Bu, GitHub'da birkaç gün üst üste TOP 1 listesine hakim olan yeni bir proje Fooocus. Üç gün içinde 4K ile işaretlendi. ControlNet yazarı tarafından üretildi.
Çıkmadan önce, Stable Diffusion'ın en son XL modelini sorunsuz bir şekilde çalıştırmak istiyorsanız, 16G video belleği olan 4060ti kullanmanız gerekir (12G video belleği olan orijinal 3060, çalıştırma konusunda oldukça isteksizdir).
Diğer açık kaynaklı yapay zeka araçlarının aksine, Fooocus "neslin kendisine odaklanır", yalnızca düşük donanım gereksinimlerine sahip olmakla kalmaz, aynı zamanda kullanımı da kolaydır, çok acemi dostudur——
Tüm süreçte herhangi bir parametre ayarlamanıza gerek yoktur, sadece fareye tıklayın ve 3 adımda bir görüntü oluşturulabilir.
** ****△**Resim kaynağı Twitter @Fotojenik Hafta Sonu
Bazı netizenler, "Bu sadece Kararlı Yayılma ve Yolculuğun Ortasının doruk noktasıdır" diye seslendi:
Manuel ayarlamaya elveda deyin! Çevrimdışı, açık kaynak ve ücretsiz, sadece kelimeleri ve resimleri isteyin ve bırakın sihir gerçekleşsin!
Bazı netizenler yakındı: Xiaobai bile Stable Diffusion XL modelinin etkisini tam olarak ortaya koyabiliyor.
Peki bu yepyeni görüntü yapay zeka aracının gerçek nesil etkisi nedir? Biz denedik.
Colab resmi yarım dakikada çizer, etkisi SD ile karşılaştırılabilir
Çalışan arayüz açısından bakıldığında, Fooocus'ta yüzden fazla yerleşik stil arasından seçim yapılabilir.
** ****△**Resim kaynağı Twitter @camenduru
Verimliliğe gelince, Fooocus çizim konusunda da oldukça hızlıdır. Colab'da hız önceliği modunda bir resim çizmek yaklaşık yarım dakika sürer:
Günlükte görüntülenen süre çizim süresidir, ancak daha önce toplamda yaklaşık 40 saniye süren bir metin ayrıştırma işlemi vardı:
** **### △Resim hızlandırıldı
O halde önce bir karikatür çizsin ve "Mazar Savaşı"nın yapay zeka açısından nasıl görüneceğini görün. (Bu Mazaha değil)
Portrelerin yapay zeka ile doğrudan üretilmesi nedeniyle ellerin kullanımında hâlâ bazı sorunlar var, bu yüzden Musk ve Zuckerberg'in eldiven giymesine izin verdik:
Etki oldukça iyi görünüyor. Herhangi bir bahisleri var mı bilmiyorum ama kaybedenin gelip giyinmesine izin verebiliriz.
(Hatırlatma: Dövüşün kazananı yoktur)
Sonunda ikili "el sıkışıp barışıyor" ve bu kıymetli sahne fotoğrafçı tarafından da kayıt altına alınıyor. Resmin geneli bu tadı taşıyor mu?
"Mazar Savaşı" sona erdikten sonra Lao Ma itaatkar bir şekilde şirkete döndü ve Tesla'yı sattı.
LOGO'yu göz ardı ederseniz poster'in tasarım anlayışı oldukça çevrimiçidir.
Aslında, Fooocus'un her yerleşik stili çok ilgi çekicidir, o halde hadi farklı stillerin bu canlı resimlerine bir göz atalım:
Ünlü eserleri taklit etmeye gelince, Cyberpunk versiyonu, Zelda versiyonu, Minecraft versiyonu ve hatta Musk'un izlenecek Pokémon versiyonu var.
Diğer sanat formlarına gelince, Pixel ve Lowpoly stillerinin yanı sıra Nendoroid ve Scissorial versiyonları da mevcut…
Elbette sonsuz sayıda örnek var, daha fazla tarza sahip okuyucular ve arkadaşlar bunu kendi başlarına deneyimleyebilirler.
(Yapay zeka çizimindeki metnin nihayet hayalet bir çizim olmadığını söylemek gerekiyor)
Büyük ressamlar zaten sabırsız mı ve denemek mi istiyorlar? Birazdan Fooocus'un nasıl oynanacağını tanıtacağız!
Fooocus'un arayüzü Jiang Teyze'ye ait olup oldukça kısa olduğu söylenebilir:
Yalnızca yeni bir şey deniyorsanız ve özel bir gereksiniminiz yoksa bu bilgi kutusu tamamen yeterlidir.
Yazar birçok karmaşık beceriyi programa içselleştirdiğinden, parametre ayarlama işlemlerinin artık manuel olarak yapılmasına gerek yoktur.
Aşağıdaki kutuya doğrudan girin, oluştur butonuna tıklayın ve çizimin üretilmesini bekleyin.
(Varsayılan olarak, aynı anda iki resim çıkarılır, boyut 1152×896'dır, stil varsayılan sinematiktir ve hıza öncelik verilir)
Gelişmiş ayarlar gerekiyorsa sol alt köşedeki Gelişmiş seçeneğini işaretleyin; yapılandırma bilgileri sayfanın sağ tarafında üç sekmeye bölünmüş olarak görünecektir:
Ayarlanabilecek şeyler arasında boyut, miktar, stil, performans ve daha fazlası yer alır.
Profesyonel bir oyuncuysanız model versiyonunu da seçebilir ve hatta LoRA parametrelerini bile ayarlayabilirsiniz.
Ayrıca keskinliği ayarlama konusunda üst düzey bir oyun da mevcuttur.
Aynı içerik için aşağıdaki GIF, keskinliğin 2'den 10'a ve ardından 20'ye değişimini göstermektedir. Keskinlik arttıkça resmin ayrıntılarının da giderek arttığı görülüyor:
Ancak Fooocus'un Çince'yi destekleyip desteklemediğine gelince, onu da denedik ama henüz mevcut olmaması üzücü.
Örneğin, "elma" istem kelimesini giriyoruz ve sonuç bir kız oluyor.
Bu... "Sen benim gözbebeğimsin" mi demeye çalışıyor?
Artık muhtemelen Fooocus'u nasıl oynayacağınızı biliyorsunuzdur, peki nasıl yapılandırılır?
Nvidia grafik kartına sahip bir Windows makineniz varsa, kullanıma hazır sürümü kullanabilirsiniz. (Muhtemelen bu, Lao Huang'ın mahjong'u kazandığı 114514'üncü seferdir)
Aynı zamanda donanımın minimum yapılandırma gereksinimlerini (4 GB video belleği + 8 GB bellek) karşılaması gerekir.
Önce doğrudan buradan indirin:
Sıkıştırmayı açtıktan sonra çalıştırmak için run.bat'a çift tıklayın; sistem modeli otomatik olarak indirip dağıtacaktır ve yapılandırma tamamlandıktan sonra kullanılabilir.
Linux sürümünün yapılandırma gereksinimleri Windows'unkilerle aynıdır ancak yapılandırma süreci daha karmaşıktır.
(Jupyter'ınız varsa Colab'da kullanılan not dosyasına da başvurabilirsiniz)
Daha sonra model dosyasını indirin ve belirtilen dizinde saklayın:
** **△ Ayrıntılar için lütfen GitHub sayfasına bakın
Elbette sistemin modeli otomatik olarak indirmesine de izin verebilirsiniz:
python launch.py
Mac kullanıyorsanız veya donanım yapılandırması gereksinimleri karşılamıyorsa doğrudan Colab ile de çalıştırabilirsiniz.
(Portal:
Ancak yine de şikayet etmem gereken şey, Colab sürümünün zaman zaman birkaç kez çökmesi, otomatik olarak durması veya hafızanın taşması...
Fooocus'u Mac veya A kartlı bilgisayarda daha sorunsuz çalıştırmak istiyorsanız yazarın güncellemesini bekleyebilirsiniz.
Genel olarak, Fooocus'un görüntü çıktı etkisi iyidir.Eğer istem kelimesi iyi seçilirse, Kararlı Difüzyon olarak bile kullanılabilir.Önemli olan, donanım konfigürasyon gereksinimlerinin yüksek olmamasıdır.
Bu nasıl mümkün olabilir?
ControlNet yazarının son projesinden
Mimari tasarım açısından Fooocus temel olarak iki bölüme ayrılmıştır: etkileşimli arayüz ve yapay zeka modeli.
Bunlar arasında etkileşimli arayüz, stabil-difüzyon-webui ve ComfyUI olmak üzere iki projeyi ifade eder.
stabil-difüzyon-webui esas olarak etkileşimli arayüzün ön uç tasarımıdır:
ComfyUI, Stabil Difüzyonun hem GUI'sine hem de arka uç tasarımına sahiptir:
AI modeline gelince, Kararlı Difüzyonun yeni SDXL modelinin kullanıldığı görülebilir:
Bu şu anda Stabil Difüzyonun en iyi sürümlerinden biridir ve oluşturma etkisi önceki sürüm 1.5'e kıyasla çok daha iyileştirilmiştir.
Bununla birlikte, Fooocus'un modeli ve kullanıcı arayüzü tasarımı hazır Stable Diffusion açık kaynak projesine atıfta bulunsa da, yazar bunu yaparken kendi optimizasyon tasarımının çoğunu dahil ederek modelin daha sorunsuz çalışmasını sağladı.
Örneğin yazar, Fooocus'ta kendisi tarafından tasarlanan, örnekleme sürekliliğini artırabilen, performans kaybını azaltabilen ve örnekleme verimliliğini artırabilen gelişmiş k-difüzyon örnekleme yöntemini dikkatli bir şekilde benimsemiştir;
Ek olarak yazar, örnekleyicinin (Sampler) parametrelerini de dikkatli bir şekilde ayarlamış ve orijinal versiyona göre film stili dahil bazı yeni ayarları değiştirmiş ve eklemiştir.
LoRA seçeneğinin Fooocus'a eklenmesinin nedeni, yazarın LoRA'lı SDXL modelinin (ağırlık ayarı 0,5'ten düşük) neredeyse her zaman LoRA'sız SDXL modelinden daha iyi olduğunu bulmuş olmasıdır.
Fooocus projesini geliştiren yazarın adı Lvmin Zhang. 2021 yılında Soochow Üniversitesi'nden mezun oldu ve şu anda Stanford Üniversitesi'nde doktora öğrencisi.
ControlNet ve style2paints de dahil olmak üzere gerçekleştirdiği birçok projede neredeyse hepsi patladı:
Şimdi, en son proje olan Fooocus da aynı derecede popüler görünüyor.
Sosyal medyada bazı netizenler, farklı Excel stillerinde hızlı kelimelerden oluşan bir koleksiyonun Fooocus versiyonunu kendiliğinden derledi.
Ne tür bir resim oluşturacağınızı bilmiyorsanız, bu belgedeki hızlı sözcüklere başvurmanız yeterlidir:
Fooocus ile ne tür görseller oluşturmak istediğinize karar verdiniz mi?
The content is for reference only, not a solicitation or offer. No investment, tax, or legal advice provided. See Disclaimer for more risks disclosure.
AIGC'yi oynatmak için düşük konfigürasyonlu 4G video belleği! ControlNet yazarının yeni çalışması GitHub sıcak listesinin en üstüne çıktı
Makale Kaynağı: Qubit
Metin: Cressy Xiaoxiao
AI Painting oynayın, artık İhtiyar Huang bıçak becerileri tarafından "arkadan bıçaklanma" konusunda endişelenmenize gerek yok!
İhtiyacınız olan tek şey, 4 yıl öncesinden kalma bir GTX 1650 (4 GB video belleği) ve AI oluşturma etkisi, mevcut en iyi açık kaynak modeli SDXL ile karşılaştırılabilir.
**
**△ Kaynak: Twitter @ナビ
Bu, GitHub'da birkaç gün üst üste TOP 1 listesine hakim olan yeni bir proje Fooocus. Üç gün içinde 4K ile işaretlendi. ControlNet yazarı tarafından üretildi.
Diğer açık kaynaklı yapay zeka araçlarının aksine, Fooocus "neslin kendisine odaklanır", yalnızca düşük donanım gereksinimlerine sahip olmakla kalmaz, aynı zamanda kullanımı da kolaydır, çok acemi dostudur——
Tüm süreçte herhangi bir parametre ayarlamanıza gerek yoktur, sadece fareye tıklayın ve 3 adımda bir görüntü oluşturulabilir.
**
****△**Resim kaynağı Twitter @Fotojenik Hafta Sonu
Bazı netizenler, "Bu sadece Kararlı Yayılma ve Yolculuğun Ortasının doruk noktasıdır" diye seslendi:
Colab resmi yarım dakikada çizer, etkisi SD ile karşılaştırılabilir
Çalışan arayüz açısından bakıldığında, Fooocus'ta yüzden fazla yerleşik stil arasından seçim yapılabilir.
**
****△**Resim kaynağı Twitter @camenduru
Verimliliğe gelince, Fooocus çizim konusunda da oldukça hızlıdır. Colab'da hız önceliği modunda bir resim çizmek yaklaşık yarım dakika sürer:
**
**### △Resim hızlandırıldı
O halde önce bir karikatür çizsin ve "Mazar Savaşı"nın yapay zeka açısından nasıl görüneceğini görün. (Bu Mazaha değil)
(Hatırlatma: Dövüşün kazananı yoktur)
LOGO'yu göz ardı ederseniz poster'in tasarım anlayışı oldukça çevrimiçidir.
Ünlü eserleri taklit etmeye gelince, Cyberpunk versiyonu, Zelda versiyonu, Minecraft versiyonu ve hatta Musk'un izlenecek Pokémon versiyonu var.
Elbette sonsuz sayıda örnek var, daha fazla tarza sahip okuyucular ve arkadaşlar bunu kendi başlarına deneyimleyebilirler.
(Yapay zeka çizimindeki metnin nihayet hayalet bir çizim olmadığını söylemek gerekiyor)
Fooocus'un arayüzü Jiang Teyze'ye ait olup oldukça kısa olduğu söylenebilir:
Yalnızca yeni bir şey deniyorsanız ve özel bir gereksiniminiz yoksa bu bilgi kutusu tamamen yeterlidir.
Yazar birçok karmaşık beceriyi programa içselleştirdiğinden, parametre ayarlama işlemlerinin artık manuel olarak yapılmasına gerek yoktur.
(Varsayılan olarak, aynı anda iki resim çıkarılır, boyut 1152×896'dır, stil varsayılan sinematiktir ve hıza öncelik verilir)
Gelişmiş ayarlar gerekiyorsa sol alt köşedeki Gelişmiş seçeneğini işaretleyin; yapılandırma bilgileri sayfanın sağ tarafında üç sekmeye bölünmüş olarak görünecektir:
Profesyonel bir oyuncuysanız model versiyonunu da seçebilir ve hatta LoRA parametrelerini bile ayarlayabilirsiniz.
Aynı içerik için aşağıdaki GIF, keskinliğin 2'den 10'a ve ardından 20'ye değişimini göstermektedir. Keskinlik arttıkça resmin ayrıntılarının da giderek arttığı görülüyor:
Örneğin, "elma" istem kelimesini giriyoruz ve sonuç bir kız oluyor.
Bu... "Sen benim gözbebeğimsin" mi demeye çalışıyor?
Nvidia grafik kartına sahip bir Windows makineniz varsa, kullanıma hazır sürümü kullanabilirsiniz. (Muhtemelen bu, Lao Huang'ın mahjong'u kazandığı 114514'üncü seferdir)
Aynı zamanda donanımın minimum yapılandırma gereksinimlerini (4 GB video belleği + 8 GB bellek) karşılaması gerekir.
Önce doğrudan buradan indirin:
Sıkıştırmayı açtıktan sonra çalıştırmak için run.bat'a çift tıklayın; sistem modeli otomatik olarak indirip dağıtacaktır ve yapılandırma tamamlandıktan sonra kullanılabilir.
(Jupyter'ınız varsa Colab'da kullanılan not dosyasına da başvurabilirsiniz)
İlk olarak ortam bağımlılıklarını yükleyin:
git klonu cd Fooocus conda env -f ortamı oluştur.yaml conda fooocus'u etkinleştir pip kurulumu -r gereksinimleri_versions.txt
Daha sonra model dosyasını indirin ve belirtilen dizinde saklayın:
**
**△ Ayrıntılar için lütfen GitHub sayfasına bakın
Elbette sistemin modeli otomatik olarak indirmesine de izin verebilirsiniz:
python launch.py
Mac kullanıyorsanız veya donanım yapılandırması gereksinimleri karşılamıyorsa doğrudan Colab ile de çalıştırabilirsiniz.
(Portal:
Ancak yine de şikayet etmem gereken şey, Colab sürümünün zaman zaman birkaç kez çökmesi, otomatik olarak durması veya hafızanın taşması...
Genel olarak, Fooocus'un görüntü çıktı etkisi iyidir.Eğer istem kelimesi iyi seçilirse, Kararlı Difüzyon olarak bile kullanılabilir.Önemli olan, donanım konfigürasyon gereksinimlerinin yüksek olmamasıdır.
Bu nasıl mümkün olabilir?
ControlNet yazarının son projesinden
Mimari tasarım açısından Fooocus temel olarak iki bölüme ayrılmıştır: etkileşimli arayüz ve yapay zeka modeli.
Bunlar arasında etkileşimli arayüz, stabil-difüzyon-webui ve ComfyUI olmak üzere iki projeyi ifade eder.
stabil-difüzyon-webui esas olarak etkileşimli arayüzün ön uç tasarımıdır:
Bununla birlikte, Fooocus'un modeli ve kullanıcı arayüzü tasarımı hazır Stable Diffusion açık kaynak projesine atıfta bulunsa da, yazar bunu yaparken kendi optimizasyon tasarımının çoğunu dahil ederek modelin daha sorunsuz çalışmasını sağladı.
Örneğin yazar, Fooocus'ta kendisi tarafından tasarlanan, örnekleme sürekliliğini artırabilen, performans kaybını azaltabilen ve örnekleme verimliliğini artırabilen gelişmiş k-difüzyon örnekleme yöntemini dikkatli bir şekilde benimsemiştir;
Ek olarak yazar, örnekleyicinin (Sampler) parametrelerini de dikkatli bir şekilde ayarlamış ve orijinal versiyona göre film stili dahil bazı yeni ayarları değiştirmiş ve eklemiştir.
LoRA seçeneğinin Fooocus'a eklenmesinin nedeni, yazarın LoRA'lı SDXL modelinin (ağırlık ayarı 0,5'ten düşük) neredeyse her zaman LoRA'sız SDXL modelinden daha iyi olduğunu bulmuş olmasıdır.
Fooocus projesini geliştiren yazarın adı Lvmin Zhang. 2021 yılında Soochow Üniversitesi'nden mezun oldu ve şu anda Stanford Üniversitesi'nde doktora öğrencisi.
ControlNet ve style2paints de dahil olmak üzere gerçekleştirdiği birçok projede neredeyse hepsi patladı:
Sosyal medyada bazı netizenler, farklı Excel stillerinde hızlı kelimelerden oluşan bir koleksiyonun Fooocus versiyonunu kendiliğinden derledi.
Ne tür bir resim oluşturacağınızı bilmiyorsanız, bu belgedeki hızlı sözcüklere başvurmanız yeterlidir:
proje adresi:
Referans bağlantısı: [1] [2] İstemi kelimelerin toplanması: [3] [4]