Çin İnternet Topluluğu yayınlandı: 2023 Küresel Üretken Yapay Zeka Endüstrisi Araştırma Raporu

Kaynak: Çin İnternet Topluluğu

19 Mayıs 2023'te, Çin İnternet Topluluğu ve Çin Yazılım Endüstrisi Derneği, Tianjin Yapay Zeka Derneği, Zhiding Technology ve Zhiding Think Tank tarafından ortaklaşa yürütülen Yedinci Dünya İstihbarat Konferansı "Dünya Akıllı Teknoloji İnovasyon İşbirliği Zirvesi" sırasında The " Yazar tarafından hazırlanan Küresel Üretken Yapay Zeka Endüstrisi Haritası 2023" ve "2023 Küresel Üretken Yapay Zeka Endüstrisi Araştırma Raporu", devlet daireleri, endüstri uygulayıcıları, eğitimciler ve kamu durumu için referans olması amacıyla küresel üretken yapay zekanın gelişimini daha iyi anlamak için yayınlandı.

Resim kredisi: Unbounded AI araçları tarafından oluşturulmuştur

Yapay zekanın sınır alanı olan üretken yapay zeka, dünyadaki en sıcak teknoloji konusu haline geldi. 2022'de OpenAI, ChatGPT'yi piyasaya sürdü ve üretken yapay zeka, model uygulama düzeyinde önemli bir atılım gerçekleştirdi.Aylık aktif kullanıcı sayısı sadece iki ayda 100 milyonu aşarak, onu tarihin en hızlı büyüyen tüketici uygulaması haline getirdi. Dünyanın dört bir yanındaki birçok teknoloji şirketi, teknoloji, ürünler ve uygulamalarda sürekli olarak önemli başarılar başlatarak ve yapay zekanın inovasyonunu ve ticarileştirilmesini sürekli olarak teşvik ederek, üretken yapay zeka alanındaki araştırma ve geliştirmeye yatırımlarını artırdı.

Bu bağlamda, Çin İnternet Topluluğu ve Çin Yazılım Endüstrisi Derneği rehberliğinde, Tianjin Yapay Zeka Derneği, Zhiding Technology ve Zhiding Think Tank ortaklaşa, “2023 Küresel Üretken Yapay Zeka Endüstrisi Araştırma Raporu”nu yayınladı. küresel bakış açısı, üretken yapay zekanın sektöre genel bakışını, altyapısını, algoritma modelini, senaryo uygulamasını, fırsatlarını ve zorluklarını sıralamak, üretken yapay zekanın endüstriyel gelişimini kapsamlı bir şekilde göstermek ve devlet daireleri, sektör uygulayıcıları, eğitimciler ve kamu için daha fazla bilgi sağlamak A üretici yapay zekanın iyi anlaşılması bir referans sağlar.

01 Üretken Yapay Zeka Sektörüne Genel Bakış

1.1 Üretken yapay zeka konsepti ve içerik oluşturma aşaması

Generative AI, profesyonelce oluşturulmuş içerik (PGC) ve kullanıcı tarafından oluşturulan içerikten (UGC) sonra otomatik olarak içerik oluşturmak için yapay zeka teknolojisini kullanan yeni bir üretim yöntemidir.

Üretken yapay zeka, büyük eğitim verilerine ve önceden eğitilmiş büyük ölçekli modellere dayalı olarak metin, ses, görüntü, video ve modlar arası bilgileri otomatik olarak oluşturur ve oluşturur. OpenAI, 2022'de ChatGPT'yi piyasaya sürdüğünden beri, küresel bir üretici yapay zeka dalgası patlak verdi ve birçok teknoloji şirketi, üretken yapay zeka modelleri, ürünleri ve ilgili temel altyapı ve hizmetleri piyasaya sürdü.

1.2 Üretken yapay zeka endüstrisinin gelişimi için itici güçler

Son yıllarda, küresel veri ölçeği büyümeye devam etti. IDC, küresel veri ölçeğinin 2025 yılına kadar 175ZB'ye ulaşacağını ve yapay zeka model eğitimi için büyük veri kaynakları sağlayacağını tahmin ediyor; yüksek performanslı AI yongalarının piyasaya sürülmesi, büyük ölçekli ön eğitim modelleri; Sürekli geliştirme ile Transformer, BERT, LaMDA ve ChatGPT gibi modeller hızlı yinelemeli optimizasyona ulaşmıştır. Veriler, bilgi işlem gücü ve modellerle yönlendirilen küresel üretken yapay zeka endüstrisi hızla gelişti ve ilgili senaryolar ve uygulamalar sürekli olarak zenginleştirildi.

02 Üretken Yapay Zeka Altyapısı

2.1 AI yüksek performanslı yongalar, üretken AI eğitimi için bilgi işlem gücü desteği sağlar

Yapay zekanın gelişimi, derin öğrenme çağından büyük modeller çağına girmiştir.Büyük ölçekli ön eğitim modellerinin parametre sayısı, yüksek performanslı bilgi işlem gücünün desteğini gerektiren üstel bir artış göstermiştir.

Şu anda, büyük ölçekli eğitim öncesi modellerin eğitim bilgi işlem gücü geçmişin 10 ila 100 katıdır.Mevcut ana üretim yapay zeka modeli eğitimi, Nvidia Tensor Core GPU yongalarını yaygın olarak kullanıyor.Örneğin, Microsoft yüz milyonlarca dolar harcadı Open AI'nin ChatGPT oluşturmasına yardımcı olmak için on binlerce Nvidia A100 yongası satın almak.

2.2 AI bilgi işlem kümeleri, üretken AI eğitimi için büyük ölçekli bilgi işlem kaynakları sağlar

Yapay zeka bilgi işlem kümeleri, büyük ölçekli bilgi işlem gücü sağlayabilir, bilgi işlem gücü kaynağı kullanımını sürekli olarak iyileştirebilir, veri depolama ve işleme yeteneklerini geliştirebilir ve yapay zeka büyük model eğitimini ve çıkarım verimliliğini hızlandırabilir.

Şu anda, Nvidia DGX SuperPOD, Baidu Akıllı Bulut Yüksek Performanslı Bilgi İşlem Kümesi EHC, Tencent'in yeni nesil yüksek performanslı bilgi işlem kümesi HCC vb. AI eğitim senaryoları, model eğitiminin eşiğini ve maliyetini daha da azaltın ve üretken AI modellerinin uygulanmasını teşvik edin.

2.3 AI bulut hizmeti, üretken AI model geliştirme için platform desteği sağlar

Yapay zeka ön eğitim modellerinin geliştirilmesi, bulut hizmetlerine yönelik büyük bir talebe sahiptir. Yapay zeka bulut hizmetleri, yapay zeka geliştirme modülleri sağlayabilir. Çeşitlendirilmiş hizmet modelleri sayesinde, geliştiricilerin geliştirme maliyetleri ve ürün geliştirme döngüleri azaltılabilir ve yapay zekanın güçlendirilmesi sağlanabilir. model geliştirme için. .

Tipik bir örnek, görüntü/görüntü analizi, konuşma işleme, doğal dil anlama ve diğer ilgili hizmetleri sağlayabilen Amazon SageMaker'dır ve kullanıcılar, parametreleri ve algoritmaları bilmeden işlevsel uygulamaları gerçekleştirebilir.

Baidu Flying Paddle EasyDL sıfır eşikli yapay zeka geliştirme platformu, görüntü sınıflandırması, nesne algılama, metin sınıflandırması, ses sınıflandırması ve video sınıflandırması gibi işlevler sunarak tek noktadan otomatik eğitim gerçekleştirir ve yapay zeka özel geliştirme eşiğini düşürür.

03 Üretken Yapay Zeka Algoritma Modeli

3.1 Küresel üretken yapay zeka modellerinin geliştirme geçmişi

3.2 Dil üretimi için ana akım modeller: OpenAI GPT-1'den GPT-4'e

OpenAI, 2018'den bu yana GPT-1, GPT-2, GPT-3, ChatGPT ve GPT-4 gibi bir dizi üretken ön eğitim modelini arka arkaya yayınladı. GPT-1 modeli, Transformer mimarisine dayalıdır ve mimarinin yalnızca kod çözücü kısmı korunur;

GPT-2 modeli, GPT-1'deki denetimli ince ayar aşamasını iptal eder;

GPT-3 modeli, GPT-2'nin sıfır vuruşunu terk eder ve belirli görevler için az sayıda örnek vermek üzere birkaç vuruş kullanır; ChatGPT, çıktıyı ayarlama becerisini geliştirmek için RLHF (insan geribildirimiyle pekiştirmeli öğrenme) teknolojisini kullanır. model;

2023'te piyasaya sürülen GPT-4 modeli, daha güçlü çok modlu yeteneklere sahiptir. Çok modlu grafik ve metin girişini destekler ve görsel öğelerin sınıflandırılmasını, analizini ve örtülü anlamsal çıkarımını gerçekleştirebilen ve mükemmel Yanıt yeteneği gösteren yanıt metni oluşturur. .

3.3 Dil sınıfı oluşturma ana model: Google Transformer'dan PaLM-E'ye

2017'de Google, ikonik Transformer modelini piyasaya sürdü. Bu modelin kod çözme modülü, GPT modelinin temel öğesi haline geldi. Dikkat mekanizmasını tanıtarak, daha büyük ölçekli paralel hesaplamayı gerçekleştirebilir, modelin eğitim süresini önemli ölçüde azaltabilir, ve büyük ölçekli yapay zeka modelleri uygulanır. BERT modeli ve LaMDA modeli, bilgi çıkarma yetenekleri ve güvenlik açısından sürekli olarak gelişmektedir.

Yeni lansmanı yapılan PaLM-E modeli, güçlü genelleme ve taşıma yeteneklerine sahiptir.Multi-modal verileri (dil, görüntü, dokunma vb.) işleyebilmektedir.

3.4 Görüntü üretimi için ana model: Difüzyon Modeli

Difüzyon Modeli üzerine yapılan araştırmalar 2015 yılına kadar izlenebilir ve 2020'de Gürültü Giderici Difüzyon Olasılık Modeli (DDPM) önerildi ve difüzyon modelinin güçlü yeteneklerini gösterdi ve difüzyon modelinin gelişimini yönlendirdi. Model temel olarak iki süreç içerir: ileri süreç ve geri süreç.İleri süreç aynı zamanda difüzyon süreci olarak da adlandırılır.Difüzyon modeli, eğitim verilerini yok etmek için görüntüye Gauss gürültüsü ekleyerek öğrenir, gürültüyü tersine çevirme yöntemini bulur. rasgele girdilerden yeni görüntülerin sentezini sağlayan öğrenilen Gürültü Giderme yöntemlerini kullanır.

Difüzyon modelinin avantajı, oluşturulan görüntülerin daha kaliteli olması ve çekişmeli eğitim gerektirmemesidir.Daha az veriye ihtiyaç duyulması koşuluyla, modelin görüntü oluşturma etkisi önemli ölçüde iyileştirilir.

PART.04 Üretken Yapay Zeka Senaryo Uygulaması 4.1 Tipik Küresel Üretken Yapay Zeka Uygulamalarına Genel Bakış

4.2 Üretken Yapay Zeka Senaryo Uygulaması—Metin Oluşturma

Metin oluşturma uygulamaları temel olarak dört alandadır: içerik devamı, metin stili aktarımı, özet/başlık oluşturma ve tüm metin oluşturma İlgili kişiselleştirilmiş metin oluşturma ve gerçek zamanlı metin etkileşimi geniş beklentilere sahiptir.

Genel olarak konuşursak, NLP teknolojisine dayalı metin oluşturma, üretici yapay zekada daha eski bir uygulamadır. Dünyaca ünlü teknoloji şirketleri, metin yazarlığı, veri analizi, sunumlar, Microsoft, Xmind ve diğer ilgili ürünler gibi metin oluşturma uygulama araçlarını art arda piyasaya sürdüler. zihin haritalama ve diğer yönlerde uygulama örnekleri.

4.3 Üretken yapay zeka sahne uygulaması - görüntü oluşturma

Görüntü oluşturmanın teknik senaryoları, görüntü özniteliği düzenleme, kısmi görüntü oluşturma ve değiştirme ve uçtan uca görüntü oluşturma olarak ayrılır. Bunların arasında, ilk iki iniş senaryosu görüntü düzenleme araçlarıdır ve uçtan uca görüntü oluşturma, yaratıcı görüntü oluşturma ve işlevsel görüntü oluşturma olmak üzere iki ana iniş senaryosuna karşılık gelir.

Şu anda, görüntü düzenleme araçları yaygın olarak kullanılmaktadır ve ilgili ürünler nispeten fazladır; yaratıcı görüntü üretimi çoğunlukla NFT vb. şeklinde sunulur ve işlevsel görüntüler çoğunlukla pazarlama posterleri/arayüzleri, LOGO, model resimleri ve kullanıcı avatarlarıdır .

4.4 Üretken Yapay Zeka Senaryo Uygulaması—Ses Üretimi

Ses üretimi zaten günlük yaşamda yaygındır ve uygulama alanları ayrıca konuşma sentezi ve müzik oluşturma olarak ayrılabilir ve konuşma sentezi, metin oluşturma özel konuşma (TTS) ve konuşma klonlama alanını içerir.

TTS alanının teknik olgunluğu nispeten yüksektir, ancak yine de duygusal ifade eksikliği vardır; ses klonlama, film, animasyon ve diğer endüstriler için büyük önem taşır ve dikkati hak eder; müzik üretimi ayrıca şarkı sözleri, beste ve dahası alt bölümlere ayrılabilir. aranjman, kayıt, miksaj vb. Çoklu yönler, oluşturma süreci esas olarak Transformer modeline dayanır.

4.5 Üretken Yapay Zeka Senaryo Uygulaması—Video Oluşturma

Video üretiminin, gelecekte modlar arası üretim alanında orta ila yüksek potansiyelli bir senaryo olması bekleniyor. Video üretimi temel olarak üç alana karşılık gelir: video özniteliği düzenleme, video otomatik düzenleme ve video parçası oluşturma.

Video özniteliği düzenleme, video oluşturma alanında yaygın olarak kullanılmaktadır ve video düzenleme verimliliğini büyük ölçüde geliştirmektedir; otomatik video düzenleme, esas olarak teknik deneme aşamasındadır; video parçası oluşturma ilkesi ve özü, video kesmeyi vurgulayan görüntü oluşturmaya benzer çerçevelere dönüştürmek ve ardından her kareyi düzenlemek.Görüntü işleme, bu aşamadaki teknoloji, modifikasyonun doğruluğunu ve gerçek zamanlı modifikasyonu geliştirmektir.

4.6 Üretken Yapay Zeka Senaryo Uygulaması—Dijital İnsan

Dijital insanlar, fiziksel olmayan dünyada var olan çoklu insan özelliklerinin (resimler, videolar, canlı yayınlar ve VR gibi) sentezini ifade eder. Dijital insan, metin/ses gibi düşük yoğunluklu modalitelerden görüntü/video/gerçek zamanlı etkileşim gibi daha yüksek bilgi yoğunluklu modalitelere geçişi temsil eder.Gelecekte video ve hatta metaverse, dijital insan için önemli uygulama senaryoları olacaktır.

Üretken yapay zeka alanında, dijital insan üretimi, dijital insan video üretimi ve dijital insan gerçek zamanlı etkileşimi olarak ikiye ayrılabilir. Dijital insan video üretimi şu anda en yaygın kullanılan alanlardan biridir, dijital insan gerçek zamanlı etkileşimi ise çoğunlukla kullanılmaktadır. görsel akıllı müşteri hizmetlerinde ve daha fazlası Gerçek zamanlı etkileşimli özelliklere vurgu.

05 Üretken Yapay Zeka Fırsatları ve Zorlukları

5.1 Üretken yapay zeka çağında, idari işler büyük ölçüde ikame ediliyor ve "müşterilere sormak" yeni bir meslek haline gelmesi bekleniyor

Üretken yapay zekanın istihdam üzerindeki etkisi Zorluklar ve fırsatlar bir arada var olur. Bir yandan üretken yapay zeka, işlerin akıllı bir şekilde güncellenmesini teşvik edecek ve bazı işler değiştirilecek. Goldman Sachs analizine göre, üretken yapay zekanın akıllı otomasyon yetenekleri, iş verimliliğini büyük ölçüde artırabilir ve işletme maliyetlerini azaltabilir. Amerika Birleşik Devletleri ve Avrupa'daki geleneksel işler, yapay zeka otomasyonundan farklı derecelerde etkilenecek ve üretken yapay zeka, işlerin dörtte birinin yerini alabilir. .

Öte yandan, üretken yapay zeka yeni işler de yaratacaktır: "Mühendis", insanların bilgi almak veya eserler yaratmak için yapay zeka ile etkileşimde bulunmak üzere doğal dili kullanmalarına olanak tanır. Ek olarak, yapay zeka ile ilgili alanlar da çok sayıda yeni iş yaratacaktır.

5.2 Üretken yapay zeka çalışmalarının telif hakkı esas olarak yazılım sahipleri ve kullanıcılar arasında dağıtılır

Üretken yapay zekanın özü, makine öğreniminin uygulanmasıdır.Model öğrenme aşamasında, eğitimi gerçekleştirmek için kaçınılmaz olarak çok sayıda veri seti kullanacaktır.Ancak, eğitimden sonra ürünlerin telif hakkı sahipliği konusu hala tartışmalıdır.

Yasal kişiler haklardan yararlanabileceğinden, üretken yapay zeka çalışmalarının telif hakkı yalnızca çalışmanın oluşturulmasına katkıda bulunan kişiler tarafından kullanılabilir. İlgili personel, yazılım geliştiricileri, sahipler ve kullanıcıları içerir (konu kimlikleri örtüşebilir). yazılım telif haklarından tazmin edilir ve üretici yapay zeka çalışmalarının telif hakları esas olarak yazılım sahipleri ve kullanıcılar arasında dağıtılır.

View Original
The content is for reference only, not a solicitation or offer. No investment, tax, or legal advice provided. See Disclaimer for more risks disclosure.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
  • Pin