Luma Meluncurkan Uni-1, Model Pertama Mereka yang Mengintegrasikan Penalaran dan Pembuatan Gambar

robot
Pembuatan abstrak sedang berlangsung

Secara Singkat

Luma memperkenalkan Uni-1, model pertamanya yang menggabungkan penalaran dan pembuatan gambar dalam satu arsitektur — sebuah perubahan besar dari akar perusahaan yang berfokus pada video.

Luma Rolls Out Uni-1, Its First Model Integrating Reasoning And Image Generation

Startup pembuatan video berbasis AI Luma memperkenalkan Uni-1, model pertamanya yang mengintegrasikan penalaran dan pembuatan gambar dalam satu arsitektur, menandai pergeseran strategis dari fokus sebelumnya pada konten video.

Menurut perusahaan, selama tiga tahun terakhir, pekerjaan Luma berkembang dari rekonstruksi adegan menjadi generasi 3D dan peningkatan difusi video, tetapi media visual saja memiliki keterbatasan tanpa pemahaman terintegrasi. Uni-1 diposisikan sebagai model terpadu pertama perusahaan yang dirancang untuk menggabungkan kemampuan penalaran dan generatif, bertujuan untuk meningkatkan kecerdasan umum multimodal.

Luma menggambarkan kecerdasan umum sebagai kemampuan untuk bernalar, membayangkan, memanipulasi simbol, dan mensimulasikan lingkungan. Sementara sistem AI yang ada dapat melakukan fungsi ini secara terpisah, Uni-1 berusaha menggabungkannya dalam satu kerangka kerja, memodelkan waktu, ruang, dan logika secara bersamaan untuk memungkinkan pemecahan masalah yang tidak dapat dicapai oleh pipeline tradisional yang tersegmentasi.

Model ini dibangun sebagai transformer autoregressive hanya decoder, yang merepresentasikan teks dan gambar dalam satu urutan yang saling berseling, berfungsi sebagai input dan output. Uni-1 mampu melakukan penalaran internal yang terstruktur, memecah instruksi, menyelesaikan kendala, merencanakan komposisi, dan merender gambar sesuai kebutuhan.

Uni-1 menunjukkan kemampuan untuk “berpikir dalam bahasa dan membayangkan serta merender dalam piksel,” sebuah kemampuan yang oleh Luma disebut sebagai “kecerdasan dalam piksel.” Output tambahan, termasuk pembuatan audio dan video, diharapkan akan hadir dalam rilis berikutnya. Model ini tidak hanya sebagai alat tetapi sebagai platform yang mengubah cara bisnis beroperasi dengan mengintegrasikan penalaran langsung ke dalam alur kerja kreatif.

Agen Luma Perluas Kecerdasan Terpadu

Berdasarkan Uni-1, Luma baru-baru ini meluncurkan Agen Luma, rangkaian alat berbasis AI yang dirancang untuk menangani produksi kreatif end-to-end melalui teks, gambar, video, dan audio. Agen-agen ini beroperasi menggunakan keluarga model Kecerdasan Terpadu Luma, yang dilatih pada satu sistem penalaran multimodal. Luma menempatkan agen-agen ini sebagai solusi untuk agensi periklanan, tim pemasaran, studio desain, dan klien perusahaan, menawarkan generasi kreatif yang terkoordinasi di berbagai modality.

Agen Luma kompatibel dengan model AI lain, termasuk Ray 3.14 dari Luma, Veo 3 dan Nano Banana Pro dari Google, Seedream dari ByteDance, dan alat pembuatan suara dari ElevenLabs. Menurut Amit Jain, CEO dan salah satu pendiri Luma, agen-agen ini memanfaatkan arsitektur terintegrasi Uni-1, yang telah dilatih di berbagai bidang seperti audio, video, gambar, bahasa, dan penalaran spasial, memungkinkan mereka merencanakan, mengeksekusi, dan menghasilkan konten dalam alur kerja yang terkoordinasi dan cerdas.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan