Anthropic Siapkan Opus 4.7 dan Studio AI Full-Stack—Sambil Menunggu Sesuatu yang Jauh Lebih Menakutkan

Singkatnya

  • Anthropic sedang mempersiapkan Claude Opus 4.7 dan alat desain AI untuk situs web dan presentasi
  • Claude Mythos tetap menjadi model frontier sejati dari Anthropic, dan perusahaan tidak akan merilisnya secara publik.
  • Industri masih belum dapat mengukur peningkatan AI secara andal, sehingga klaim tentang keuntungan Opus 4.7 sulit diverifikasi.

Anthropic bersiap merilis Claude Opus 4.7 bersama alat desain berbasis AI yang memungkinkan pengguna membangun situs web, presentasi, dan halaman arahan dengan prompt bahasa Inggris sederhana—berita ini menyebabkan penurunan saham Adobe, Wix, dan Figma pada hari Senin, menurut The Information. Produk-produk ini bisa dirilis secepat minggu ini, kata seseorang yang mengetahui rencana tersebut kepada The Information. Alat desain ini menargetkan pengembang dan pengguna non-teknis, menempatkannya dalam jalur tabrakan dengan startup seperti Gamma dan Stitch dari Google. Anthropic tidak menanggapi permintaan komentar dari Decrypt.

Opus 4.7 bahkan bukan model paling kuat dari Anthropic. Gelar itu milik Claude Mythos—sebuah makhluk yang fokus pada keamanan siber yang diam-diam diberikan perusahaan kepada perusahaan keamanan tertentu sambil menjaga jarak dari publik.  Institut Keamanan AI Inggris baru-baru ini mengevaluasi Mythos Preview dan menemukan bahwa model ini dapat secara otomatis melaksanakan serangan siber canggih dengan tingkat keberhasilan yang tidak pernah dicapai model lain. Model ini menjadi AI pertama yang menyelesaikan “The Last Ones,” sebuah simulasi serangan jaringan perusahaan yang terdiri dari 32 langkah yang biasanya memakan waktu 20 jam bagi tim merah manusia. Mythos menyelesaikannya dalam tiga dari sepuluh percobaan, dengan rata-rata 22 dari 32 langkah—dibandingkan dengan Opus 4.6 yang hanya 16 langkah. Ini penting di luar keamanan perusahaan. Mengukur apa yang sebenarnya bisa dilakukan AI telah menjadi masalah besar di seluruh industri. OpenAI baru-baru ini menyebut benchmark pengkodean terkemuka “terkontaminasi,” namun model-model tetap dibandingkan menggunakan tes yang sama. Evaluasi ARC-AGI-3 terpisah menunjukkan Gemini mendapatkan skor 0,37% dan GPT-5.4 mencapai 0,26%—sementara manusia mendapatkan 100%. Hasilnya adalah lanskap di mana benchmark diperdebatkan dan tetap digunakan sebagai bukti, sehingga sulit untuk mengkontekstualisasikan klaim tentang keuntungan Opus 4.7 sampai Anthropic merilis kartu model yang rinci.

Hubungan antara Opus dan Mythos lebih dekat dari yang disadari kebanyakan orang. Anthropic membangun model frontier-nya dengan melakukan fine-tuning di atas lini Opus—yang sama dengan backbone yang digunakan untuk produk Claude publik, kemudian diuji ketahanan dan diperkuat menjadi Mythos. Opus 4.7 adalah fondasi yang akhirnya mendapatkan pelatihan kungfu keamanan siber. Selain itu, upaya Anthropic semakin mengarah ke pengembangan/ penggunaan perusahaan. Kebocoran kode Claude, rilis sistem keterampilan dan protokol MCP, fokus pada AI agenik, dan perhatian terhadap benchmark pengkodean semakin memperkuat hal ini. Meskipun Anthropic belum secara resmi mengumumkannya, kebocoran tersebut memperkuat pergeseran yang lebih luas dari penyedia LLM menjadi sesuatu yang menyerupai model “studio AI” lengkap, di mana Claude tidak hanya menghasilkan teks tetapi juga membangun dan mengimplementasikan produk lengkap.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan