Dalam video itu, sekelompok orang berteriak di sebuah festival musik musim panas yang dipadatkan. Saat beat mulai diputar melalui speaker, sang penampil akhirnya berjalan ke atas panggung: itulah Joker. Berpakaian dengan setelan merahnya, rambut hijau, dan lukisan wajah khasnya, Joker mengangkat tangannya dan menari melintasi panggung, meloncat ke bawah landasan untuk mendekati lautan penggemarnya. Saat saatnya untuk mulai membawakan rap, Joker melenturkan lututnya dan mendorong dirinya dari tanah, melompat naik turun sebelum melakukan putaran 360 derajat pada satu kakinya. Terlihat mudah, namun jika Anda mencoba manuver itu, Anda akan jatuh terduduk. Joker belum pernah sekeren ini.
Kemudian ada video lain, di mana NBA All-Star Joel Embiid melangkah keluar dari belakang panggung untuk menyapa kerumunan sebelum meniru gerakan tarian yang sama. Kemudian, bintang "Curb Your Enthusiasm" Larry David. Namun, dalam setiap adegan ini, ada sedikit yang tidak beres - baik itu Joker, Joel Embiid, atau Larry David, tubuh para penampil goyah, sementara ekspresi wajah mereka tidak pernah berubah.
Tentu saja, semua ini dibuat oleh AI, berkat perusahaan bernama Viggle.
Video asli menunjukkan rapper Lil Yachty naik ke panggung di Summer Smash Festival pada tahun 2021 - menurut judul video YouTube dengan lebih dari 6,5 juta penonton, kedatangan ini adalah "pembukaan PALING SULIT yang PERNAH ADA." Ini berubah menjadi format meme yang sedang tren pada bulan April, saat orang menyisipkan selebriti favorit mereka - atau penjahat favorit mereka, seperti Sam Bankman-Fried - ke dalam video Lil Yachty naik ke panggung.
Penawaran AI teks-ke-video semakin menakutkan, tetapi Anda tidak bisa mengetik "sam bankman-fried sebagai lil yachty di summer smash 2021" dan mengharapkan Sora untuk tahu persis apa yang Anda maksud. Viggle bekerja dengan cara yang berbeda.
Di server Discord Viggle, pengguna mengunggah video seseorang melakukan gerakan tertentu - seringkali tarian TikTok - dan foto seseorang. Kemudian, Viggle membuat video orang itu meniru gerakan dari video tersebut. Jelas bahwa video-video ini bukanlah nyata, meskipun tetap menghibur. Tetapi setelah meme Lil Yachty menjadi viral, Viggle mendadak populer, dan kehebohan itu belum mereda.
“Kami berfokus pada membangun apa yang kami sebut model generasi video yang dapat dikendalikan,” kata pendiri Viggle, Hang Chu, kepada TechCrunch. “Ketika kami menghasilkan konten, kami ingin mengendalikan dengan tepat bagaimana karakter bergerak, atau bagaimana pemandangan terlihat. Namun, alat-alat saat ini hanya fokus pada sisi teks-ke-video, di mana teks itu sendiri tidak cukup untuk menentukan semua subtlety visual.”
Menurut Chu, Viggle memiliki dua jenis pengguna utama - sementara beberapa orang membuat meme, yang lain menggunakan produk tersebut sebagai alat dalam proses produksi untuk desain game dan VFX.
“Sebagai contoh, sebuah tim insinyur animasi bisa mengambil beberapa desain konsep dan dengan cepat mengubahnya menjadi aset animasi kasar, tetapi cepat,” kata Chu. “Tujuannya adalah untuk melihat bagaimana mereka terlihat dan terasa dalam sketsa kasar dari rencana akhir. Biasanya mereka harus menghabiskan hari, atau bahkan minggu, untuk melakukan pengaturan manual, tetapi dengan Viggle, ini bisa dilakukan dengan cepat dan otomatis. Ini menghemat banyak pekerjaan modeling yang membosankan dan berulang.”
Pada bulan Maret, Discord Viggle memiliki beberapa ribu anggota. Pada pertengahan Mei, anggotanya mencapai 1,8 juta, dan dengan Juni tinggal beberapa hari lagi, server Viggle telah mencapai lebih dari 3 juta anggota. Hal ini membuatnya lebih besar dari server untuk game seperti Valorant dan Genshin Impact digabungkan.
Pertumbuhan Viggle tidak menunjukkan tanda-tanda melambat, kecuali permintaan tinggi untuk generasi video telah membuat waktu tunggu terlalu lama bagi pengguna yang tidak sabar. Tetapi karena Viggle sangat berfokus pada Discord, tim pengembang Discord telah bekerja langsung dengan Viggle untuk membimbing startup dua tahunan tersebut melalui pertumbuhan cepatnya.
Syukurlah bagi Viggle, Discord telah mengalami hal ini sebelumnya. MidJourney, yang juga beroperasi di Discord, memiliki 20,3 juta anggota di server mereka, menjadikannya komunitas tunggal terbesar di platform itu. Secara keseluruhan, Discord memiliki sekitar 200 juta pengguna bulanan.
“Tidak seorang pun siap untuk jenis pertumbuhan itu, jadi dalam tahap virality itu, kami mulai bekerja dengan mereka, karena mereka belum siap,” kata Ben Shanken, VP Produk Discord kepada TechCrunch. “Kami harus siap, karena sebagian besar pesan yang dikirim saat ini adalah tentang Viggle dan MidJourney, dan sebagian besar konsumsi dan penggunaan di Discord sebenarnya adalah generative AI.”
Bagi startup seperti Viggle dan MidJourney, membangun aplikasi mereka di Discord berarti bahwa mereka tidak perlu membangun platform penuh untuk pengguna mereka - sebaliknya, mereka dijadwalkan di platform yang sudah memiliki audiens berpengetahuan teknologi, serta alat moderasi konten bawaan. Bagi Viggle, yang hanya memiliki lima belas karyawan, dukungan dari Discord sangat penting.
“Kami dapat fokus pada membangun model sebagai layanan backend, sementara Discord dapat memanfaatkan infrastruktur mereka di depan, dan pada dasarnya kami dapat melakukan iterasi lebih cepat,” kata Chu.
Sebelum Viggle, Chu adalah seorang peneliti AI di Autodesk, raksasa alat 3D. Dia juga melakukan penelitian untuk perusahaan seperti Facebook, Nvidia, dan Google.
Bagi Discord, bertindak sebagai perusahaan SaaS yang tidak disengaja untuk startup AI bisa berarti biaya. Di satu sisi, aplikasi-aplikasi ini membawa audiens baru ke Discord, dan kemungkinan baik untuk metrik pengguna. Tetapi menyelenggarakan begitu banyak video dapat sulit dan mahal di sisi teknis, terutama ketika pengguna lain di seluruh platform sedang menyiarkan permainan video langsung, melakukan video chatting, dan panggilan suara. Tanpa platform seperti Discord, namun, startup-startup ini mungkin tidak dapat berkembang dengan laju yang sama.
“Tidak mudah bagi jenis perusahaan apa pun untuk berkembang, tetapi Discord dibangun untuk jenis skala tersebut, dan kami dapat membantu mereka menyerap itu dengan cukup baik,” kata Shanken.
Meskipun perusahaan-perusahaan ini dapat mengadopsi pedoman konten sendiri Discord dan menggunakan aplikasi moderasi kontennya, akan selalu menjadi tantangan untuk memastikan bahwa 3 juta orang tersebut berperilaku. Bahkan meme-meme Lil Yachty yang keluar pada saat berjalan, secara teknis melanggar aturan Viggle, yang mendorong pengguna untuk menghindari menghasilkan gambar orang nyata - termasuk selebriti - tanpa ijin mereka.
Untuk saat ini, keselamatan Viggle mungkin adalah bahwa outputnya belum sepenuhnya realistis. Teknologinya benar-benar mengesankan, namun kita tahu yang sebenarnya. Animasi Joker yang janky itu pasti tidak nyata, tetapi memang lucu.