JAKARTA – Perkembangan teknologi pembelajaran mesin yang canggih telah memperluas kemampuan kecerdasan buatan. Model AI terbaru Microsoft, misalnya, dapat menganimasikan gambar statis manusia.
Microsoft telah meluncurkan model AI yang dapat menganimasikan foto dengan suara. Ini merupakan inovasi yang luar biasa, namun mempunyai potensi bahaya.
Essanews memberitakan pada Rabu (24/4/2024) bahwa model yang dikenal dengan nama Microsoft VASA-1 ini mampu membuat gambar ucapan, menganimasikan potret manusia hingga melakukan sinkronisasi dengan rekaman suara. Teknologi ini secara mengesankan mengubah foto biasa menjadi animasi realistis dari orang-orang yang berbicara atau bernyanyi.
Buatlah gambarnya bergerak
Microsoft bereksperimen dengan potret yang dibuat dan tidak ada yang dibuat dengan StyleGAN2 dan DALL-E 3. Fitur ini bekerja secara efektif pada foto realistis orang dan avatar kartun, bahkan dengan eksperimen dengan animasi Mona Lisa yang terkenal.
Model VASA-1 tidak hanya menyinkronkan gerakan bibir, tetapi juga menangkap semua ekspresi wajah dan gerakan alami kepala yang membuat animasi lebih realistis.
Model tersebut mendukung pembuatan animasi dalam resolusi 512 x 512 piksel dengan kecepatan 45 frame per detik dalam mode offline. Ia juga dapat menghasilkan perekaman real-time hingga 40 frame per detik dengan latensi minimum hanya 170ms pada komputer desktop yang dilengkapi kartu grafis NVIDIA GeForce RTX 4090.
Potensi ancaman AI
Dalam hal ini, Microsoft fokus pada produksi animasi untuk potret virtual. Namun, mereka menyadari potensi penyalahgunaan teknologi ini untuk kejahatan seperti phishing.
Microsoft secara terbuka menyatakan bahwa mereka menentang penggunaan model VASA-1 untuk tujuan menyesatkan atau pembuatan konten berbahaya dengan gambar orang sungguhan. Akibatnya, perusahaan memutuskan untuk tidak merilis versi demo, API, atau produk lengkapnya ke publik. Microsoft terus menggunakan teknologi ini untuk meningkatkan deteksi penipuan.
MG/Maulana Kusumadewa Iskandar