Makin Ngeri, OpenAI Bisa Kloning Suara Manusia Cuma dari Sampel Audio 15 Detik

Read Time:2 Minute, 13 Second

harfam.co.id, Jakarta – OpenAI mengumumkan telah melakukan pratinjau skala kecil terhadap alat baru bernama Voice Engine, sebuah teknologi kloning suara yang dapat meniru pembicara (manusia) mana pun dengan menganalisis sampel audio berdurasi 15 detik.

Perusahaan AI Chatbit, ChatGPT, mengatakan mereka menciptakan ‘ucapan yang terdengar alami’ dengan ‘suara emosional dan realistis’.

Mengutip Engadget, Minggu (31/3/2024), teknologi tersebut didasarkan pada API text-to-speech OpenAI yang sudah ada dan telah digunakan sejak tahun 2022.

OpenAI menggunakan versi perangkat untuk mendukung suara preset yang tersedia di API text-to-speech saat ini dan fungsi baca dengan lantang.

Di blog resmi perusahaan, terdapat banyak contoh kloning suara manusia dan suaranya sangat mirip dengan aslinya. Jika Anda penasaran, cobalah menyimaknya dan bayangkan berbagai kemungkinan yang bisa terjadi, baik atau buruk.

OpenAI mengatakan mereka melihat teknologi ini berguna untuk alat bantu membaca, terjemahan bahasa, dan membantu mereka yang mengalami masalah bicara mendadak atau degeneratif.

Perusahaan telah memulai program percontohan Brown University untuk membantu pasien dengan gangguan bicara dengan membuat klon Mesin Suara yang diambil dari rekaman audio untuk proyek sekolah.

Terlepas dari potensi manfaatnya, para penjahat mau tidak mau menyalahgunakan teknologi ini untuk tindakan jahat, dan hal ini sudah menjadi masalah.

Oleh karena itu, Voice Engine belum siap untuk ditayangkan perdana, karena ada masalah privasi serius yang perlu diatasi sebelum peluncuran penuh.

OpenAI mengakui bahwa teknologi ini menimbulkan risiko serius, yang menjadi perhatian khusus pada tahun pemilu.

Perusahaan mengatakan akan mempertimbangkan masukan dari “mitra AS dan internasional dari seluruh pemerintahan, media, hiburan, pendidikan, masyarakat sipil, dan lainnya” untuk memastikan peluncuran produk dengan risiko minimal.

Semua penguji pratinjau menyetujui kebijakan penggunaan OpenAI, yang melarang peniruan identitas orang lain tanpa izin atau hak hukum.

Selain itu, siapa pun yang menggunakan teknologi ini harus mengungkapkan kepada audiensnya bahwa audio tersebut dihasilkan oleh kecerdasan buatan.

OpenAI menggunakan langkah-langkah keamanan seperti watermarking untuk melacak asal audio apa pun dan “memantau secara proaktif” penggunaan sistem.

Saat produk resmi diluncurkan, akan ada “daftar larangan suara” yang akan mendeteksi dan memblokir speaker buatan AI yang terdengar terlalu mirip dengan orang terkenal.

OpenAI masih bungkam mengenai kapan peluncuran tersebut akan dilakukan. TechCrunch telah menemukan beberapa data harga potensial dan tampaknya dapat melemahkan pesaing seperti ElevenLabs.

Mesin suara dapat berharga $15 per juta karakter, yaitu sekitar 162.500 kata.

Ini tentu terdengar seperti cara yang ramah anggaran untuk menyelesaikan buku audio. Materi pemasaran juga mengacu pada versi “HD” yang harganya dua kali lipat, namun perusahaan belum merinci cara kerjanya.

OpenAI membuat kemajuan besar minggu ini. Mereka baru saja mengumumkan kemitraan lain dengan teman baiknya Microsoft untuk membangun superkomputer berbasis AI yang disebut “Stargate.”

Menurut informasi yang dilansir oleh informasi tersebut, proyek ini diperkirakan menelan biaya 100 miliar USD.