OpenAI meluncurkan ChatGPT dan Whisper Application Programming Interface atau layanan API. Layanan ini memungkinkan setiap pengembang aplikasi untuk menggunakan ChatGPT dan Whisper.
Whisper adalah sistem pengenalan suara otomatis. OpenAI mengatakan sistem dapat dipercaya untuk mengubah suara menjadi teks dalam berbagai bahasa, termasuk menerjemahkannya ke dalam bahasa Inggris.
Whisper dapat mengonversi audio dalam berbagai format, termasuk M4A, MP3, MP4, MPEG, MPGA, WAV, dan WEBM menjadi teks.
Pengembang ChatGPT OpenAI juga mengenakan biaya US$ 0,006 per menit untuk voice to text di Whisper.
Selain Whisper, raksasa teknologi seperti Google, Amazon, dan Meta telah menciptakan sistem yang mengenali suara dan mengubahnya menjadi teks.
Presiden dan CEO OpenAI Greg Brockman mengutip survei Statista tahun 2000 tentang hambatan yang dialami pengguna saat menggunakan sistem pengenalan ucapan yang ada, termasuk:
Pengakuan aksen Kos atau akurasi dialek
Whisper API berbeda karena dilatih pada 680 ribu jam data multibahasa dan ‘multitask’ yang dikumpulkan dari web,” ujarnya seperti dikutip dari TechCrunch, Rabu (1/3).
Hasil pelatihan memungkinkan Whisper API untuk mengenali suara dengan aksen yang unik. Selain itu, ini berkaitan dengan suara di balik suara dan mengenali jargon khusus yang digunakan oleh orang-orang di setiap negara atau wilayah.
“The Whisper API adalah model besar yang sama yang bisa Anda dapatkan dari open source, tetapi kami telah mengoptimalkannya secara ekstrem. Lebih cepat dan sangat nyaman,” kata Brockman.
Tapi pengembang Obrolan GPT Namun, Whisper memiliki keterbatasan, terutama dalam hal prediksi ‘kata selanjutnya’. Ini karena sistem dilatih pada sejumlah besar data berisik.
Pengembang ChatGPT juga memperingatkan bahwa Whisper mungkin menyertakan kata-kata dalam transkripsi yang sebenarnya tidak diucapkan. Ini karena AI di balik Whisper mencoba memprediksi kata berikutnya dalam audio.
Tetapi pengembang ChatGPT mengoptimalkan pengembangan Whisper. Selain itu, itu “menyempurnakan persyaratan layanan Whisper API,” kata OpenAI di situs resminya.
Jika batasan ini diatasi dan OpenAI memasuki pasar ucapan-ke-teks, ini akan menguntungkan Microsoft. Raksasa teknologi ini telah mendukung pengembang ChatGPT sejak 2019.
Sementara itu, pasar speech-to-text diperkirakan bernilai US$ 5,4 miliar pada 2026, naik dari US$ 2,2 miliar pada 2021.
Selain Whisper, ChatGPT kini dapat digunakan di semua aplikasi yang bekerja dengan OpenAI.
(REVISI: Terjadi perubahan judul, deskripsi dan paragraf pertama pada pukul 12.49 WIB)