Perisalah, Pengubah Suara Menjadi Teks Buatan BPPT
Tim peneliti Badan Pengkajian dan Penerapan Teknologi (BPPT) berhasil membuat piranti lunak pengenal wicara berbahasa Indonesia. Dengan Perisalah, sebutan piranti lunak itu, setiap kata yang diucapkan peserta rapat secara otomatis akan disalin menjadi tulisan dalam sekejap, runut sesuai dengan waktu bicara dari jam hingga detik. Dengan demikian, waktu, tenaga, dan biaya dokumentasi rapat bisa dipangkas.
"Dengan perangkat ini, akan mudah diketahui siapa yang berbicara, tanpa harus menyalin lagi," kata Oscar Riandi, Open Source Resource Center Manager BPPT, sekaligus ketua tim riset Perisalah.
Meski perancangnya mengatakan bahwa piranti ini masih jauh dari sempurna, demo Perisalah dalam Konferensi Global Open Source di Jakarta, akhir Oktober lalu, mengundang decak kagum ratusan pengunjung.
Dengan komputer jinjing yang sudah dilengkapi piranti lunak Perisalah dan bantuan mikrofon, semua ucapan Oscar langsung diubah menjadi naskah dalam sebuah dokumen Open Office. Ia juga menunjukkan penggunaan Perisalah dalam rapat. Ucapan tiap pembicara disalin dalam slot tersendiri sehingga rapi dan siap dicetak.
"Cepat dan praktis. Mempermudah notulensi," kata Rani, sekretaris direksi perusahaan tambang nasional, yang ikut menyaksikan demo itu.
Perisalah mempunyai fitur penyuntingan, sehingga notulis yang berada di ruang kendali dapat melakukan penyuntingan on the fly, bersamaan ketika rapat berlangsung, tanpa mengganggu penyalinan yang dilakukan sistem di komputer. Kesalahan penyalinan dapat terjadi karena imla pembicara tidak jelas, gangguan suara lain, atau seperti saat ini karena model yang ada pada bank data suara masih sedikit.
Oskar mengatakan, dengan fitur ini, koreksi penyalinan yang salah dapat diperbaiki oleh pencatat notula selama rapat berlangsung. "Draf risalah rapat dapat diselesaikan tidak lama setelah rapat selesai," katanya.
Selain menghasilkan risalah rapat, piranti lunak ini mampu menghasilkan ikhtisar atau resume hasil rapat. Oskar menjelaskan, resume dibuat menggunakan SIDoBI (Sistem Ikhtisar Dokumen untuk Bahasa Indonesia) yang juga dikembangkan BPPT.
Perisalah tidak hanya dapat menghasilkan risalah rapat dalam versi lengkap tetapi juga dapat mengeluarkan risalah dalam bentuk resume rapat. Resume rapat dapat berupa dokumen dengan jumlah kalimat absolut, misalnya sepuluh atau seratus kalimat. Bisa pula dalam bentuk persentase dari risalah utuh, misalnya sepuluh persen, seperempat, atau separuh risalah.
Oskar mengatakan pembuatan Perisalah dimulai pada akhir 2008. Piranti ini merupakan pengembangan LiSan (Linux dengan Lisan) yang dikembangkan Pusat Teknologi dan Informasi dan Komunikasi BPPT sejak dua tahun lalu. LiSan merupakan pengembangan IGOS Linux Voice Command dengan memanfaatkan Free/Open Source Software (FOSS). LiSan berjalan dengan sistem operasi Linux yang memiliki jendela pengatur berbasis Gnome. "LiSan merupakan perangkat lunak pengenal wicara (speech recognition) berbahasa Indonesia pertama yang digunakan untuk mengoperasikan komputer dan penulisan dokumen," ujarnya.
Penggunaan suara sebagai man-machine interface merupakan terobosan dalam peningkatan aksesibilitas komputer. Prinsip interaksi dengan komputer melalui keyboard dan tetikus digantikan interaksi melalui suara yang diterima mikrofon yang selanjutnya dikonversi menjadi bentuk yang dikenali komputer untuk menjalankan perintah ataupun menulis dokumen. Dengan piranti ini, kesenjangan digital antara manusia normal dan yang memiliki keterbatasan fisik bisa dikurangi. "Bagi pengguna normal, LiSan membuat penulisan dokumen lebih cepat dan memberikan peluang pengoperasian komputer hands freely," kata Oskar.
Khusus untuk penyandang keterbatasan fisik, teknologi pengubah suara menjadi naskah dan sebaliknya telah dikembangkan untuk membantu mereka berkomunikasi menggunakan telepon. Divisi Riset dan Teknologi Informasi Telkom yang mengembangkan piranti lunak itu lima tahun lalu. Dengan piranti ini, ucapan lawan bicara akan diubah menjadi teks yang dibalas dengan tulisan oleh penelepon tunarungu. Demikian pula sebaliknya, tulisan yang dibuat penyandang tunarungu diubah menjadi suara. Tapi kian mudahnya layanan pesan singkat dan surat elektronik membuat perangkat itu tak banyak berkembang.
LiSan dapat dioperasikan dalam tiga ragam, yaitu diam, perintah, dan tulis. Ragam diam digunakan ketika pengguna tidak ingin suaranya diproses oleh LiSan menjadi perintah atau penulisan dokumen. Ragam perintah digunakan saat mengoperasikan komputer, seperti menjalankan program dan membuka dokumen atau sebaliknya. Ragam tulis digunakan pada saat penulisan dokumen. Ragam yang terakhir ini sangat membantu mereka yang pekerjaannya berhubungan dengan tulis-menulis dan dikejar tenggat, seperti sekretaris dan wartawan. Mereka tinggal mendiktekan kalimat, tulisan pun langsung jadi.
Piranti lunak ini memang belum sempurna. Kesalahan penyalinan dari ucapan menjadi naskah kerap terjadi sehingga peran penyunting menjadi sangat penting. Oskar mengatakan, kendala utama adalah kurangnya model suara yang tersimpan pada sistem. Ketika dipertunjukkan pada akhir bulan lalu, sistem Perisalah ini hanya menyimpan lima suara laki-laki dan lima perempuan dengan masing-masing mengucapkan 45 ribu kata. "Idealnya 500 laki-laki dan 500 perempuan," katanya. Model suara harus terus ditambah sebelum piranti ini diluncurkan enam bulan lagi. (tmp/bpt/sam)
Baca juga...
- Ogah Blokir Pornografi, Blackberry Akan Ditutup
- Pekerja di Jepang Kecanduan Twitter
- Manusia Purba Doyan Pesta?
- Nyamuk Ternyata Selektif Memilih Korban
- Tidak Benar, Mars Terlihat Sebesar Bulan
- Gmail Kini Bisa untuk Telepon
- Bakteri dari Jurang Bertahan Hidup di Ruang Angkasa
- SBY Promo Album di Situs Kepresidenan
- Google 'Rayakan' HUT RI ke-65
- Jelang HUT RI ke-65 Puluhan Situs Diserang
-
3 hari 23 jam yang lalu
-
6 hari 11 jam yang lalu
-
1 minggu 10 jam yang lalu
-
1 minggu 2 hari yang lalu
-
1 minggu 3 hari yang lalu
-
2 minggu 8 jam yang lalu
-
2 minggu 2 hari yang lalu
-
2 minggu 4 hari yang lalu
-
2 minggu 5 hari yang lalu
-
2 minggu 5 hari yang lalu

Komentar
Kirim komentar