Kamis, 01 Mei 2014

Basic Speech Recognition Chalenges



nah, tantangan dalam pengembangan speech recognition jika menurut openCourse MIT ada 4 yakni sebagai berikut :

Co-articulation
artikulasi yakni istilah yang menekankan kepada jelas tidaknya suatu pengucapan kata. saya sendiri belum mencoba untuk meneliti mengenai artikulasi, baru sebatas mengenal perbedaan mendasarnya saja.
artikulasi sangatlah penting. bisa diibaratkan ketika kita baru mengenal seseorang dengan gaya bicara yang berbeda dengan yang pernah kita dengar. kita perlu menyesuaikan dengan gaya bicara seseorang. bisa saja si A mengatakan "itu", namu kita menangkapnya berupa "inu". sedikit bisa menjadi JOKES :D

sistem pengenalan ucapan harus bisa memahami ucapan yang kurang jelas atau bahkan sangat jelas.

Speaker Independence
rebuild...

Spontaneous Speech
ucapan-ucapan spontan termasuk jarang diteliti, sekali lagi ranah ucapan bahasa indonesia sangatlah luas bahkan banyak ucapan-ucapan spontan yang sering kita dengar terasa mustahil untuk dikenali.
ucapan seseorang yang sedang sakit pasti lebih tidak jelas dibanding seseorang dalam keadaan sehat. kemudian sistem dituntut untuk mengenali kata-kata yang bukan kata <out of vocabulary words>

Language Modelling
atau lebih tepatnya adalah dialek. dimisalkan kita membangun sistem untuk mengenal bahasa jawa, sudah ketahuan bahwa versi bahasa jawa sangat beragam yang dipengaruhi faktor seperti daerah dan tempat tinggal.

Noise Robustness
noise atau ganguan di ucapan adalah derau atau sinyal suara yang mengganggu saat ucapan berlangsung. misalkan kita sedang berbicara ketika hujan akan lebih tidak jelas dibanding kita berbicara didalam ruangan tertutup. artinya tantangan untuk menghilangkan derau dan ganguan tersebut dari pengenalan ucapan juga menjadi salah satu tantangan dalam pengembangan ASR.

Selasa, 01 April 2014

Intro Automatic Speech Recognition

Penelitian dan pengembangan di bidang pengenalan ucapan memang tergolong minim di wilayah Indonesia. jurnal dan paper penelitian justru lebih banyak ke arah pengaplikasian atau implementasi dari metode dan algoritma yang sudah ada.



Mengenal dasar dari speech recognition sendiri dapat digolongan dari siklus sebagai berikut :
  1. Mengenal bagaimana komunikasi antara human dengan komputer dari era text menuju speech
  2. speech to text : pengenalan ucapan ke text (input)
  3. text to meaning : pemahaman text 
  4. meaning to text : penjabaran text dalam bentuk umum
  5. text to speech : sintesis text ke ucapan (output)

 kelebihan dari "spoken language"
  • natural     : tidak membutuhkan latihan yang khusus
  • fleksibel   : memudahkan tangan dan mata
  • efisien      : punya data rate yang tinggi
  • ekonomis : dapat di transmisikan/diterima dengan murah
interface berupa ucapan sangat ideal untuk mengakses dan memanajemen informasi ketika informasi tersebut kompleks, informasi baru, atau hanya telepon yang aktif.

nah, ASR sendiri merupakan sebuah sistem untuk mengkonversi sinyal ucapan menjadi kata. dimana hasil pengenalan kata tersebut dapat digunakan pada sistem lain seperti natural language processing.

beberapa contoh penerapan aplikasi berbasis speech interface :
  • simple command and control : contoh simpelnya adalah layanan speech recognition di windows 7.
  • simple data entry : memungkinkan kita bisa menginputkan data hanya dengan ucapan (seperti kita memerintah), hanya saja input menjadi masukan untuk sebuah data.
  • dictation : kamus kalau dalam bahasa indonesia. nah lebih enak jika kita pakai aplikasi dragon translator.
  • transactional processing : sudah terbayang pastinya, era jual beli hanya dengan ucapan menggunakan sistem berawal dari speech interface pula
  • Intellegence agents : nah kalau yang ini, lebih kepada pengembangan kecerdasan buatan, menyesuaikan kebutuhan dari agents yang dibuat, misalnya untuk controlling sebuah mesin pada pabrik.

Sabtu, 01 Maret 2014

Speech Recognition [Pengenalan Ucapan]

Sinyal suara


persoalan yang ditangani oleh kecedasan buatan semakin lama semakin berkembang yang mengakibatkan kecerdasan buatan merambah menjadi berbagai cabang ilmu baru. Penyebabnya yakni karakteristik cedas sudah mulai dibutuhkan diberbagai disiplin ilmu dan teknologi.
salah satu cabang kecerdasan buatan adalah Pengenalan ucapan (speech recognition).

pengenalan ucapan merupakan suatu pengembangan teknik dan sistem yang memungkinkan komputer untuk menerima masukan berupa kata yang diucapkan.

sebagai contoh :
1. telepon untuk penderita bisu tuli.
orang yang bisu tuli cukup mengetik kalimat yang dimaksud ke dalam sistem speech recognition, kemudian ia akan merubahnya menjadi suara yang akan ditangkap oleh sang ibu penderita bisu tuli.
sebaliknya, ibu dapat berbincang dengan sang anak dengan suara yang diolah oleh sistem menjadi text yang akan dibaca oleh penderita bisu tuli.

2. alat untuk tuna wicara.
penderita tuna wicara menginputkan bahasa isyarat berupa input citra yang diolah oleh sistem menjadi suara yang dapat didengarkan oleh lawan bicara.
sebaliknya, lawan bicara cukup mengutarakan maksud melalui kalimat yang akan diolah oleh sistem menjadi output citra yang dapat dipahami oleh sang tuna wicara.

bidang kecerdasan buatan tersebut saat ini masih terbuka lebar untuk pengembangan lebih lanjut untuk kemajuan ilmu dan teknologi yang bermanfaat bagi umat manusia.


Sumur :
Sutojo, T., et al. 2011. Kecerdasan Buatan. Yogyakarta : ANDI yogyakarta dengan UDINUS Semarang

ASR Indonesia On Facebook