omniture

Suara-kepada-Teks Serta Merta: Mengubah Gaya Kerja dengan Kuasa AI

Toshiba Corporation
2020-01-08 10:00 217

SINGAPURA, 8 Januari 2020 /PRNewswire/ -- Tatkala Pengautomatan Proses Robot (RPA) - menggunakan robot untuk mengautomasikan proses kerja - telah memberikan hasil yang hebat dalam mengautomasikan tugasan seperti penciptaan dokumen dan pemasukan data, tugas-tugas tertentu seperti mencatat minit mesyuarat dan mentranskripsi ucapan masih perlu dijalankan secara manual. Ketahui bagaimana AI pengecaman pertuturan Toshiba yang baru dibangunkan membantu menukarkan pertuturan kepada teks dengan ketepatan yang tinggi dan menyumbang kepada peningkatan produktiviti di tempat kerja dan selanjutnya.

Untuk melihat Siaran Berita Multimedia, sila klik:
https://www.prnasia.com/mnr/toshiba_202001.shtml

Taira Ashikawa, Head of Research, Media AI Laboratory, Toshiba Corporate R&D Center
Taira Ashikawa, Head of Research, Media AI Laboratory, Toshiba Corporate R&D Center

 

Hiroshi Fujimura, Lead researcher, Media AI Laboratory, Toshiba Corporate R&D Center
Hiroshi Fujimura, Lead researcher, Media AI Laboratory, Toshiba Corporate R&D Center

 

Photo (automatic speech subtitling system (left) and image of displayed subtitles (right))
Photo (automatic speech subtitling system (left) and image of displayed subtitles (right))

Teknologi di sebalik ketepatan pengecaman pertuturan

Pada tahun 2015, apabila Toshiba mula membangunkan AI, terdapat peningkatan momentum di seluruh dunia dalam bidang kebolehcapaian maklumat yang bertujuan untuk mewujudkan persekitaran untuk membolehkan mereka yang mengalami masalah pendengaran untuk mengakses dan memasukkan maklumat.

Mengambil pandangan daripada kakitangan yang mengalami masalah pendengaran yang ingin menyertai mesyurat dan syarahan pada waktu sebenar, pembangunan AI pengecaman pertuturan Toshiba bermula dengan dua perkara yang diutamakan – untuk meluaskan kebolehcapaian maklumat bagi mereka yang mengalami masalah pendengaran dan meningkatkan produktiviti.

Algoritma membentuk teras AI dan pasukan pembangunan meneroka pelbagai pendekatan untuk meningkatkan ketepatan. AI pengecaman pertuturan Toshiba bukan sahaja mengecam pertuturan dengan ketepatan yang tinggi, tetapi juga mengesan pengisi dan penanda ragu. Dengan menggunakan model yang semakin popular yang dikenali sebagai Memori Jangka Pendek Panjang (LSTM) serta Pengelasan Temporal Ahli Penyambung (CTC), AI diajar tentang keganjilan pertuturan seperti pengisi dan penanda ragu yang eksklusif kepada manusia.

Menggunakan syarahan sebagai peluang untuk ujian pengesahan, AI pengecaman pertuturan telah mencapai purata nisbah pengecaman pertuturan 85%, mengecam kandungan pertuturan melebihi paras tertentu tanpa penyuntingan atau pembelajaran terlebih dahulu. Toshiba akan terus mengusahakan penambahbaikan teknologi ini bagi mencapai penawaran pengecaman pertuturan yang tepat sepenuhnya dengan matlamat untuk mewujudkan persekitaran yang mana penutur bahasa-bahasa berbeza akan berpeluang untuk menikmati perbualan yang lancar antara satu sama lain.

Toshiba juga melihat potensi dalam mengaplikasikan AI pengecaman pertuturan kepada sektor pembuatan, yang mana terdapatnya keperluan untuk pengumpulan dan perakaman suara bebas tangan di kilang-kilang semasa penyelenggaraan dan pemeriksaan. Pada masa depan, Toshiba bermatlamat untuk menggunakan pengetahuan dan kepakaran terkumpulnya tentang kemudahan pengilangan bagi menyepadukan pengecaman pertuturan ke dalam operasi mereka dengan lancar.

Foto - https://photos.prnasia.com/prnh/20191223/2678594-1-a?lang=0
Foto - https://photos.prnasia.com/prnh/20191223/2678594-1-b?lang=0
Foto - https://photos.prnasia.com/prnh/20191223/2678594-1-c?lang=0

Source: Toshiba Corporation
Keywords: Computer Software Computer/Electronics New products/services