歷史回廊敬天重德修煉文化世界回眸再現輝煌
道德升華緣歸大法病祛身輕佛光普照今日神話
史前文化生命探索浩瀚時空中外預言科學新見
迫害真相矢志不渝揭惡揚善曝光邪惡慈悲為懷
人生百態 社會亂象紅朝謊言華夏浩劫
善有善報惡有惡報天怒人怨因緣啟示
深思明鑒心明眼亮信仰漫談雜談隨筆
上善若水省思感悟寓言啟示詩文樂畫
國際聲援天地正氣良知永存緊急救援
主頁 > 宇宙奧秘

蠻幹的科學

打印機版 | 【投稿/反饋】

覺得科學有一種蠻幹的精神,就好像幾個世紀前一位學者說:“只要給我一根棍子和一個支點,我就可以撐起地球。”科學家好像只要發現了一點什麼或是找到了一個工具,就可以拚了命的往下鉆,往下做。

我的實驗室是在做語音訊號處理的研究,主要是語音辨識。語音辨識簡單地說就是要讓機器(或電腦)聽得懂人講的話。

語音辨識的過程是這樣的:首先把人講話的聲音訊號取樣,做傅利葉轉換,經過一個精心設計的濾波器之後,取得一組特徵參數,然後把這組特徵參數與資料庫中已存有的大量的人的聲音資料做對比,因為資料庫中的聲音訊號是已知發什麼音的,所以對比出來最接近的那個聲音就是要辨識的答案了。

聲音取樣的過程就是把事情極度復雜化的過程,也可以說是錯誤的開始。以取樣頻率48kHz來算,5秒鐘的聲音就會被取樣成240,000個數字,這麼多的數字當然也只有電腦看得懂了。把聲音變成了人無法掌握的形式之後,再想出各種方法去處理它。如去除背景雜音、語者辨識、建立人的聲道模型等,即使如此到最後還得算機率,即這段聲音是哪個答案的可能性最大,這個音不太可能是哪個音。算完之後發現結果還不行,再套上語言模型,終於把辨識率拉到可以接受的程度。最後辨識的結果是,你講的是這個音,可能是這個字。如果在限定領域的條件下做語音辨識的話,正確率大概在70%到90%之間。什麼是限定領域?就是你講話的內容只能限定在某個範圍(如體育)之內,超出這個範圍(如你聊到了政治)辨識成功率就直落了。

別說這是愚公移山,這應該用“蠻幹”兩個字來形容才對。要達成這個目的怎麼會用這麼笨的方法?因為這是科學所能提供的最“聰明”的方法了。科學既提供不了更好的辦法,科學家們就只好用笨方法,蠻幹下去了。

狗兒不用訓練都知道主人的喜怒哀樂,植物有他心通功能,人怎麼會想到反過來要電晶體來聽懂人講的話?