?
This document uses PHP Chinese website manual Release
概述
SpeechRecognition對象
事件
參考鏈接
這個API用于瀏覽器接收語音輸入。
它最早是由Google提出的,目的是讓用戶直接進行語音搜索,即對著麥克風說出你所要搜索的詞,搜索結果就自動出現(xiàn)。Google首先部署的是input元素的speech屬性(加上瀏覽器前綴x-webkit)。
<input id="query" type="search" class="k-input k-textbox" x-webkit-speech speech />
加上這個屬性以后,輸入框的右端會出現(xiàn)了一個麥克風標志,點擊該標志,就會跳出語音輸入窗口。
由于這個操作過于簡單,Google又在它的基礎上提出了Web Speech API,使得JavaScript可以操作語音輸入。
目前,只有Chrome瀏覽器支持該API。
這個API部署在SpeechRecognition對象之上。
var SpeechRecognition = window.SpeechRecognition || window.webkitSpeechRecognition || window.mozSpeechRecognition || window.oSpeechRecognition || window.msSpeechRecognition;
為了將來的兼容性考慮,上面的代碼列出了所有瀏覽器的前綴。但是實際上,目前只有window.webkitSpeechRecognition是可用的。
確定瀏覽器支持以后,新建一個SpeechRecognition的實例對象。
if (SpeechRecognition) { var recognition = new SpeechRecognition(); recognition.maxAlternatives = 5; }
maxAlternatives屬性等于5,表示最多返回5個語音匹配結果。
目前,該API部署了11個事件。下面對其中的3個定義回調(diào)函數(shù)(假定speak是語音輸入框)。
var speak = $('#speak'); recognition.onaudiostart = function() { speak.val("Speak now..."); }; recognition.onnomatch = function() { speak.val("Try again please..."); }; recognition.onerror = function() { speak.val("Error. Try Again..."); };
首先,瀏覽器會詢問用戶是否許可瀏覽器獲取麥克風數(shù)據(jù)。如果用戶許可,就會觸發(fā)audiostart事件,準備接收語音輸入。如果找不到與語音匹配的值,就會觸發(fā)nomatch事件;如果發(fā)生錯誤,則會觸發(fā)error事件。
如果得到與語音匹配的值,則會觸發(fā)result事件。
recognition.onresult = function(event) { if (event.results.length > 0) { var results = event.results[0], topResult = results[0]; if (topResult.confidence > 0.5) { speechSearch(results, topResult); } else { speak.val("Try again please..."); } } };
result事件回調(diào)函數(shù)的參數(shù),是一個SpeechRecognitionEvent對象。它的results屬性就是語音匹配的結果,是一個數(shù)組,按照匹配度排序,最匹配的結果排在第一位。該數(shù)組的每一個成員是SpeechRecognitionResult對象,該對象的transcript屬性是實際匹配的文本,confidence屬性是可信度(在0與1之間)。
Brandon Satrom, Using voice to drive the web: Introduction to the Web Speech API