語音識(shí)別:您的智能手機(jī)變得更智能
當(dāng)我們還是孩子的時(shí)候,我和我的朋友們經(jīng)常玩一個(gè)游戲,我們?cè)谟螒蛑谢孟肽男┬请H迷航技術(shù)最有可能是我們生活中的現(xiàn)實(shí)世界發(fā)明。輸送機(jī)和經(jīng)紗驅(qū)動(dòng)-不太可能。但是通訊器、聲控計(jì)算機(jī)和通用翻譯器是非??赡艿摹?
當(dāng)語音識(shí)別出現(xiàn)在電腦桌面上時(shí),這似乎是一個(gè)好主意——但對(duì)大多數(shù)人來說,它不能代替鍵盤和鼠標(biāo)?,F(xiàn)在,語音識(shí)別技術(shù)正在一個(gè)全新的環(huán)境中使用:手機(jī)。它的存在進(jìn)一步促進(jìn)了它在桌面上的使用和發(fā)展。
語音識(shí)別最早作為一種原始技術(shù)出現(xiàn)在20世紀(jì)50年代,那只是一種好奇。20世紀(jì)60年代初,IBM的鞋盒設(shè)備可以識(shí)別16個(gè)口語單詞,并對(duì)簡(jiǎn)單的數(shù)學(xué)請(qǐng)求做出響應(yīng),例如“三加四的總數(shù)”。
Dragon Systems的口授可能是PC的第一個(gè)語音識(shí)別程序,它是在20世紀(jì)80年代早期為DOS計(jì)算機(jī)發(fā)布的。它只能識(shí)別單個(gè)單詞,一次只能說一個(gè)。隨著時(shí)間的推移,它演變成了龍的自然語音的產(chǎn)物(現(xiàn)在是第11版,歸Nuance Communications所有),可以用正常的會(huì)話聲音和速度轉(zhuǎn)錄口語文本。
桌面上的語音識(shí)別有兩大局限。首先,為了使程序高度準(zhǔn)確,必須訓(xùn)練它識(shí)別用戶的語音模式。Windows Vista和Windows7的原生語音仍然需要用戶培訓(xùn)期,才能對(duì)文本技術(shù)和第三方產(chǎn)品(如Long Nature Speech)有用。
第二個(gè)限制是鍵盤的普及。大多數(shù)人習(xí)慣于打字而不是說話,因此語音控制面臨著與德沃夏克鍵盤布局相同的困難障礙。普通老QWERTY現(xiàn)成好用,為什么還要學(xué)用dvorak?
負(fù)責(zé)為各種環(huán)境開發(fā)語音識(shí)別技術(shù)的微軟TellMe團(tuán)隊(duì)高級(jí)產(chǎn)品經(jīng)理Abhi release非常贊同這一點(diǎn):“在桌面環(huán)境下,用戶可以輕松使用其他交互方式,即鍵盤和鼠標(biāo),所以使用語音主要針對(duì)語音愛好者。
更廣泛的應(yīng)用所需要的語音控制計(jì)算是兩件事——開箱即用更好,演講已經(jīng)是王道。其中一個(gè)地方長(zhǎng)期以來一直在崛起:手機(jī)。
Nuance產(chǎn)品管理和營(yíng)銷副總裁Matt Revis解釋了桌面和移動(dòng)環(huán)境的區(qū)別:“桌面是完全專注于桌面用例的靜態(tài)環(huán)境,因此桌面語音遵循任務(wù)流:支持辦公應(yīng)用、Web瀏覽、通信等。在移動(dòng)領(lǐng)域,說話更多的是支持各種生活方式:專業(yè)人士出門、出去玩、免提(通話)等等。
Gartner分析師Tuong阮源也認(rèn)為,聲音在移動(dòng)環(huán)境中更有意義?!皬氖褂媒嵌葋砜矗彼f,“語音識(shí)別在手持設(shè)備上的價(jià)值要大得多。它增加了一種方便直觀的輸入法。
Nguyen補(bǔ)充說,這當(dāng)然是正確的,如果一個(gè)簡(jiǎn)單陳述的替代方法是挖掘大量菜單或?qū)刮⑿〉钠聊绘I盤:“隨著純觸摸設(shè)備(沒有物理按鍵)的使用越來越多,語音識(shí)別被用來增強(qiáng)數(shù)據(jù)輸入/輸入。它還支持免提要求或立法”。
(故事在下一頁繼續(xù))
語音識(shí)別是通過建立口語統(tǒng)計(jì)模型來實(shí)現(xiàn)的?!盀榱俗R(shí)別口語單詞,”谷歌產(chǎn)品經(jīng)理阿米爾馬內(nèi)(Amir Mane)說,“我們比較了輸入語音和語言的統(tǒng)計(jì)模型,試圖找到最接近的匹配——系統(tǒng)對(duì)用戶所說內(nèi)容的最佳猜測(cè)?!?
語言的統(tǒng)計(jì)模型需要大量的存儲(chǔ)空間才能實(shí)用。馬內(nèi)說:“(它們)必須涵蓋一種語言的所有基本聲音(音素)、所有單詞和所有不同的方式,這些在口語中可以聯(lián)系在一起。此外,還有口音、性別和年齡差異、地區(qū)發(fā)音、選詞(“汽水”對(duì)“可樂”對(duì)“流行”)等等。
曼恩指出,谷歌語音搜索的統(tǒng)計(jì)模型需要三個(gè)要素:聲學(xué)模型、語言模型和詞匯。他說:“聲學(xué)模型是通過轉(zhuǎn)錄語音記錄和口語內(nèi)容,并使用這兩者來創(chuàng)建電話表示,這是特定語言中所有單詞的基本組成部分。
語言模型包括找出哪些單詞可能跟在其他單詞后面,并將它們用作提高識(shí)別準(zhǔn)確性的方法。馬內(nèi)解釋說:“在‘帝國(guó)反擊’這個(gè)詞后面會(huì)加上‘國(guó)家’或‘打擊’(例如《帝國(guó)反擊戰(zhàn)》),而不是‘多樣化’或‘番石榴’。從該領(lǐng)域收集數(shù)據(jù)有助于不斷改進(jìn)語言模型和詞匯。
谷歌不是唯一的眾包公司。語音識(shí)別應(yīng)用Vlingo將cookie放在用戶的手機(jī)上,根據(jù)用戶自己的反饋和類似揚(yáng)聲器的模型不斷構(gòu)建語音模型。
免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場(chǎng)無關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!
-
安徽淮南長(zhǎng)安獵手K50作為一款備受關(guān)注的皮卡車型,其2025款在配置和性能上都有所升級(jí)。對(duì)于想要購(gòu)買這款車的消...瀏覽全文>>
-
安徽阜陽的大眾高爾夫GTI作為一款備受年輕消費(fèi)者喜愛的性能車型,其價(jià)格和配置一直是大家關(guān)注的重點(diǎn)。高爾夫GT...瀏覽全文>>
-
近年來,新能源汽車市場(chǎng)發(fā)展迅猛,大眾品牌憑借其深厚的技術(shù)積累和可靠的產(chǎn)品品質(zhì),在國(guó)內(nèi)市場(chǎng)上占據(jù)了重要地...瀏覽全文>>
-
QQ多米作為一款備受關(guān)注的小型車,憑借其時(shí)尚的外觀設(shè)計(jì)和實(shí)用的配置,吸引了眾多消費(fèi)者的關(guān)注。為了幫助大家...瀏覽全文>>
-
隨著新能源汽車市場(chǎng)的持續(xù)升溫,上汽大眾ID 6 X憑借其寬敞的7座空間和出色的續(xù)航能力,成為不少家庭用戶的關(guān)...瀏覽全文>>
-
淮南途銳新能源2024款車型以其卓越的性能和環(huán)保特性吸引了眾多消費(fèi)者的關(guān)注。作為一款高端插電式混合動(dòng)力SUV,...瀏覽全文>>
-
近年來,隨著新能源汽車的普及和政策支持的不斷加大,越來越多消費(fèi)者將目光投向了插電混動(dòng)車型。作為一款備受...瀏覽全文>>
-
2025款生活家PHEV作為一款備受關(guān)注的新能源車型,憑借其出色的性能和環(huán)保特性,吸引了眾多消費(fèi)者的目光。在購(gòu)...瀏覽全文>>
-
長(zhǎng)安汽車旗下高端新能源品牌——啟源,在2024款新車的推出中再次吸引了廣泛關(guān)注。作為該品牌的旗艦車型之一,...瀏覽全文>>
-
近年來,新能源汽車市場(chǎng)持續(xù)火熱,各大品牌紛紛推出新款車型以滿足消費(fèi)者需求。在眾多選擇中,2025款安徽池州I...瀏覽全文>>
- iPhone用戶現(xiàn)在可以通過iOS18.1更新更改其Apple帳戶的主要電子郵件地址
- 當(dāng)你看到T-Mobile用戶贏得手機(jī)手表和耳機(jī)時(shí)你會(huì)羨慕不已
- Ubuntu24.10OracularOriole推出最新內(nèi)核工具鏈GNOME47和增強(qiáng)的安全性
- 搭載M4的MacBookPro在Cinebench上擊敗了CoreUltra9288V和Ryzen9AI370HX
- EarFun推出功能強(qiáng)大的159美元UBoomX便攜式揚(yáng)聲器
- iPhone16Pro iPhone16ProMax表現(xiàn)優(yōu)于基本機(jī)型扭轉(zhuǎn)了之前的趨勢(shì)
- Waze迎來魔獸世界改版
- SquareEnix將心愛的RPG移植到MetaQuest3
- 蘋果正在設(shè)計(jì)全新操作系統(tǒng)瞄準(zhǔn)新類別的產(chǎn)品
- 小米R(shí)edmiA27U顯示器采用4K面板和90WUSBC端口
- QQ多米落地價(jià),各配置車型售價(jià)一目了然
- 生活家PHEV多少錢?購(gòu)車攻略在此
- 現(xiàn)代伊蘭特試駕,暢享豪華駕乘,體驗(yàn)卓越性能
- 試駕領(lǐng)克03,從預(yù)約到試駕的完美旅程
- QQ多米最新價(jià)格2025款,各配置車型售價(jià)全揭曉,性價(jià)比之王
- 淮北途觀L多少錢 2025款落地價(jià),價(jià)格再創(chuàng)新低,性價(jià)比爆棚
- 山東濟(jì)南帕薩特新能源新款價(jià)格2025款多少錢?最低售價(jià)17.715萬起,性價(jià)比大揭秘
- SWM斯威G01FF新款價(jià)格2024款多少錢?看完這篇購(gòu)車攻略再做決定
- 淮南ID.4 X價(jià)格,最低售價(jià)13.9888萬起,價(jià)格再創(chuàng)新低
- 滁州途鎧多少錢 2023款落地價(jià)與配置的完美平衡
- 蘋果將為iPhone17系列采用新電池技術(shù)
- Adobe推出PhotoshopElements和PremiereElements2025取消Elements軟件的永久許可
- AppleiPhoneSE4將配備更新的OLED顯示屏
- InfinixZeroFlip首次亮相作為新款可折疊Android智能手機(jī)其價(jià)格低于摩托羅拉Razr2024
- OnePlus13型號(hào) 充電規(guī)格在最新泄漏中被登記
- Insta360AcePro2主要規(guī)格終于泄露GoPro和DJI運(yùn)動(dòng)相機(jī)競(jìng)爭(zhēng)對(duì)手將配備50MP傳感器5nm和2倍數(shù)碼變焦
- XboxElite無線控制器系列2通過Xbox設(shè)計(jì)實(shí)驗(yàn)室獲得透明面板
- 索尼INZONEM10S華碩ROGSwiftOLEDPG27AQDP新品上市但售價(jià)更高
- 谷歌終止PixelBuds的點(diǎn)擊通知功能
- 谷歌正在努力完善iOS中缺少的RCS支持重要功能
- 對(duì)AppleIntelligence功能的評(píng)價(jià)從一般到還可以
- GalaxyS25Plus看起來很時(shí)髦但三星是否選擇像iPhone一樣的通用設(shè)計(jì)
- 優(yōu)質(zhì)48英寸三星S90DOLED電視在亞馬遜上降至歷史最低價(jià)同時(shí)贈(zèng)送100美元Xbox禮品卡和1年保護(hù)計(jì)劃
- AOC推出四款新型游戲顯示器具有快速刷新率和低價(jià)格
- Valve出售部分SteamDeck型號(hào)-GBLCD型號(hào)售價(jià)296.65美元512GBLCD型號(hào)售價(jià)336.75美元
- Beats在其產(chǎn)品線中增加了手機(jī)保護(hù)殼推出適用于iPhone16系列的MagSafe保護(hù)殼
- 三星在IFA2024上展示AI產(chǎn)品
- 新的AIPlaygroundDesign工具你可以簡(jiǎn)單地與之交談就像ChatGPT一樣
- 極簡(jiǎn)主義Linux發(fā)行版Peropesis2.7附帶存檔和ISO管理工具
- GAMEBABY控制器和外殼混合套裝現(xiàn)已接受預(yù)訂