智能揚聲器制造商可能會記錄用戶以改善隱私費用的自然語言處理
自然語言處理現(xiàn)在是一個非常熱門的話題,因為它允許機器學(xué)習(xí)算法分析大量數(shù)據(jù),以便隨著時間的推移改善語音功能和對語音命令的響應(yīng)。對于機器人來說,識別并能夠解釋為自然語言并非易事。例如,有很多方法可以提出問題,以及人類言語中的大量不同的口音,聲音和其他變量。這就是為什么目前在與語音識別,自然語言識別和自然語言生成相關(guān)的領(lǐng)域中需要克服的障礙。后者指的是計算機能夠用語音響應(yīng)命令,該語音將是可理解的并且與最終用戶詢問的查詢相關(guān)。它還可以意味著大聲朗讀文本,用語音或朗讀想法來總結(jié)報告。然而,這通常需要自然語言理解。
今天提供語音識別和語音響應(yīng)的基于消費者的語音機器人系統(tǒng)以三種主要消費產(chǎn)品的形式出現(xiàn):Apple的Siri,Amazon Alexa和Google Assistant(微軟最近重新定位的Cortana作為對其他人的免費服務(wù))。這三家公司中的每一家 - 亞馬遜,谷歌和蘋果 - 都提供自己的智能揚聲器以及用戶可以通過語音回復(fù)的其他產(chǎn)品。它們由機器學(xué)習(xí)算法提供支持,并不斷收集用戶數(shù)據(jù)以改進其基礎(chǔ)技術(shù)。
收集用戶語音數(shù)據(jù)和與用戶如何以各種方式提問的方式相關(guān)的數(shù)據(jù)是改善語音機器人整體服務(wù)和自然語言處理的一種方法。我最近遇到了一篇文章,提到了這些公司正在做這件事的一些方法。
根據(jù)Buzzfeed News發(fā)表的一篇文章,源自彭博社的報道,亞馬遜實際上有一個專門的員工團隊,至少可以收聽Echo用戶正在進行的部分對話。Echo記錄了它聽到的各種語音的部分內(nèi)容,并將其發(fā)送回亞馬遜進行進一步分析。然而,這引起爭議的原因在于它并不像蘋果和谷歌那樣匿名。它知道客戶,并且知道發(fā)往亞馬遜的數(shù)據(jù)來自他們。
洪水民意調(diào)查:PLU對青年投票率的投資
“七人被描述為曾在亞馬遜的語音評論計劃中工作,他告訴彭博社,他們有時每班聽多達(dá)1,000個錄音,錄音與客戶的名字,設(shè)備的序列號和帳號有關(guān)。 ,“ 根據(jù)這篇文章。
其他員工進一步向Buzzfeed News澄清,只有少量錄音被注釋。如果這些用戶的隱私受到侵犯,這仍然會引發(fā)一個問題,因為誰知道確切記錄了什么以及何時被記錄?例如,在亞馬遜總部的員工正在聆聽,這可能是我想象的私人時刻。誰真的知道?
對此的正面反應(yīng)是,由于Alexa存在并記錄事件發(fā)生,可以阻止或阻止犯罪。此外,如果在Echo附近發(fā)生的犯罪期間說出了他們的姓名或其他可識別信息,則可以更容易地識別和逮捕嫌疑人。事實上,Echo已經(jīng)看到一些潛在的警方調(diào)查要么使用它,要么試圖用它作為證據(jù)來定罪嫌犯。
例如,去年年底,據(jù)報道,新罕布什爾州的一名法官已經(jīng)下令釋放Alexa錄音,這是在Echo的存在下發(fā)生的雙重謀殺案件。
像許多技術(shù)一樣,可以用于良好的東西也可以用于壞事。網(wǎng)絡(luò)犯罪分子也可以利用揚聲器和語音技術(shù)。雖然大多數(shù)錄音或全部錄音應(yīng)該保存在公司服務(wù)器而不是實際的揚聲器本身,能夠?qū)崟r窺探用戶的聲音或通過這些設(shè)備進行通話,我的圖像可能會對最終用戶產(chǎn)生負(fù)面影響。想象一下公司會議與敏感信息共享,亞馬遜員工正在聆聽此事,或者在更糟糕的情況下,實際的網(wǎng)絡(luò)罪犯。
要記住的另一件事是智能揚聲器通常連接到智能家居或所有家用電器和各種安全系統(tǒng)的概念由語音控制。因此,如果黑客可以欺騙說話者他們的聲音是所有者之一,那么黑客可能會破壞住宅或商業(yè)的整個周邊。Techworld報告提到了一些與語音助理和智能揚聲器有關(guān)的問題,特別是與智能家居同步的問題,如果沒有正確的保護措施,可能會出現(xiàn)這些問題。
根據(jù)Techworld的說法,“黑客只需要一個簡短的音頻樣本來合成或重放人類的聲音,足以誘騙人們和安全系統(tǒng)。”另一個危險是公司可以利用人們的聲音來個性化廣告。
一個好的跡象是,根據(jù)亞馬遜的設(shè)備支持常見問題頁面,該公司不會記錄和分析其Alexa兼容設(shè)備或其Echo揚聲器中發(fā)生的所有語音。事實上,只有某些詞才能觸發(fā)Alexa可能開始錄音。以下是FAQ描述的方式:
Alexa是否記錄了我的所有談話?
否。默認(rèn)情況下,Echo設(shè)備僅用于檢測您選擇的喚醒字(Alexa,亞馬遜,計算機或Echo)。該設(shè)備通過識別與喚醒字匹配的聲學(xué)模式來檢測喚醒字。除非設(shè)備檢測到喚醒字(或按下按鈕激活A(yù)lexa),否則不會將音頻存儲或發(fā)送到云端。使用Alexa Guard,您還可以配置支持的Echo設(shè)備以檢測特定聲音,例如煙霧報警聲,一氧化碳報警和玻璃破碎。
此外,常見問題解答解釋說,當(dāng)錄制內(nèi)容發(fā)送到云時會出現(xiàn)可視指示符 - 盡管我不確定這是否與亞馬遜在自己的服務(wù)器上分析語音或者它在談?wù)撌裁丛?用戶的云帳戶)相同或整個云,包括遠(yuǎn)程服務(wù)器上的任何數(shù)據(jù)存儲?)。無論哪種方式,語音識別和智能揚聲器都會存在,并且可能加速自然語言處理的整體發(fā)展,盡管以犧牲隱私為代價。
標(biāo)簽: