發(fā)布時(shí)間:2020-05-13 08:32:11來源:魔方格
當(dāng)別人在高談闊論機(jī)器學(xué)習(xí)時(shí),你卻插不上嘴,這是一種怎樣的體驗(yàn)?不懂機(jī)器學(xué)習(xí)沒有關(guān)系,但你一定要知道下面的十個(gè)機(jī)器學(xué)習(xí)基本常識(shí)。曾經(jīng)在Endeca、谷歌和LinkedIn機(jī)器學(xué)習(xí)開發(fā)的Daniel Tunkelang為我們概括總結(jié)了這十個(gè)常識(shí)。
1. 機(jī)器學(xué)習(xí)就是從數(shù)據(jù)中挖掘洞見,而人工智能是炒作。
只要使用了正確的訓(xùn)練數(shù)據(jù)和算法,機(jī)器學(xué)習(xí)可以解決大部分問題。而所謂的人工智能,只不過是一種包裝。只要有助于營銷,你要把它叫作什么都可以。
2. 數(shù)據(jù)和算法是機(jī)器學(xué)習(xí)的核心,而數(shù)據(jù)更為重要。
雖然人們熱衷于研究機(jī)器學(xué)習(xí)算法,但數(shù)據(jù)才是機(jī)器學(xué)習(xí)的關(guān)鍵要素。機(jī)器學(xué)習(xí)可以沒有復(fù)雜完備的算法,但沒有高質(zhì)量的數(shù)據(jù)就不行。
3. 如果你沒有大量數(shù)據(jù),就不要使用太復(fù)雜的模型。
機(jī)器學(xué)習(xí)根據(jù)輸入?yún)?shù)來探索模型空間,參數(shù)越多,越有可能出現(xiàn)過擬合,所以應(yīng)該要盡量遵循簡單模型的原則。
4. 機(jī)器學(xué)習(xí)的成果取決于數(shù)據(jù)的質(zhì)量。
種瓜得瓜,種豆得豆。機(jī)器學(xué)習(xí)只能發(fā)現(xiàn)已經(jīng)存在于數(shù)據(jù)中的模式。比如在解決分類問題時(shí),就要求訓(xùn)練數(shù)據(jù)具有清晰的特征。
5. 只有當(dāng)訓(xùn)練數(shù)據(jù)具有代表性時(shí),機(jī)器學(xué)習(xí)才能奏效。
過去不能代表未來。要時(shí)刻警惕訓(xùn)練數(shù)據(jù)和生產(chǎn)數(shù)據(jù)之間出現(xiàn)傾斜,經(jīng)常性地訓(xùn)練數(shù)據(jù),避免數(shù)據(jù)模型過時(shí)。
6. 機(jī)器學(xué)習(xí)困難的部分其實(shí)是數(shù)據(jù)轉(zhuǎn)換。
機(jī)器學(xué)習(xí)的大肆炒作可能會(huì)給你造成一種印象,就是機(jī)器學(xué)習(xí)主要是如何選擇和調(diào)整算法。但實(shí)際上,機(jī)器學(xué)習(xí)工作的大部分時(shí)間花在了數(shù)據(jù)清理和特征工程上,也就是將數(shù)據(jù)的原始特征轉(zhuǎn)換成更具表示性的特征。
7. 深度學(xué)習(xí)是革命性的,但不是銀彈。
深度學(xué)習(xí)對(duì)部分傳統(tǒng)的特征工程進(jìn)行了自動(dòng)化,特別是在圖像和視頻處理領(lǐng)域。但深度學(xué)習(xí)不是銀彈,我們無法在它擅長的領(lǐng)域之外應(yīng)用它,況且,我們?nèi)匀灰ê芏嗑M(jìn)行數(shù)據(jù)清理和轉(zhuǎn)換。
8. 機(jī)器學(xué)習(xí)系統(tǒng)也是高度脆弱的。
機(jī)器學(xué)習(xí)算法不會(huì)干掉人類,干掉人類的是人類自己。機(jī)器學(xué)習(xí)系統(tǒng)如果出現(xiàn)故障,通常都不是因?yàn)闄C(jī)器學(xué)習(xí)算法本身,而是人類在訓(xùn)練數(shù)據(jù)中引入了錯(cuò)誤。要時(shí)刻警惕,軟件工程中出現(xiàn)的錯(cuò)誤在機(jī)器學(xué)習(xí)系統(tǒng)中同樣會(huì)出現(xiàn)。
9. 機(jī)器學(xué)習(xí)可能在無意之中創(chuàng)造出可自我實(shí)現(xiàn)的預(yù)言。
今天通過機(jī)器學(xué)習(xí)做出的決策,將會(huì)影響未來收集到的訓(xùn)練數(shù)據(jù)。如果你在機(jī)器學(xué)習(xí)系統(tǒng)中嵌入了某種偏見,它會(huì)持續(xù)不斷地生成新的訓(xùn)練數(shù)據(jù),這些數(shù)據(jù)反過來增強(qiáng)了這種偏見,而有些偏見會(huì)毀掉人類的生活。所以,不要讓機(jī)器學(xué)習(xí)系統(tǒng)有機(jī)會(huì)創(chuàng)造出可自我實(shí)現(xiàn)的預(yù)言。
10. 人工智能不會(huì)自我感知,也不會(huì)崛起到要干掉人類。
很多吃瓜群眾從科幻電影中看到人工智能。但要注意,我們可以從科幻電影中獲得靈感,但它們畢竟不是現(xiàn)實(shí),我們真正要擔(dān)心的是人類無意識(shí)地在機(jī)器學(xué)習(xí)系統(tǒng)中嵌入偏見。