少兒編程機(jī)器學(xué)習(xí)常識(shí)分享

發(fā)布時(shí)間:2020-05-13 08:32:11來源：魔方格

當(dāng)別人在高談闊論機(jī)器學(xué)習(xí)時(shí)，你卻插不上嘴，這是一種怎樣的體驗(yàn)?不懂機(jī)器學(xué)習(xí)沒有關(guān)系，但你一定要知道下面的十個(gè)機(jī)器學(xué)習(xí)基本常識(shí)。曾經(jīng)在Endeca、谷歌和LinkedIn機(jī)器學(xué)習(xí)開發(fā)的Daniel Tunkelang為我們概括總結(jié)了這十個(gè)常識(shí)。

1. 機(jī)器學(xué)習(xí)就是從數(shù)據(jù)中挖掘洞見，而人工智能是炒作。

只要使用了正確的訓(xùn)練數(shù)據(jù)和算法，機(jī)器學(xué)習(xí)可以解決大部分問題。而所謂的人工智能，只不過是一種包裝。只要有助于營銷，你要把它叫作什么都可以。

2. 數(shù)據(jù)和算法是機(jī)器學(xué)習(xí)的核心，而數(shù)據(jù)更為重要。

雖然人們熱衷于研究機(jī)器學(xué)習(xí)算法，但數(shù)據(jù)才是機(jī)器學(xué)習(xí)的關(guān)鍵要素。機(jī)器學(xué)習(xí)可以沒有復(fù)雜完備的算法，但沒有高質(zhì)量的數(shù)據(jù)就不行。

3. 如果你沒有大量數(shù)據(jù)，就不要使用太復(fù)雜的模型。

機(jī)器學(xué)習(xí)根據(jù)輸入?yún)?shù)來探索模型空間，參數(shù)越多，越有可能出現(xiàn)過擬合，所以應(yīng)該要盡量遵循簡單模型的原則。

4. 機(jī)器學(xué)習(xí)的成果取決于數(shù)據(jù)的質(zhì)量。

種瓜得瓜，種豆得豆。機(jī)器學(xué)習(xí)只能發(fā)現(xiàn)已經(jīng)存在于數(shù)據(jù)中的模式。比如在解決分類問題時(shí)，就要求訓(xùn)練數(shù)據(jù)具有清晰的特征。

5. 只有當(dāng)訓(xùn)練數(shù)據(jù)具有代表性時(shí)，機(jī)器學(xué)習(xí)才能奏效。

過去不能代表未來。要時(shí)刻警惕訓(xùn)練數(shù)據(jù)和生產(chǎn)數(shù)據(jù)之間出現(xiàn)傾斜，經(jīng)常性地訓(xùn)練數(shù)據(jù)，避免數(shù)據(jù)模型過時(shí)。

6. 機(jī)器學(xué)習(xí)困難的部分其實(shí)是數(shù)據(jù)轉(zhuǎn)換。

機(jī)器學(xué)習(xí)的大肆炒作可能會(huì)給你造成一種印象，就是機(jī)器學(xué)習(xí)主要是如何選擇和調(diào)整算法。但實(shí)際上，機(jī)器學(xué)習(xí)工作的大部分時(shí)間花在了數(shù)據(jù)清理和特征工程上，也就是將數(shù)據(jù)的原始特征轉(zhuǎn)換成更具表示性的特征。

7. 深度學(xué)習(xí)是革命性的，但不是銀彈。

深度學(xué)習(xí)對(duì)部分傳統(tǒng)的特征工程進(jìn)行了自動(dòng)化，特別是在圖像和視頻處理領(lǐng)域。但深度學(xué)習(xí)不是銀彈，我們無法在它擅長的領(lǐng)域之外應(yīng)用它，況且，我們?nèi)匀灰ê芏嗑M(jìn)行數(shù)據(jù)清理和轉(zhuǎn)換。

8. 機(jī)器學(xué)習(xí)系統(tǒng)也是高度脆弱的。

機(jī)器學(xué)習(xí)算法不會(huì)干掉人類，干掉人類的是人類自己。機(jī)器學(xué)習(xí)系統(tǒng)如果出現(xiàn)故障，通常都不是因?yàn)闄C(jī)器學(xué)習(xí)算法本身，而是人類在訓(xùn)練數(shù)據(jù)中引入了錯(cuò)誤。要時(shí)刻警惕，軟件工程中出現(xiàn)的錯(cuò)誤在機(jī)器學(xué)習(xí)系統(tǒng)中同樣會(huì)出現(xiàn)。

9. 機(jī)器學(xué)習(xí)可能在無意之中創(chuàng)造出可自我實(shí)現(xiàn)的預(yù)言。

今天通過機(jī)器學(xué)習(xí)做出的決策，將會(huì)影響未來收集到的訓(xùn)練數(shù)據(jù)。如果你在機(jī)器學(xué)習(xí)系統(tǒng)中嵌入了某種偏見，它會(huì)持續(xù)不斷地生成新的訓(xùn)練數(shù)據(jù)，這些數(shù)據(jù)反過來增強(qiáng)了這種偏見，而有些偏見會(huì)毀掉人類的生活。所以，不要讓機(jī)器學(xué)習(xí)系統(tǒng)有機(jī)會(huì)創(chuàng)造出可自我實(shí)現(xiàn)的預(yù)言。

10. 人工智能不會(huì)自我感知，也不會(huì)崛起到要干掉人類。

很多吃瓜群眾從科幻電影中看到人工智能。但要注意，我們可以從科幻電影中獲得靈感，但它們畢竟不是現(xiàn)實(shí)，我們真正要擔(dān)心的是人類無意識(shí)地在機(jī)器學(xué)習(xí)系統(tǒng)中嵌入偏見。

相關(guān)內(nèi)容：少兒編程少兒編程機(jī)器機(jī)器常識(shí)