「深度學習」的初學者,接觸很多書或課程,看了很多數學公式與理論,可是對於初學者而言,可能覺得很抽象,也是一大進入障礙。本章教您如何透過玩TensorFlow Playground,理解深度學習的概念。透過實際示範,介紹機器學習或深度學習的初學者,常混淆的2個名詞:什麼是超參數(hyperparameter)? 什麼是模型參數(parameter)? 為何越多層隱藏層功能越強? 透過實際操作了解如何設定超參數: Learning rate、Activation...等?
超參數與模型參數
機器學習或深度學習的初學者,常混淆的2個名詞:什麼是超參數(hyperparameter)與模型參數(parameter)?
TensorFlow Playground資料設定
建立模型前,必須進行資料設定。
TensorFlow Playground建立模型
模型參數(訓練時學習資料的規律)
初學神經網路模型,我們常常會有疑問,究竟模型如何學習資料的規律?其實就是模型訓練過程中,反向傳播會會更新模型「可訓練參數」(Weight與Bias的數值),來學習資料的規律,使測試誤差(Test loss)與訓練誤差(Training loss)都下降。
模型設計超參數:隱藏層數
以下分別以1個隱藏層、2個隱藏層,試圖分類Spiral資料分佈的問題,並且觀察結果有何不同?
模型設計超參數: Activation激活函數
以下設定不同的激活函數:ReLU、Tanh、Sigmoid、Linear,並且觀察結果有何不同?
模型訓練超參數: Learning Rate
Learning Rate是模型訓練超參數,用於控制訓練過程。當我們使用梯度下降法:進行訓練使loss降低。必須選擇適當的Learning Rate。如下圖,不同的Learning Rate,會有以下不同的結果。
This is a short description in the author block about the author. You edit it by entering text in the "Biographical Info" field in the user admin panel.
0 意見:
張貼留言