Mengapa penurunan kecerunan stokastik?

Mengapa penurunan kecerunan stokastik?
Mengapa penurunan kecerunan stokastik?
Anonim

Menurut seorang saintis data kanan, salah satu kelebihan tersendiri menggunakan Penurunan Kecerunan Stokastik ialah ia melakukan pengiraan lebih cepat daripada keturunan kecerunan dan keturunan kecerunan kelompok … Selain itu, pada set data yang besar, keturunan kecerunan stokastik boleh menumpu lebih cepat kerana ia melakukan kemas kini dengan lebih kerap.

Apakah kegunaan Stochastic Gradient Descent?

Penurunan kecerunan stokastik ialah algoritma pengoptimuman yang sering digunakan dalam aplikasi pembelajaran mesin untuk mencari parameter model yang sepadan dengan kesesuaian terbaik antara output yang diramalkan dan sebenar Ini teknik yang tidak tepat tetapi berkuasa. Penurunan kecerunan stokastik digunakan secara meluas dalam aplikasi pembelajaran mesin.

Mengapa kita perlu menggunakan Penurunan Kecerunan Stokastik dan bukannya keturunan kecerunan standard untuk melatih rangkaian saraf konvolusi?

Penurunan kecerunan stokastik mengemas kini parameter untuk setiap pemerhatian yang membawa kepada lebih banyak kemas kini. Jadi ia adalah pendekatan yang lebih pantas yang membantu dalam membuat keputusan yang lebih cepat. Kemas kini yang lebih pantas dalam arah yang berbeza dapat dilihat dalam animasi ini.

Mengapa kita lebih suka keturunan kecerunan?

Sebab utama mengapa keturunan kecerunan digunakan untuk regresi linear ialah kerumitan pengiraan: secara pengiraan lebih murah (lebih cepat) untuk mencari penyelesaian menggunakan keturunan kecerunan dalam beberapa kes. Di sini, anda perlu mengira matriks X′X kemudian terbalikkannya (lihat nota di bawah). Ini pengiraan yang mahal.

Mengapa SGD digunakan?

Keturunan kecerunan stokastik (sering disingkat SGD) ialah kaedah berulang untuk mengoptimumkan fungsi objektif dengan sifat kelicinan yang sesuai (cth. boleh dibezakan atau boleh dibezakan).