Ia ialah teknik perlombongan data yang mengubah data mentah kepada format yang boleh difahami. Data mentah (data dunia sebenar) sentiasa tidak lengkap dan data itu tidak boleh dihantar melalui model. Itu akan menyebabkan ralat tertentu. Itulah sebabnya kita perlu praproses data sebelum menghantar melalui model
Mengapa kita perlu mempraproses data?
Ia ialah teknik perlombongan data yang mengubah data mentah menjadi format yang boleh difahami Data mentah (data dunia sebenar) sentiasa tidak lengkap dan data itu tidak boleh dihantar melalui model. Itu akan menyebabkan ralat tertentu. Itulah sebabnya kita perlu mempraproses data sebelum menghantar melalui model.
Perlukah saya praproses data ujian?
Intipati asas ini ialah: Anda tidak seharusnya menggunakan kaedah prapemprosesan yang dipasang pada keseluruhan set data, untuk mengubah data ujian atau melatih. Jika anda berbuat demikian, anda secara tidak sengaja membawa maklumat dari set kereta api ke set ujian.
Apakah itu isu kebocoran data?
Kebocoran data ialah pengiriman data tanpa kebenaran dari dalam organisasi ke destinasi atau penerima luar … Kebocoran data, juga dikenali sebagai kecurian data rendah dan perlahan, merupakan masalah besar untuk keselamatan data dan kerosakan yang disebabkan oleh mana-mana organisasi, tanpa mengira saiz atau industri, boleh menjadi serius.
Bagaimanakah anda mengubah data ujian?
transformasi akan mengubah semua ciri dengan menolak min dan membahagikan dengan varians. Untuk kemudahan, kedua-dua panggilan fungsi ini boleh dilakukan dalam satu langkah menggunakan fit_transform.