Pengumpul ialah pembolehubah yang hanya "ditambah" melalui operasi bersekutu dan oleh itu, boleh disokong dengan cekap secara selari. Ia boleh digunakan untuk melaksanakan pembilang (seperti dalam MapReduce) atau jumlah. Spark menyokong penumpuk jenis angka secara asli dan pengaturcara boleh menambah sokongan untuk jenis baharu.
Mengapa kami menggunakan penumpuk?
Penumpuk hidraulik digunakan dalam pelbagai jenis industri untuk menyimpan tenaga; mengekalkan tekanan; lembapkan getaran, denyutan dan kejutan; dan banyak lagi. Penyimpanan Tenaga – Akumulator boleh menerima, menyimpan dan membebaskan tenaga dalam bentuk bendalir bertekanan untuk meningkatkan kecekapan sistem hidraulik anda.
Apakah perbezaan antara siaran dan penumpuk dalam Spark?
Perbezaan utama antara pembolehubah siaran dan penumpuk ialah bahawa walaupun pembolehubah siaran adalah baca sahaja, penumpuk boleh ditambah. … Setiap nod pekerja hanya boleh mengakses dan menambah nilai penumpuk tempatannya sendiri, dan hanya program pemacu boleh mengakses nilai global.
Bagaimanakah Spark accumulator berfungsi?
Akumulator ialah pembolehubah yang digunakan untuk mengagregatkan maklumat merentas pelaksana. Sebagai contoh, maklumat ini boleh berkaitan dengan data atau diagnosis API seperti bilangan rekod yang rosak atau bilangan kali API perpustakaan tertentu dipanggil.
Mengapa pembolehubah akumulator dalam Spark tidak boleh digunakan oleh pekerja untuk operasi transformasi?
Penumpuk akan memberikan output yang salah. Jika tugas berjalan perlahan, Spark boleh melancarkan salinan spekulatif tugas itu pada nod lain. Keputusan: Tidak dikendalikan. Akumulator akan memberikan output yang salah.