Konsep dan Praktikum: Matriks Jarak dalam Big Data

Authors

Paska Marto Hasugian, ; Pandi Barita Nauli Simangunsong, ; Sardo Pardingotan Sipayung, ; Cinthya Agatha Sinaga, ; Widia Wuduri CS Nababan,

Keywords:

visualisasi, matriks, jarak, big data

Synopsis

Buku ini menyajikan pemahaman menyeluruh mengenai peran penting metrik jarak dalam analisis data modern, terutama di era big data yang ditandai oleh tingginya volume, kecepatan, dan keragaman data. Di dalamnya dijelaskan bagaimana jarak antar data menjadi dasar bagi berbagai metode analisis seperti clustering, klasifikasi, machine learning, dan visualisasi multidimensional. Konflik utama yang diangkat buku ini adalah tantangan bagaimana menghitung dan memilih metrik jarak yang tepat untuk dataset besar dan berdimensi tinggi, di mana masalah seperti perbedaan skala variabel, keberadaan outlier, serta beban komputasi sering kali menjadi penghambat akurasi analisis.
Buku ini memperkenalkan berbagai metrik jarak yang umum digunakan, mulai dari Arccosine Distance yang berfokus pada hubungan sudut antar vektor, Canberra Distance yang sensitif pada perubahan kecil, hingga Dice dan Jaccard Distance yang efektif untuk data berbasis himpunan atau biner. Pembaca juga mendapatkan pemahaman mendalam mengenai Euclidean dan Manhattan Distance yang banyak diterapkan pada geometri ruang dan sistem grid, serta Lorentzian Distance yang lebih tahan terhadap nilai ekstrem. Divergence dan Sorenson Distance turut diuraikan sebagai alternatif untuk data probabilistik dan data berbasis kesamaan.
Setiap metrik dijelaskan melalui konsep dasar, proses perhitungan manual, dan implementasi menggunakan Python pada dataset besar sehingga pembaca dapat melihat perbandingan nyata kinerja antar jarak. Bagian paling inovatif dari buku ini adalah pengenalan Pas-MDS Distance, metrik baru hasil pengembangan penulis yang dirancang untuk mengatasi kelemahan-kelemahan metrik jarak konvensional, terutama dalam visualisasi multidimensional dan reduksi distorsi jarak. Dengan penyampaian yang ringkas, sistematis, dan didukung contoh nyata, buku ini menjadi panduan ideal bagi mahasiswa, peneliti, dan praktisi data yang ingin memahami serta menerapkan metrik jarak secara optimal dalam analisis big data.

Published

November 27, 2025

Categories

License

Creative Commons License

This work is licensed under a Creative Commons Attribution 4.0 International License.

How to Cite