Dalam analisis data eksploratif terdapat satu hal penting yang harus diketahui, yaitu ringkasan numerik. Ringkasan numerik merupakan ringkasan data yang terdiri dari ukuran-ukuran penting dari data yang menggambarkan gambaran karakteristik umum dari data. Karakteristik tersebut meliputi ukuran pusat data dan ukuran sebaran data.
Ringkasan numerik biasa disajikan dalam bentuk ringkasan lima angka. Disebut ringkasan lima angka karena memuat lima angka atau ukuran penting dari data. Ringkasan lima angka yang sering digunakan adalah Median, Kuartil 1, Kuartil 2, data terendah, dan data tertinggi. Kelima angka tersebut dapat disajikan dalam bentuk
Median merupakan nilai tengah data setelah data diurutkan. Karena median bersifat robust atau tidak terpengaruh oleh adanya data ekstrim, maka median ini digunakan untuk menunjukkan pusat data dalam ringkasan lima angka. Sedangkan empat angka yang lain, yaitu Q1 (Kuartil 1), Q3 (Kuartil 3), Xb (nilai data terendah), dan Xa (nilai data tertinggi) digunakan untuk menunjukkan sebaran data.
Ringkasan lima angka ini juga menjadi acuan ketika membuat boxplot atau diagram kotak. Boxplot merupakan salah satu metode penyajian data yang penting dalam analisis data eksploratif. Dengan boxplot bisa diketahui bentuk sebaran data dan distribusi data.