Fungsi ringkasan numerik selain untuk menunjukkan karakteristik data, dapat digunakan pula untuk membuat diagram kotak dan titik atau lebih dikenal sebagai boxplot. Ringkasan numerik yang diperlukan untuk mengkonstruksi boxplot adalah Median, Kuartil 1, Kuartil 3, Nilai data terendah, dan Nilai data tertinggi. Pada jumlah observasi atau ukuran data yang besar, Median dapat diganti dengan Trirata. Hal ini karena untuk menghitung nilai Trirata menggunakan tiga kuantitas, yaitu Median, Kuartil 1, dan Kuartil 3, sehingga dianggap lebih mewakili data jika dibandingkan dengan Median.
Garis tengah di dalam kotak pada boxplot mewakili nilai Median. Sisi kotak yang mengapit Median menunjukkan masing-masing nilai Kuartil 1 dan Kuartil 3. Sedangkan kedua ujung boxplot mewakili nilai data terendah dan nilai data tertinggi.
Boxplot sangat baik digunakan untuk data dengan jumlah observasi besar karena hanya diperlukan 5 angka untuk mengkonstruksinya. Mudah dan cepat untuk mengkonstruksi boxplot karena tidak perlu menggambar semua titik observasi dalam boxplot. Oleh karena hanya lima titik observasi penting saja yang terlihat, maka gambaran data dapat terlihat lebih jelas.
Dalam analisis data eksploratif, boxplot mempunyai beberapa fungsi penting. Boxplot sering digunakan dalam pendeteksian ada tidaknya data ekstrim/outlier pada satu set data. Dalam banyak analisis statistika mengasumsikan bahwa data mengikuti distribusi normal. Boxplot juga dapat digunakan dalam mengujian asumsi tersebut. Selain itu, boxplot dapat digunakan pula dalam perbandingan beberapa populasi.
Bagaimana membuat Boxplot dengan software R, mendeteksi outlier dan kesimetrisan data dibahas lebih lengkap pada menu “Pemanfaatan Software”.