Exploratory Data Analysis (EDA) atau dikenal pula dengan analisis data eksploratif merupakan pendekatan analisis untuk suatu data guna membuat gambaran keseluruhan (summary) data sehingga mudah untuk dipahami. Metode analisis ini menyediakan berbagai alat untuk meringkas dan memperoleh wawasan tentang sekumpulan data dengan cepat menggunakan grafik sebagai bentuk visualisasi data, tanpa menggunakan model statistik, atau formulasi hipotesis.
Langkah pertama dalam menganalisis data adalah mempelajari karakteristik data tersebut. Analisis data eksploratif sangat penting untuk menunjang statistisi dalam menelaah dan menemukan karakteristik data yang selanjutnya dapat berguna dalam pemilihan model statistika yang tepat. Dua alat penting dalam EDA untuk menunjukkan karakteristik data adalah ringkasan numerik dan diagram kotak (boxplot). Ringkasan numerik menunjukkan dimana data memusat dan bagaimana sebaran datanya. Sedangkan boxplot digunakan untuk mengetahui bagaimana distribusi data, dimana distribusi data ini sangat dibutuhkan untuk menentukan motode analisis statistika apa yang tepat untuk data tersebut. Dengan demikian, eksploratif dan visualisasi data sangatlah penting untuk dipelajari dalam statistika.
Exploratory Data Analysis pertama kali diperkenalkan oleh John Tukey pada tahun 1977. Tukey menyarankan para statistisi membuat visualisasi untuk pemeriksaan data sebelum membuat formulasi hipotesis yang dapat diuji pada data set tersebut atau pada data set yang akan dikoleksi selanjutnya.