Main Logo
  • Home
  • About
  • Kursus
    • Paket Kursus
    • Roadmap Profesi
  • Elearning
  • Blog
Daftar
Main Logo
  • Home
  • About
  • Kursus
    • Paket Kursus
    • Roadmap Profesi
  • Elearning
  • Blog

Data Analyst dari Nol: Panduan Lengkap Belajar Analisis Data dengan Excel, SQL, dan Python (Studi Kasus Penjualan)

  • January 14, 2026
  • oleh Edusoft Center
Daftar Isi
  • Pendahuluan
  • Apa Itu Data Analyst?
  • Mengapa Harus Belajar Data Analyst?
    • 1. Dibutuhkan di Banyak Industri
    • 2. Gaji yang Kompetitif
    • 3. Bisa Dipelajari oleh Siapa Saja
    • 4. Cocok untuk yang Suka Logika dan Analisis
  • Apa Itu Data?
  • Jenis-Jenis Data dalam Data Analyst
    • 1. Data Numerik (Numerical Data)
    • 2. Data Kategorik (Categorical Data)
    • 3. Data Time Series
    • 4. Data Primer dan Sekunder
  • Pengenalan Studi Kasus: Dataset Penjualan
    • Struktur Dataset
    • Penjelasan Setiap Kolom
  • Apa Itu Data Cleaning?
  • Tools yang Akan Digunakan
    • 1. Excel
    • 2. SQL
    • 3. Python
  • Alur Kerja Data Analyst
  • Apa Itu Data Cleaning?
  • Contoh Dataset Mentah
  • Data Cleaning Menggunakan Excel
    • 1. Menghapus Duplikasi
    • 2. Menyamakan Format Tanggal
    • 3. Mengubah Huruf Menjadi Konsisten
    • 4. Mengisi Data Kosong
    • 5. Memastikan Total = Harga × Jumlah
  • Data Cleaning Menggunakan Python
    • Import Library
    • Load Data
    • Melihat Data
    • Menghapus Duplikasi
    • Mengubah Format Tanggal
    • Menangani Missing Value
    • Menghilangkan Nilai Tidak Masuk Akal
    • Menyamakan Format Teks
  • Apa Itu Analisis Deskriptif?
  • Statistik Dasar dalam Analisis Deskriptif
  • Analisis Deskriptif di Excel
    • 1. Menghitung Total Penjualan
    • 2. Rata-Rata Penjualan
    • 3. Penjualan Tertinggi dan Terendah
    • 4. Jumlah Transaksi
    • 5. Pivot Table
  • Analisis Deskriptif Menggunakan Python
    • Statistik Dasar
    • Total Penjualan
    • Rata-Rata
    • Maksimum dan Minimum
    • Produk Terlaris
  • Interpretasi Hasil
  • 1. Mean (Rata-rata)
    • Apa Itu Mean?
    • Mean di Excel
    • Mean di Python
    • Interpretasi Mean
  • 2. Median
    • Apa Itu Median?
    • Median di Excel
    • Median di Python
    • Kapan Menggunakan Median?
  • 3. Modus
    • Apa Itu Modus?
    • Modus di Excel
    • Modus di Python
    • Interpretasi Modus
  • 4. Persentase
    • Rumus Dasar
    • Contoh Kasus
    • Persentase di Excel
    • Persentase di Python
  • 5. Growth Rate (Pertumbuhan)
    • Rumus Growth
    • Contoh
    • Growth di Excel
    • Growth di Python
  • 6. Analisis Tren
    • Apa Itu Tren?
    • Contoh Tren Penjualan
    • Tren di Excel
    • Tren di Python
  • 7. Moving Average
    • Contoh
    • Moving Average di Python
  • 8. Menggabungkan Semua dalam Analisis Nyata
  • 9. Kesalahan Umum Pemula
  • 1. Apa Itu SQL?
  • 2. Struktur Tabel Penjualan
  • 3. Memasukkan Data (INSERT)
  • 4. SELECT – Menampilkan Data
    • Menampilkan Semua Data
    • Menampilkan Kolom Tertentu
  • 5. WHERE – Filter Data
    • Menampilkan Data Kategori Fashion
    • Menampilkan Transaksi di Atas 200.000
    • Menampilkan Transaksi di Tanggal Tertentu
  • 6. ORDER BY – Mengurutkan Data
    • Urutkan dari Terbesar ke Terkecil
    • Urutkan dari Terkecil ke Terbesar
  • 7. GROUP BY – Pengelompokan Data
    • Total Penjualan per Produk
    • Total Penjualan per Kategori
    • Jumlah Transaksi per Metode Bayar
  • 8. Fungsi Agregat SQL
    • SUM
    • AVG
    • MAX dan MIN
    • COUNT
  • 9. HAVING – Filter Setelah GROUP BY
  • 10. Analisis Tren dengan SQL
    • Total Penjualan per Hari
    • Total Penjualan per Bulan
  • 11. Studi Kasus Nyata
    • 1. Produk Apa yang Paling Laris?
    • 2. Produk dengan Omset Tertinggi
    • 3. Kategori Terbaik
    • 4. Metode Pembayaran Favorit
  • 12. Menghitung Growth dengan SQL
  • 13. Interpretasi Hasil SQL
  • 1. Mengapa Python Penting untuk Data Analyst?
  • 2. Persiapan Data
    • Import Library
    • Load Dataset
    • Melihat Data
    • Informasi Dataset
  • 3. Analisis Deskriptif dengan Python
    • Statistik Dasar
    • Total Penjualan
    • Rata-Rata Transaksi
    • Transaksi Terbesar & Terkecil
  • 4. Analisis Produk Terlaris
    • Berdasarkan Jumlah
    • Berdasarkan Omset
  • 5. Analisis Kategori
  • 6. Analisis Metode Pembayaran
  • 7. Analisis Tren Waktu
    • Total Penjualan per Hari
  • 8. Visualisasi Data
    • 1. Grafik Penjualan Harian
    • 2. Produk Terlaris (Bar Chart)
    • 3. Omset per Kategori
    • 4. Metode Pembayaran
  • 9. Menghitung Growth di Python
  • 10. Moving Average
    • Visualisasi Moving Average
  • 11. Menarik Insight dari Data
    • Contoh Insight:
  • 12. Contoh Rekomendasi Bisnis
  • 13. Workflow Lengkap yang Sudah Kamu Pelajari
  • 14. Kesalahan Umum Pemula
  • 15. Langkah Selanjutnya Setelah Artikel Ini
  • Kesimpulan

Pendahuluan

Di era digital saat ini, data menjadi aset yang sangat berharga. Setiap aktivitas manusia—mulai dari belanja online, menonton video, menggunakan media sosial, hingga melakukan transaksi di toko—semuanya menghasilkan data. Namun, data mentah saja tidak akan memberikan manfaat jika tidak diolah dengan benar. Di sinilah peran seorang Data Analyst menjadi sangat penting.

Seorang Data Analyst bertugas mengolah data mentah menjadi informasi yang bermakna, kemudian mengubahnya menjadi insight yang dapat membantu pengambilan keputusan. Misalnya, dari data penjualan, seorang data analyst dapat menentukan produk apa yang paling laku, kapan waktu penjualan tertinggi, dan strategi apa yang bisa meningkatkan keuntungan.

Artikel ini dibuat khusus untuk pemula yang ingin belajar menjadi data analyst dari nol. Kamu akan mempelajari konsep dasar sekaligus praktik langsung menggunakan:

  • Excel untuk pengolahan data
  • SQL untuk mengambil data dari database
  • Python untuk analisis lanjutan dan visualisasi

Sebagai studi kasus, kita akan menggunakan dataset penjualan, karena mudah dipahami dan sering digunakan dalam dunia bisnis nyata.


Apa Itu Data Analyst?

Data Analyst adalah seseorang yang bertugas mengumpulkan, membersihkan, mengolah, menganalisis, dan menyajikan data agar bisa dipahami oleh pihak lain, terutama untuk membantu pengambilan keputusan.

Tugas utama seorang Data Analyst antara lain:

  1. Mengumpulkan data dari berbagai sumber
  2. Membersihkan data (data cleaning)
  3. Mengolah data menjadi bentuk yang siap dianalisis
  4. Melakukan analisis statistik dan matematis
  5. Membuat visualisasi data
  6. Menarik kesimpulan dan rekomendasi

Contoh penerapan nyata:

  • Menentukan produk paling laris
  • Menganalisis tren penjualan bulanan
  • Memprediksi peningkatan atau penurunan omset
  • Menentukan strategi promosi

Dalam artikel ini, kamu akan belajar bagaimana melakukan semua langkah tersebut secara bertahap.


Mengapa Harus Belajar Data Analyst?

Ada beberapa alasan mengapa profesi Data Analyst sangat diminati:

1. Dibutuhkan di Banyak Industri

Hampir semua industri membutuhkan data analyst, mulai dari:

  • E-commerce
  • Perbankan
  • Pendidikan
  • Kesehatan
  • Startup
  • Pemerintahan

2. Gaji yang Kompetitif

Karena perannya yang penting, profesi ini biasanya memiliki gaji yang cukup tinggi, bahkan untuk level pemula.

3. Bisa Dipelajari oleh Siapa Saja

Kamu tidak harus lulusan IT untuk menjadi data analyst. Dengan pemahaman logika, matematika dasar, dan kemauan belajar, siapa pun bisa memulai.

4. Cocok untuk yang Suka Logika dan Analisis

Jika kamu suka berpikir logis, memecahkan masalah, dan melihat pola, profesi ini sangat cocok.


Apa Itu Data?

Sebelum masuk ke analisis, kita harus memahami apa itu data.

Data adalah kumpulan fakta, angka, teks, atau informasi mentah yang belum diolah. Contohnya:

  • Nama pelanggan
  • Harga produk
  • Jumlah transaksi
  • Tanggal pembelian
  • Metode pembayaran

Data ini sendiri belum bermakna sampai kita mengolah dan menganalisisnya.


Jenis-Jenis Data dalam Data Analyst

Dalam dunia data, ada beberapa jenis data yang sering digunakan:

1. Data Numerik (Numerical Data)

Data numerik berupa angka dan bisa dihitung secara matematis.

Contoh:

  • Harga produk
  • Jumlah penjualan
  • Diskon
  • Total transaksi

Contoh dalam dataset penjualan:

HargaJumlahTotal
5000315000
10000220000

2. Data Kategorik (Categorical Data)

Data kategorik adalah data berupa kategori atau label.

Contoh:

  • Nama produk
  • Jenis kelamin
  • Metode pembayaran
  • Kategori barang

Contoh:

ProdukKategori
SepatuFashion
LaptopElektronik
KopiMakanan

3. Data Time Series

Data yang berhubungan dengan waktu.

Contoh:

  • Penjualan per hari
  • Penjualan per bulan
  • Omset per tahun

Contoh:

TanggalPenjualan
2024-01-01500000
2024-01-02650000
2024-01-03700000

4. Data Primer dan Sekunder

Data primer: Data yang dikumpulkan langsung
Contoh: survei pelanggan

Data sekunder: Data dari sumber lain
Contoh: laporan penjualan, data dari website


Pengenalan Studi Kasus: Dataset Penjualan

Dalam artikel ini, kita akan menggunakan dataset penjualan sederhana agar mudah dipahami oleh pemula.

Struktur Dataset

Misalnya, kita punya dataset dengan struktur seperti ini:

OrderIDTanggalProdukKategoriHargaJumlahTotalMetodeBayar
12024-01-01SepatuFashion2500002500000Transfer
22024-01-01KaosFashion1000001100000E-Wallet
32024-01-02HeadsetElektronik3000001300000COD
42024-01-02KopiMakanan200005100000Cash

Penjelasan Setiap Kolom

  • OrderID → ID unik transaksi
  • Tanggal → Waktu transaksi
  • Produk → Nama barang
  • Kategori → Jenis barang
  • Harga → Harga satuan
  • Jumlah → Banyaknya produk
  • Total → Harga × Jumlah
  • MetodeBayar → Cara pembayaran

Dataset ini akan kita gunakan untuk:

  • Data cleaning
  • Statistik dasar
  • Analisis tren
  • SQL query
  • Python analysis
  • Visualisasi

Apa Itu Data Cleaning?

Data cleaning adalah proses membersihkan data dari kesalahan, ketidakkonsistenan, dan nilai kosong agar siap dianalisis.

Contoh masalah pada data mentah:

  1. Ada nilai kosong (missing value)
  2. Format tanggal tidak konsisten
  3. Duplikasi data
  4. Salah ketik nama produk
  5. Nilai tidak masuk akal (misalnya harga negatif)

Contoh:

ProdukHarga
Sepatu250000
sepatu250000
Sepatu-5000
NULL100000

Data seperti ini harus dibersihkan terlebih dahulu.


Tools yang Akan Digunakan

Dalam artikel ini, kita akan menggunakan tiga tools utama:

1. Excel

Digunakan untuk:

  • Mengedit data
  • Menghapus duplikasi
  • Menghitung statistik dasar
  • Membuat pivot table
  • Membuat grafik

2. SQL

Digunakan untuk:

  • Mengambil data dari database
  • Mengelompokkan data
  • Menghitung total, rata-rata
  • Filtering data

3. Python

Digunakan untuk:

  • Analisis lanjutan
  • Statistik
  • Visualisasi
  • Otomatisasi

Alur Kerja Data Analyst

Sebagai gambaran, alur kerja yang akan kita ikuti:

  1. Memahami masalah
  2. Mengumpulkan data
  3. Membersihkan data
  4. Analisis deskriptif
  5. Analisis tren
  6. Visualisasi
  7. Menarik insight
  8. Memberi rekomendasi

Semua langkah ini akan kita praktikkan.

Data Cleaning dan Analisis Deskriptif (Excel & Python)

Pada bagian sebelumnya, kamu sudah memahami apa itu Data Analyst, jenis-jenis data, serta struktur dataset penjualan yang akan kita gunakan. Sekarang, kita akan masuk ke tahap yang sangat penting dalam dunia data, yaitu Data Cleaning dan Analisis Deskriptif.

Tahap ini sering dianggap sepele, padahal dalam praktiknya, sekitar 60–80% waktu seorang data analyst dihabiskan untuk membersihkan data. Tanpa data yang bersih, hasil analisis bisa menyesatkan.


Apa Itu Data Cleaning?

Data Cleaning adalah proses membersihkan data dari kesalahan, ketidakkonsistenan, dan nilai yang tidak valid agar siap dianalisis.

Masalah umum pada data mentah:

  1. Missing Value (Data Kosong)
    Contoh: kolom harga kosong
  2. Duplikasi Data
    Data transaksi tercatat dua kali
  3. Format Tidak Konsisten
    Contoh:
    • 01-01-2024
    • 2024/01/01
    • Jan 1, 2024
  4. Kesalahan Penulisan (Typo)
    Contoh:
    • Sepatu
    • sepatu
    • SEPATU
  5. Nilai Tidak Masuk Akal
    Contoh: harga -5000, jumlah = 0

Contoh Dataset Mentah

Misalnya kita punya data seperti ini:

OrderIDTanggalProdukKategoriHargaJumlahTotalMetodeBayar
101-01-2024SepatuFashion2500002500000Transfer
22024/01/01KaosFashion1000001100000E-Wallet
3Jan 2 2024headsetelektronik3000001300000COD
3Jan 2 2024headsetelektronik3000001300000COD
42024-01-02NULLMakanan-200005-100000Cash

Dari tabel ini kita bisa lihat banyak masalah:

  • Format tanggal berbeda
  • Huruf besar-kecil tidak konsisten
  • Ada duplikasi
  • Nilai kosong
  • Harga negatif

Data Cleaning Menggunakan Excel

Excel adalah tools yang sangat cocok untuk pemula.

1. Menghapus Duplikasi

Langkah:

  1. Blok seluruh tabel
  2. Klik Data → Remove Duplicates
  3. Pilih semua kolom
  4. Klik OK

2. Menyamakan Format Tanggal

Gunakan format standar: YYYY-MM-DD

Langkah:

  1. Blok kolom tanggal
  2. Klik Format Cells
  3. Pilih Date
  4. Pilih format yang sama

3. Mengubah Huruf Menjadi Konsisten

Gunakan fungsi:

  • =UPPER(A1) → Huruf besar semua
  • =LOWER(A1) → Huruf kecil semua
  • =PROPER(A1) → Huruf awal besar

Contoh:

=PROPER(C2)

4. Mengisi Data Kosong

Ada beberapa cara:

  • Menghapus baris
  • Mengisi dengan rata-rata
  • Mengisi dengan nilai default

Misalnya:

=IF(ISBLANK(A2),"Tidak Diketahui",A2)

5. Memastikan Total = Harga × Jumlah

Gunakan rumus:

=E2*F2

Ini penting agar data konsisten.


Data Cleaning Menggunakan Python

Sekarang kita lakukan hal yang sama menggunakan Python.

Import Library

import pandas as pd

Load Data

df = pd.read_csv("data_penjualan.csv")

Melihat Data

df.head()

Menghapus Duplikasi

df = df.drop_duplicates()

Mengubah Format Tanggal

df['Tanggal'] = pd.to_datetime(df['Tanggal'])

Menangani Missing Value

Cek data kosong:

df.isnull().sum()

Mengisi data kosong:

df['Produk'] = df['Produk'].fillna("Tidak Diketahui")

Menghilangkan Nilai Tidak Masuk Akal

Misalnya harga negatif:

df = df[df['Harga'] > 0]

Menyamakan Format Teks

df['Produk'] = df['Produk'].str.title()
df['Kategori'] = df['Kategori'].str.title()

Apa Itu Analisis Deskriptif?

Analisis deskriptif adalah analisis untuk menjelaskan data secara ringkas.

Tujuannya:

  • Mengetahui gambaran umum data
  • Mencari pola awal
  • Mengetahui nilai ekstrem
  • Menyederhanakan informasi

Statistik Dasar dalam Analisis Deskriptif

Beberapa ukuran statistik yang sering digunakan:

  1. Mean (Rata-rata)
  2. Median (Nilai tengah)
  3. Modus (Nilai yang sering muncul)
  4. Minimum
  5. Maksimum
  6. Standar deviasi

Analisis Deskriptif di Excel

1. Menghitung Total Penjualan

=SUM(G2:G100)

2. Rata-Rata Penjualan

=AVERAGE(G2:G100)

3. Penjualan Tertinggi dan Terendah

=MAX(G2:G100)
=MIN(G2:G100)

4. Jumlah Transaksi

=COUNT(A2:A100)

5. Pivot Table

Pivot Table sangat penting untuk data analyst.

Langkah:

  1. Klik Insert → Pivot Table
  2. Pilih data
  3. Tarik kolom sesuai kebutuhan

Contoh:

  • Baris: Produk
  • Values: Total (SUM)

Hasilnya:

ProdukTotal Penjualan
Sepatu1.500.000
Kaos800.000
Kopi600.000

Analisis Deskriptif Menggunakan Python

Statistik Dasar

df.describe()

Total Penjualan

df['Total'].sum()

Rata-Rata

df['Total'].mean()

Maksimum dan Minimum

df['Total'].max()
df['Total'].min()

Produk Terlaris

df.groupby('Produk')['Jumlah'].sum().sort_values(ascending=False)

Interpretasi Hasil

Misalnya kita menemukan:

  • Produk terlaris: Sepatu
  • Hari tersibuk: Sabtu
  • Metode bayar paling sering: E-Wallet
  • Rata-rata transaksi: Rp150.000

Artinya:

  • Kita bisa fokus promosi pada sepatu
  • Diskon weekend
  • Optimalkan e-wallet

Inilah yang disebut insight.

Fungsi Matematika Dasar dalam Data Analyst (Mean, Median, Growth, Persentase, dan Analisis Tren)

Pada bagian sebelumnya, kamu sudah belajar tentang data cleaning dan analisis deskriptif menggunakan Excel dan Python. Sekarang kita akan masuk ke inti dari pekerjaan seorang data analyst, yaitu menggunakan fungsi matematika untuk memahami pola, perubahan, dan makna dari data.

Banyak orang mengira data analyst harus jago matematika tingkat tinggi. Faktanya, yang paling sering digunakan justru matematika dasar seperti:

  • Rata-rata (mean)
  • Nilai tengah (median)
  • Modus
  • Persentase
  • Pertumbuhan (growth)
  • Perubahan dari waktu ke waktu (tren)

Namun, yang terpenting bukan hanya menghitung, tetapi menafsirkan hasilnya.


1. Mean (Rata-rata)

Apa Itu Mean?

Mean adalah nilai rata-rata dari sekumpulan data.

Rumus:Mean=Total NilaiJumlah Data\text{Mean} = \frac{\text{Total Nilai}}{\text{Jumlah Data}}Mean=Jumlah DataTotal Nilai​

Contoh:
Data penjualan: 100.000, 200.000, 300.000Mean=100.000+200.000+300.0003=200.000\text{Mean} = \frac{100.000 + 200.000 + 300.000}{3} = 200.000Mean=3100.000+200.000+300.000​=200.000


Mean di Excel

Gunakan fungsi:

=AVERAGE(G2:G100)

Mean di Python

df['Total'].mean()

Interpretasi Mean

Jika rata-rata transaksi = Rp150.000, artinya secara umum pelanggan menghabiskan Rp150.000 per transaksi.

Namun, hati-hati: mean bisa bias jika ada nilai ekstrem (outlier).


2. Median

Apa Itu Median?

Median adalah nilai tengah dari data yang sudah diurutkan.

Contoh:
Data: 100, 200, 300
Median = 200

Data: 100, 200, 300, 400
Median = (200 + 300) / 2 = 250


Median di Excel

=MEDIAN(G2:G100)

Median di Python

df['Total'].median()

Kapan Menggunakan Median?

Median lebih cocok jika data memiliki nilai ekstrem.

Contoh:
Transaksi: 50k, 60k, 70k, 5 juta

Mean = bias
Median = lebih realistis


3. Modus

Apa Itu Modus?

Modus adalah nilai yang paling sering muncul.

Contoh:
Data: 100, 200, 200, 300
Modus = 200


Modus di Excel

=MODE(G2:G100)

Modus di Python

df['Total'].mode()

Interpretasi Modus

Modus menunjukkan transaksi yang paling sering terjadi.


4. Persentase

Persentase sangat sering digunakan dalam dunia bisnis.

Rumus Dasar

Persentase=BagianTotal×100%\text{Persentase} = \frac{\text{Bagian}}{\text{Total}} \times 100\%Persentase=TotalBagian​×100%


Contoh Kasus

Total penjualan = Rp10.000.000
Penjualan sepatu = Rp2.500.0002.500.00010.000.000×100%=25%\frac{2.500.000}{10.000.000} \times 100\% = 25\%10.000.0002.500.000​×100%=25%

Artinya, sepatu menyumbang 25% dari total penjualan.


Persentase di Excel

=(B2/B10)*100

Atau format cell ke persen.


Persentase di Python

(df['Total'] / df['Total'].sum()) * 100

5. Growth Rate (Pertumbuhan)

Growth sangat penting untuk melihat perkembangan bisnis.

Rumus Growth

Growth=Nilai Baru−Nilai LamaNilai Lama×100%\text{Growth} = \frac{\text{Nilai Baru} – \text{Nilai Lama}}{\text{Nilai Lama}} \times 100\%Growth=Nilai LamaNilai Baru−Nilai Lama​×100%


Contoh

Penjualan Januari = 5 juta
Penjualan Februari = 7 juta7−55×100%=40%\frac{7 – 5}{5} \times 100\% = 40\%57−5​×100%=40%

Artinya ada kenaikan 40%.


Growth di Excel

Jika Januari di A2 dan Februari di B2:

=(B2-A2)/A2*100

Growth di Python

df['Growth'] = df['Total'].pct_change() * 100

6. Analisis Tren

Apa Itu Tren?

Tren adalah pola perubahan data dari waktu ke waktu.

Jenis tren:

  • Naik (uptrend)
  • Turun (downtrend)
  • Stabil
  • Musiman (seasonal)

Contoh Tren Penjualan

BulanPenjualan
Jan5.000.000
Feb6.000.000
Mar7.500.000
Apr8.000.000

Terlihat tren naik.


Tren di Excel

Gunakan Line Chart:

  1. Blok data
  2. Insert → Line Chart

Tren di Python

import matplotlib.pyplot as plt

plt.plot(df['Tanggal'], df['Total'])
plt.show()

7. Moving Average

Moving average digunakan untuk menghaluskan fluktuasi.

Contoh

Rata-rata 3 hari:Hari1+Hari2+Hari33\frac{Hari1 + Hari2 + Hari3}{3}3Hari1+Hari2+Hari3​


Moving Average di Python

df['MA_3'] = df['Total'].rolling(window=3).mean()

8. Menggabungkan Semua dalam Analisis Nyata

Misalnya kita menemukan:

  • Mean transaksi = Rp150.000
  • Median = Rp120.000
  • Modus = Rp100.000
  • Growth bulan ini = 25%
  • Tren = naik

Interpretasi:

  • Mayoritas pelanggan belanja sekitar Rp100–120 ribu
  • Ada sedikit transaksi besar yang menaikkan mean
  • Bisnis sedang berkembang

9. Kesalahan Umum Pemula

❌ Mengandalkan satu metrik saja
❌ Tidak melihat tren
❌ Tidak mengaitkan dengan konteks bisnis
❌ Tidak memeriksa outlier

SQL untuk Data Analyst – Full Praktik Query dengan Studi Kasus Penjualan

Pada bagian ini, kita akan masuk ke salah satu skill wajib bagi seorang Data Analyst, yaitu SQL (Structured Query Language). SQL digunakan untuk mengambil, memfilter, mengelompokkan, dan menganalisis data yang tersimpan dalam database.

Di dunia nyata, hampir semua perusahaan menyimpan data dalam bentuk database, bukan Excel. Karena itu, kemampuan SQL sangat penting.


1. Apa Itu SQL?

SQL adalah bahasa yang digunakan untuk:

  • Mengambil data dari database
  • Menyaring data
  • Mengelompokkan data
  • Menghitung statistik
  • Menggabungkan tabel
  • Membuat laporan

Contoh penggunaan SQL:

  • Menampilkan semua data penjualan
  • Menghitung total penjualan per bulan
  • Mencari produk terlaris
  • Menghitung rata-rata transaksi

2. Struktur Tabel Penjualan

Kita akan menggunakan tabel ini:

CREATE TABLE penjualan (
    OrderID INT,
    Tanggal DATE,
    Produk VARCHAR(100),
    Kategori VARCHAR(50),
    Harga INT,
    Jumlah INT,
    Total INT,
    MetodeBayar VARCHAR(50)
);

3. Memasukkan Data (INSERT)

INSERT INTO penjualan VALUES
(1, '2024-01-01', 'Sepatu', 'Fashion', 250000, 2, 500000, 'Transfer'),
(2, '2024-01-01', 'Kaos', 'Fashion', 100000, 1, 100000, 'E-Wallet'),
(3, '2024-01-02', 'Headset', 'Elektronik', 300000, 1, 300000, 'COD'),
(4, '2024-01-02', 'Kopi', 'Makanan', 20000, 5, 100000, 'Cash'),
(5, '2024-01-03', 'Sepatu', 'Fashion', 250000, 1, 250000, 'Transfer'),
(6, '2024-01-03', 'Kopi', 'Makanan', 20000, 10, 200000, 'Cash');

4. SELECT – Menampilkan Data

Menampilkan Semua Data

SELECT * FROM penjualan;

Menampilkan Kolom Tertentu

SELECT Produk, Total FROM penjualan;

5. WHERE – Filter Data

Menampilkan Data Kategori Fashion

SELECT * FROM penjualan
WHERE Kategori = 'Fashion';

Menampilkan Transaksi di Atas 200.000

SELECT * FROM penjualan
WHERE Total > 200000;

Menampilkan Transaksi di Tanggal Tertentu

SELECT * FROM penjualan
WHERE Tanggal = '2024-01-01';

6. ORDER BY – Mengurutkan Data

Urutkan dari Terbesar ke Terkecil

SELECT * FROM penjualan
ORDER BY Total DESC;

Urutkan dari Terkecil ke Terbesar

SELECT * FROM penjualan
ORDER BY Total ASC;

7. GROUP BY – Pengelompokan Data

Ini adalah fitur paling penting untuk data analyst.


Total Penjualan per Produk

SELECT Produk, SUM(Total) AS TotalPenjualan
FROM penjualan
GROUP BY Produk;

Total Penjualan per Kategori

SELECT Kategori, SUM(Total) AS TotalKategori
FROM penjualan
GROUP BY Kategori;

Jumlah Transaksi per Metode Bayar

SELECT MetodeBayar, COUNT(*) AS JumlahTransaksi
FROM penjualan
GROUP BY MetodeBayar;

8. Fungsi Agregat SQL

SUM

SELECT SUM(Total) FROM penjualan;

AVG

SELECT AVG(Total) FROM penjualan;

MAX dan MIN

SELECT MAX(Total) FROM penjualan;
SELECT MIN(Total) FROM penjualan;

COUNT

SELECT COUNT(*) FROM penjualan;

9. HAVING – Filter Setelah GROUP BY

Misalnya kita hanya ingin produk dengan total penjualan di atas 300.000:

SELECT Produk, SUM(Total) AS TotalPenjualan
FROM penjualan
GROUP BY Produk
HAVING SUM(Total) > 300000;

10. Analisis Tren dengan SQL

Total Penjualan per Hari

SELECT Tanggal, SUM(Total) AS TotalHarian
FROM penjualan
GROUP BY Tanggal
ORDER BY Tanggal;

Total Penjualan per Bulan

SELECT MONTH(Tanggal) AS Bulan, SUM(Total) AS TotalBulanan
FROM penjualan
GROUP BY MONTH(Tanggal);

11. Studi Kasus Nyata

Sekarang kita jawab beberapa pertanyaan bisnis:


1. Produk Apa yang Paling Laris?

SELECT Produk, SUM(Jumlah) AS TotalTerjual
FROM penjualan
GROUP BY Produk
ORDER BY TotalTerjual DESC;

2. Produk dengan Omset Tertinggi

SELECT Produk, SUM(Total) AS Omset
FROM penjualan
GROUP BY Produk
ORDER BY Omset DESC;

3. Kategori Terbaik

SELECT Kategori, SUM(Total) AS TotalKategori
FROM penjualan
GROUP BY Kategori
ORDER BY TotalKategori DESC;

4. Metode Pembayaran Favorit

SELECT MetodeBayar, COUNT(*) AS Jumlah
FROM penjualan
GROUP BY MetodeBayar
ORDER BY Jumlah DESC;

12. Menghitung Growth dengan SQL

Misalnya kita ingin melihat perubahan harian:

SELECT 
    Tanggal,
    SUM(Total) AS TotalHarian,
    LAG(SUM(Total)) OVER (ORDER BY Tanggal) AS HariSebelumnya
FROM penjualan
GROUP BY Tanggal;

Jika database mendukung window function, kita bisa lanjutkan:

SELECT 
    Tanggal,
    TotalHarian,
    ((TotalHarian - HariSebelumnya) / HariSebelumnya) * 100 AS Growth
FROM (
    SELECT 
        Tanggal,
        SUM(Total) AS TotalHarian,
        LAG(SUM(Total)) OVER (ORDER BY Tanggal) AS HariSebelumnya
    FROM penjualan
    GROUP BY Tanggal
) t;

13. Interpretasi Hasil SQL

Misalnya hasil menunjukkan:

  • Produk terlaris: Kopi
  • Omset terbesar: Sepatu
  • Metode bayar favorit: Cash
  • Tren: Meningkat

Maka insight:

  • Kopi sering dibeli, tapi murah
  • Sepatu jarang dibeli, tapi mahal
  • Promosi e-wallet bisa ditingkatkan
  • Bisnis berkembang

Analisis Data dengan Python, Visualisasi, Insight Bisnis, dan Kesimpulan

Di bagian terakhir ini, kita akan menggunakan Python untuk melakukan analisis lanjutan dan membuat visualisasi data. Inilah tahap di mana seorang data analyst benar-benar mengubah angka menjadi cerita yang mudah dipahami.

Kita akan menggunakan:

  • pandas → pengolahan data
  • numpy → perhitungan numerik
  • matplotlib → visualisasi

1. Mengapa Python Penting untuk Data Analyst?

Excel sangat bagus untuk pemula, dan SQL sangat kuat untuk mengambil data. Namun Python memiliki keunggulan:

✅ Bisa menangani data sangat besar
✅ Otomatisasi analisis
✅ Visualisasi fleksibel
✅ Statistik lanjutan
✅ Machine learning (lanjutan)

Karena itu, Python adalah skill wajib data analyst modern.


2. Persiapan Data

Import Library

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

Load Dataset

df = pd.read_csv("data_penjualan.csv")

Melihat Data

df.head()

Informasi Dataset

df.info()

3. Analisis Deskriptif dengan Python

Statistik Dasar

df.describe()

Total Penjualan

total_penjualan = df['Total'].sum()
print(total_penjualan)

Rata-Rata Transaksi

rata_rata = df['Total'].mean()
print(rata_rata)

Transaksi Terbesar & Terkecil

df['Total'].max()
df['Total'].min()

4. Analisis Produk Terlaris

Berdasarkan Jumlah

produk_terlaris = df.groupby('Produk')['Jumlah'].sum().sort_values(ascending=False)
print(produk_terlaris)

Berdasarkan Omset

omset_produk = df.groupby('Produk')['Total'].sum().sort_values(ascending=False)
print(omset_produk)

5. Analisis Kategori

kategori_omset = df.groupby('Kategori')['Total'].sum()
print(kategori_omset)

6. Analisis Metode Pembayaran

metode_bayar = df['MetodeBayar'].value_counts()
print(metode_bayar)

7. Analisis Tren Waktu

Pastikan kolom tanggal sudah dalam format datetime:

df['Tanggal'] = pd.to_datetime(df['Tanggal'])

Total Penjualan per Hari

harian = df.groupby('Tanggal')['Total'].sum()
print(harian)

8. Visualisasi Data

Visualisasi membantu kita melihat pola dengan cepat.


1. Grafik Penjualan Harian

plt.figure()
plt.plot(harian.index, harian.values)
plt.xlabel("Tanggal")
plt.ylabel("Total Penjualan")
plt.title("Tren Penjualan Harian")
plt.show()

2. Produk Terlaris (Bar Chart)

produk_terlaris.plot(kind='bar')
plt.title("Produk Terlaris")
plt.xlabel("Produk")
plt.ylabel("Jumlah Terjual")
plt.show()

3. Omset per Kategori

kategori_omset.plot(kind='bar')
plt.title("Omset per Kategori")
plt.xlabel("Kategori")
plt.ylabel("Total Penjualan")
plt.show()

4. Metode Pembayaran

metode_bayar.plot(kind='bar')
plt.title("Metode Pembayaran")
plt.xlabel("Metode")
plt.ylabel("Jumlah Transaksi")
plt.show()

9. Menghitung Growth di Python

harian_growth = harian.pct_change() * 100
print(harian_growth)

10. Moving Average

harian_ma = harian.rolling(window=3).mean()

Visualisasi Moving Average

plt.figure()
plt.plot(harian.index, harian.values)
plt.plot(harian_ma.index, harian_ma.values)
plt.title("Tren dengan Moving Average")
plt.show()

11. Menarik Insight dari Data

Ini adalah bagian paling penting. Data analyst tidak hanya menghitung, tapi menjelaskan arti data.

Contoh Insight:

  1. Produk paling sering dibeli: Kopi
  2. Produk dengan omset terbesar: Sepatu
  3. Metode bayar favorit: Cash
  4. Tren penjualan: Meningkat
  5. Rata-rata transaksi: Rp120.000

12. Contoh Rekomendasi Bisnis

Dari insight di atas, kita bisa menyarankan:

📌 Fokus stok kopi karena sering dibeli
📌 Promosi sepatu karena margin tinggi
📌 Optimalkan metode cashless
📌 Buat promo saat tren menurun
📌 Paket bundling untuk menaikkan nilai transaksi

Inilah inti dari pekerjaan data analyst:
Data → Analisis → Insight → Keputusan


13. Workflow Lengkap yang Sudah Kamu Pelajari

Dalam artikel ini, kamu sudah mempelajari:

  1. Memahami data
  2. Membersihkan data
  3. Statistik dasar
  4. Matematika data analyst
  5. SQL query
  6. Analisis Python
  7. Visualisasi
  8. Insight
  9. Rekomendasi

Ini adalah alur kerja data analyst profesional.


14. Kesalahan Umum Pemula

  1. Terlalu fokus ke rumus
  2. Tidak melihat konteks bisnis
  3. Tidak membersihkan data
  4. Tidak membuat visualisasi
  5. Tidak menarik kesimpulan

15. Langkah Selanjutnya Setelah Artikel Ini

Jika kamu ingin benar-benar menjadi data analyst, lakukan ini:

  1. Latihan dengan dataset lain
  2. Upload hasil ke GitHub
  3. Buat portfolio
  4. Coba Kaggle
  5. Pelajari dashboard (Power BI / Tableau)

Kesimpulan

Menjadi seorang data analyst bukan hanya tentang menghitung angka, tetapi tentang mengubah data menjadi cerita yang membantu pengambilan keputusan.

Dalam artikel ini, kamu telah belajar:

✅ Dasar data analyst
✅ Data cleaning
✅ Statistik dasar
✅ Fungsi matematika
✅ SQL
✅ Python
✅ Visualisasi
✅ Insight bisnis

Dengan latihan rutin, kamu bisa berkembang dari pemula menjadi data analyst yang andal.

Tags: analisis dataanalisis penjualananalisis trenbelajar databelajar data analystbelajar excelBelajar pythonbelajar sqlbisnis berbasis datadata analysisdata analystdata analyst pemuladata cleaningdata drivendata science dasarData Visualizationedusoft centerexcel untuk data analystgrowth ratekursus komputer solomean median moduspemula belajar dataportfolio data analystpython untuk data analystsql untuk data analyststatistik dasarstudi kasus penjualantutorial data analysttutorial excel sql pythonvisualisasi data
Previous Post
Next Post

Post comment

Cancel reply

Your email address will not be published. Required fields are marked *

Recent Posts

  • 🧹 Panduan Praktis Data Cleaning Menggunakan Python Menggunakan VS Code
  • Integrasi Google Spreadsheet, AppSheet, dan Google Apps Script dalam Pembangunan Sistem Jadwal Kampus
  • Panduan Lengkap Google Spreadsheet, Google Scripts Dan AppSheet
  • Pembersihan Data Transaksi Menggunakan OpenRefine
  • Cara Membersihkan Data Menggunakan CMD dan SQL untuk Analisis Data

Arsip

  • February 2026
  • January 2026
  • September 2025
  • August 2025
  • July 2025
  • March 2019
  • February 2019
  • January 2019
  • December 2018
  • November 2018
  • October 2018
  • September 2018
  • August 2018
  • July 2018
  • June 2018
  • May 2018
  • April 2018
  • March 2018
  • February 2018
  • January 2018
  • December 2017
  • November 2017
  • October 2017
  • September 2017
  • August 2017
  • July 2017
  • June 2017
  • May 2017
  • April 2017
  • March 2017
  • February 2017
  • January 2017
  • December 2016
  • November 2016
  • October 2016
  • September 2016
  • August 2016
  • July 2016
  • June 2016
  • May 2016
  • April 2016
  • March 2016
  • February 2016
  • January 2016
  • December 2015
  • November 2015
  • October 2015
  • September 2015
  • August 2015
  • July 2015
  • June 2015
  • May 2015
  • April 2015
  • March 2015
  • February 2015
  • January 2015
  • December 2014
  • November 2014
  • October 2014
  • September 2014
  • August 2014
  • July 2014
  • June 2014
  • May 2014
  • April 2014
  • March 2014
  • February 2014
  • January 2014
  • December 2013
  • November 2013
  • October 2013
  • September 2013
  • August 2013
  • July 2013
  • June 2013
  • May 2013
  • April 2013
  • March 2013
  • February 2013
  • January 2013
  • December 2012
  • November 2012
  • October 2012
  • September 2012
  • August 2012
  • July 2012
  • June 2012
  • May 2012
  • April 2012
  • December 2011
  • November 2011

Tags

#EdusoftCenter apache web server dns server kursus android kursus database kursus dns dan web server kursus dns server kursus ethical hacking kursus hacking kursus jaringan kursus jaringan linux Kursus Komputer kursus komputer di solo kursus komputer di solo / surakarta kursus komputer di surakarta kursus linux Kursus Linux Forensics kursus linux networking kursus linux security kursus linux server kursus mikrotik kursus networking kursus network security kursus php Kursus PHP dan MySQL kursus php mysql kursus proxy kursus security kursus ubuntu kursus ubuntu server kursus web kursus web security kursus web server kursus wordpress kursus wordpress theme linux MySQL pelatihan komputer di solo PHP security training komputer training komputer di solo tutorial php ubuntu wordpress

© Edusoft Center - Kursus Komputer di Solo | 2010 - 2025 | Privacy Policy | Site Map

All Right Reserved

WhatsApp us