- Pendahuluan
- Apa Itu Data Analyst?
- Mengapa Harus Belajar Data Analyst?
- Apa Itu Data?
- Jenis-Jenis Data dalam Data Analyst
- Pengenalan Studi Kasus: Dataset Penjualan
- Apa Itu Data Cleaning?
- Tools yang Akan Digunakan
- Alur Kerja Data Analyst
- Apa Itu Data Cleaning?
- Contoh Dataset Mentah
- Data Cleaning Menggunakan Excel
- Data Cleaning Menggunakan Python
- Apa Itu Analisis Deskriptif?
- Statistik Dasar dalam Analisis Deskriptif
- Analisis Deskriptif di Excel
- Analisis Deskriptif Menggunakan Python
- Interpretasi Hasil
- 1. Mean (Rata-rata)
- 2. Median
- 3. Modus
- 4. Persentase
- 5. Growth Rate (Pertumbuhan)
- 6. Analisis Tren
- 7. Moving Average
- 8. Menggabungkan Semua dalam Analisis Nyata
- 9. Kesalahan Umum Pemula
- 1. Apa Itu SQL?
- 2. Struktur Tabel Penjualan
- 3. Memasukkan Data (INSERT)
- 4. SELECT – Menampilkan Data
- 5. WHERE – Filter Data
- 6. ORDER BY – Mengurutkan Data
- 7. GROUP BY – Pengelompokan Data
- 8. Fungsi Agregat SQL
- 9. HAVING – Filter Setelah GROUP BY
- 10. Analisis Tren dengan SQL
- 11. Studi Kasus Nyata
- 12. Menghitung Growth dengan SQL
- 13. Interpretasi Hasil SQL
- 1. Mengapa Python Penting untuk Data Analyst?
- 2. Persiapan Data
- 3. Analisis Deskriptif dengan Python
- 4. Analisis Produk Terlaris
- 5. Analisis Kategori
- 6. Analisis Metode Pembayaran
- 7. Analisis Tren Waktu
- 8. Visualisasi Data
- 9. Menghitung Growth di Python
- 10. Moving Average
- 11. Menarik Insight dari Data
- 12. Contoh Rekomendasi Bisnis
- 13. Workflow Lengkap yang Sudah Kamu Pelajari
- 14. Kesalahan Umum Pemula
- 15. Langkah Selanjutnya Setelah Artikel Ini
- Kesimpulan
Pendahuluan
Di era digital saat ini, data menjadi aset yang sangat berharga. Setiap aktivitas manusia—mulai dari belanja online, menonton video, menggunakan media sosial, hingga melakukan transaksi di toko—semuanya menghasilkan data. Namun, data mentah saja tidak akan memberikan manfaat jika tidak diolah dengan benar. Di sinilah peran seorang Data Analyst menjadi sangat penting.
Seorang Data Analyst bertugas mengolah data mentah menjadi informasi yang bermakna, kemudian mengubahnya menjadi insight yang dapat membantu pengambilan keputusan. Misalnya, dari data penjualan, seorang data analyst dapat menentukan produk apa yang paling laku, kapan waktu penjualan tertinggi, dan strategi apa yang bisa meningkatkan keuntungan.
Artikel ini dibuat khusus untuk pemula yang ingin belajar menjadi data analyst dari nol. Kamu akan mempelajari konsep dasar sekaligus praktik langsung menggunakan:
- Excel untuk pengolahan data
- SQL untuk mengambil data dari database
- Python untuk analisis lanjutan dan visualisasi
Sebagai studi kasus, kita akan menggunakan dataset penjualan, karena mudah dipahami dan sering digunakan dalam dunia bisnis nyata.
Apa Itu Data Analyst?
Data Analyst adalah seseorang yang bertugas mengumpulkan, membersihkan, mengolah, menganalisis, dan menyajikan data agar bisa dipahami oleh pihak lain, terutama untuk membantu pengambilan keputusan.
Tugas utama seorang Data Analyst antara lain:
- Mengumpulkan data dari berbagai sumber
- Membersihkan data (data cleaning)
- Mengolah data menjadi bentuk yang siap dianalisis
- Melakukan analisis statistik dan matematis
- Membuat visualisasi data
- Menarik kesimpulan dan rekomendasi
Contoh penerapan nyata:
- Menentukan produk paling laris
- Menganalisis tren penjualan bulanan
- Memprediksi peningkatan atau penurunan omset
- Menentukan strategi promosi
Dalam artikel ini, kamu akan belajar bagaimana melakukan semua langkah tersebut secara bertahap.
Mengapa Harus Belajar Data Analyst?
Ada beberapa alasan mengapa profesi Data Analyst sangat diminati:
1. Dibutuhkan di Banyak Industri
Hampir semua industri membutuhkan data analyst, mulai dari:
- E-commerce
- Perbankan
- Pendidikan
- Kesehatan
- Startup
- Pemerintahan
2. Gaji yang Kompetitif
Karena perannya yang penting, profesi ini biasanya memiliki gaji yang cukup tinggi, bahkan untuk level pemula.
3. Bisa Dipelajari oleh Siapa Saja
Kamu tidak harus lulusan IT untuk menjadi data analyst. Dengan pemahaman logika, matematika dasar, dan kemauan belajar, siapa pun bisa memulai.
4. Cocok untuk yang Suka Logika dan Analisis
Jika kamu suka berpikir logis, memecahkan masalah, dan melihat pola, profesi ini sangat cocok.
Apa Itu Data?
Sebelum masuk ke analisis, kita harus memahami apa itu data.
Data adalah kumpulan fakta, angka, teks, atau informasi mentah yang belum diolah. Contohnya:
- Nama pelanggan
- Harga produk
- Jumlah transaksi
- Tanggal pembelian
- Metode pembayaran
Data ini sendiri belum bermakna sampai kita mengolah dan menganalisisnya.
Jenis-Jenis Data dalam Data Analyst
Dalam dunia data, ada beberapa jenis data yang sering digunakan:
1. Data Numerik (Numerical Data)
Data numerik berupa angka dan bisa dihitung secara matematis.
Contoh:
- Harga produk
- Jumlah penjualan
- Diskon
- Total transaksi
Contoh dalam dataset penjualan:
| Harga | Jumlah | Total |
|---|---|---|
| 5000 | 3 | 15000 |
| 10000 | 2 | 20000 |
2. Data Kategorik (Categorical Data)
Data kategorik adalah data berupa kategori atau label.
Contoh:
- Nama produk
- Jenis kelamin
- Metode pembayaran
- Kategori barang
Contoh:
| Produk | Kategori |
|---|---|
| Sepatu | Fashion |
| Laptop | Elektronik |
| Kopi | Makanan |
3. Data Time Series
Data yang berhubungan dengan waktu.
Contoh:
- Penjualan per hari
- Penjualan per bulan
- Omset per tahun
Contoh:
| Tanggal | Penjualan |
|---|---|
| 2024-01-01 | 500000 |
| 2024-01-02 | 650000 |
| 2024-01-03 | 700000 |
4. Data Primer dan Sekunder
Data primer: Data yang dikumpulkan langsung
Contoh: survei pelanggan
Data sekunder: Data dari sumber lain
Contoh: laporan penjualan, data dari website
Pengenalan Studi Kasus: Dataset Penjualan
Dalam artikel ini, kita akan menggunakan dataset penjualan sederhana agar mudah dipahami oleh pemula.
Struktur Dataset
Misalnya, kita punya dataset dengan struktur seperti ini:
| OrderID | Tanggal | Produk | Kategori | Harga | Jumlah | Total | MetodeBayar |
|---|---|---|---|---|---|---|---|
| 1 | 2024-01-01 | Sepatu | Fashion | 250000 | 2 | 500000 | Transfer |
| 2 | 2024-01-01 | Kaos | Fashion | 100000 | 1 | 100000 | E-Wallet |
| 3 | 2024-01-02 | Headset | Elektronik | 300000 | 1 | 300000 | COD |
| 4 | 2024-01-02 | Kopi | Makanan | 20000 | 5 | 100000 | Cash |
Penjelasan Setiap Kolom
- OrderID → ID unik transaksi
- Tanggal → Waktu transaksi
- Produk → Nama barang
- Kategori → Jenis barang
- Harga → Harga satuan
- Jumlah → Banyaknya produk
- Total → Harga × Jumlah
- MetodeBayar → Cara pembayaran
Dataset ini akan kita gunakan untuk:
- Data cleaning
- Statistik dasar
- Analisis tren
- SQL query
- Python analysis
- Visualisasi
Apa Itu Data Cleaning?
Data cleaning adalah proses membersihkan data dari kesalahan, ketidakkonsistenan, dan nilai kosong agar siap dianalisis.
Contoh masalah pada data mentah:
- Ada nilai kosong (missing value)
- Format tanggal tidak konsisten
- Duplikasi data
- Salah ketik nama produk
- Nilai tidak masuk akal (misalnya harga negatif)
Contoh:
| Produk | Harga |
|---|---|
| Sepatu | 250000 |
| sepatu | 250000 |
| Sepatu | -5000 |
| NULL | 100000 |
Data seperti ini harus dibersihkan terlebih dahulu.
Tools yang Akan Digunakan
Dalam artikel ini, kita akan menggunakan tiga tools utama:
1. Excel
Digunakan untuk:
- Mengedit data
- Menghapus duplikasi
- Menghitung statistik dasar
- Membuat pivot table
- Membuat grafik
2. SQL
Digunakan untuk:
- Mengambil data dari database
- Mengelompokkan data
- Menghitung total, rata-rata
- Filtering data
3. Python
Digunakan untuk:
- Analisis lanjutan
- Statistik
- Visualisasi
- Otomatisasi
Alur Kerja Data Analyst
Sebagai gambaran, alur kerja yang akan kita ikuti:
- Memahami masalah
- Mengumpulkan data
- Membersihkan data
- Analisis deskriptif
- Analisis tren
- Visualisasi
- Menarik insight
- Memberi rekomendasi
Semua langkah ini akan kita praktikkan.
Data Cleaning dan Analisis Deskriptif (Excel & Python)
Pada bagian sebelumnya, kamu sudah memahami apa itu Data Analyst, jenis-jenis data, serta struktur dataset penjualan yang akan kita gunakan. Sekarang, kita akan masuk ke tahap yang sangat penting dalam dunia data, yaitu Data Cleaning dan Analisis Deskriptif.
Tahap ini sering dianggap sepele, padahal dalam praktiknya, sekitar 60–80% waktu seorang data analyst dihabiskan untuk membersihkan data. Tanpa data yang bersih, hasil analisis bisa menyesatkan.
Apa Itu Data Cleaning?
Data Cleaning adalah proses membersihkan data dari kesalahan, ketidakkonsistenan, dan nilai yang tidak valid agar siap dianalisis.
Masalah umum pada data mentah:
- Missing Value (Data Kosong)
Contoh: kolom harga kosong - Duplikasi Data
Data transaksi tercatat dua kali - Format Tidak Konsisten
Contoh:- 01-01-2024
- 2024/01/01
- Jan 1, 2024
- Kesalahan Penulisan (Typo)
Contoh:- Sepatu
- sepatu
- SEPATU
- Nilai Tidak Masuk Akal
Contoh: harga -5000, jumlah = 0
Contoh Dataset Mentah
Misalnya kita punya data seperti ini:
| OrderID | Tanggal | Produk | Kategori | Harga | Jumlah | Total | MetodeBayar |
|---|---|---|---|---|---|---|---|
| 1 | 01-01-2024 | Sepatu | Fashion | 250000 | 2 | 500000 | Transfer |
| 2 | 2024/01/01 | Kaos | Fashion | 100000 | 1 | 100000 | E-Wallet |
| 3 | Jan 2 2024 | headset | elektronik | 300000 | 1 | 300000 | COD |
| 3 | Jan 2 2024 | headset | elektronik | 300000 | 1 | 300000 | COD |
| 4 | 2024-01-02 | NULL | Makanan | -20000 | 5 | -100000 | Cash |
Dari tabel ini kita bisa lihat banyak masalah:
- Format tanggal berbeda
- Huruf besar-kecil tidak konsisten
- Ada duplikasi
- Nilai kosong
- Harga negatif
Data Cleaning Menggunakan Excel
Excel adalah tools yang sangat cocok untuk pemula.
1. Menghapus Duplikasi
Langkah:
- Blok seluruh tabel
- Klik Data → Remove Duplicates
- Pilih semua kolom
- Klik OK
2. Menyamakan Format Tanggal
Gunakan format standar: YYYY-MM-DD
Langkah:
- Blok kolom tanggal
- Klik Format Cells
- Pilih Date
- Pilih format yang sama
3. Mengubah Huruf Menjadi Konsisten
Gunakan fungsi:
=UPPER(A1)→ Huruf besar semua=LOWER(A1)→ Huruf kecil semua=PROPER(A1)→ Huruf awal besar
Contoh:
=PROPER(C2)
4. Mengisi Data Kosong
Ada beberapa cara:
- Menghapus baris
- Mengisi dengan rata-rata
- Mengisi dengan nilai default
Misalnya:
=IF(ISBLANK(A2),"Tidak Diketahui",A2)
5. Memastikan Total = Harga × Jumlah
Gunakan rumus:
=E2*F2
Ini penting agar data konsisten.
Data Cleaning Menggunakan Python
Sekarang kita lakukan hal yang sama menggunakan Python.
Import Library
import pandas as pd
Load Data
df = pd.read_csv("data_penjualan.csv")
Melihat Data
df.head()
Menghapus Duplikasi
df = df.drop_duplicates()
Mengubah Format Tanggal
df['Tanggal'] = pd.to_datetime(df['Tanggal'])
Menangani Missing Value
Cek data kosong:
df.isnull().sum()
Mengisi data kosong:
df['Produk'] = df['Produk'].fillna("Tidak Diketahui")
Menghilangkan Nilai Tidak Masuk Akal
Misalnya harga negatif:
df = df[df['Harga'] > 0]
Menyamakan Format Teks
df['Produk'] = df['Produk'].str.title()
df['Kategori'] = df['Kategori'].str.title()
Apa Itu Analisis Deskriptif?
Analisis deskriptif adalah analisis untuk menjelaskan data secara ringkas.
Tujuannya:
- Mengetahui gambaran umum data
- Mencari pola awal
- Mengetahui nilai ekstrem
- Menyederhanakan informasi
Statistik Dasar dalam Analisis Deskriptif
Beberapa ukuran statistik yang sering digunakan:
- Mean (Rata-rata)
- Median (Nilai tengah)
- Modus (Nilai yang sering muncul)
- Minimum
- Maksimum
- Standar deviasi
Analisis Deskriptif di Excel
1. Menghitung Total Penjualan
=SUM(G2:G100)
2. Rata-Rata Penjualan
=AVERAGE(G2:G100)
3. Penjualan Tertinggi dan Terendah
=MAX(G2:G100)
=MIN(G2:G100)
4. Jumlah Transaksi
=COUNT(A2:A100)
5. Pivot Table
Pivot Table sangat penting untuk data analyst.
Langkah:
- Klik Insert → Pivot Table
- Pilih data
- Tarik kolom sesuai kebutuhan
Contoh:
- Baris: Produk
- Values: Total (SUM)
Hasilnya:
| Produk | Total Penjualan |
|---|---|
| Sepatu | 1.500.000 |
| Kaos | 800.000 |
| Kopi | 600.000 |
Analisis Deskriptif Menggunakan Python
Statistik Dasar
df.describe()
Total Penjualan
df['Total'].sum()
Rata-Rata
df['Total'].mean()
Maksimum dan Minimum
df['Total'].max()
df['Total'].min()
Produk Terlaris
df.groupby('Produk')['Jumlah'].sum().sort_values(ascending=False)
Interpretasi Hasil
Misalnya kita menemukan:
- Produk terlaris: Sepatu
- Hari tersibuk: Sabtu
- Metode bayar paling sering: E-Wallet
- Rata-rata transaksi: Rp150.000
Artinya:
- Kita bisa fokus promosi pada sepatu
- Diskon weekend
- Optimalkan e-wallet
Inilah yang disebut insight.
Fungsi Matematika Dasar dalam Data Analyst (Mean, Median, Growth, Persentase, dan Analisis Tren)
Pada bagian sebelumnya, kamu sudah belajar tentang data cleaning dan analisis deskriptif menggunakan Excel dan Python. Sekarang kita akan masuk ke inti dari pekerjaan seorang data analyst, yaitu menggunakan fungsi matematika untuk memahami pola, perubahan, dan makna dari data.
Banyak orang mengira data analyst harus jago matematika tingkat tinggi. Faktanya, yang paling sering digunakan justru matematika dasar seperti:
- Rata-rata (mean)
- Nilai tengah (median)
- Modus
- Persentase
- Pertumbuhan (growth)
- Perubahan dari waktu ke waktu (tren)
Namun, yang terpenting bukan hanya menghitung, tetapi menafsirkan hasilnya.
1. Mean (Rata-rata)
Apa Itu Mean?
Mean adalah nilai rata-rata dari sekumpulan data.
Rumus:Mean=Jumlah DataTotal Nilai
Contoh:
Data penjualan: 100.000, 200.000, 300.000Mean=3100.000+200.000+300.000=200.000
Mean di Excel
Gunakan fungsi:
=AVERAGE(G2:G100)
Mean di Python
df['Total'].mean()
Interpretasi Mean
Jika rata-rata transaksi = Rp150.000, artinya secara umum pelanggan menghabiskan Rp150.000 per transaksi.
Namun, hati-hati: mean bisa bias jika ada nilai ekstrem (outlier).
2. Median
Apa Itu Median?
Median adalah nilai tengah dari data yang sudah diurutkan.
Contoh:
Data: 100, 200, 300
Median = 200
Data: 100, 200, 300, 400
Median = (200 + 300) / 2 = 250
Median di Excel
=MEDIAN(G2:G100)
Median di Python
df['Total'].median()
Kapan Menggunakan Median?
Median lebih cocok jika data memiliki nilai ekstrem.
Contoh:
Transaksi: 50k, 60k, 70k, 5 juta
Mean = bias
Median = lebih realistis
3. Modus
Apa Itu Modus?
Modus adalah nilai yang paling sering muncul.
Contoh:
Data: 100, 200, 200, 300
Modus = 200
Modus di Excel
=MODE(G2:G100)
Modus di Python
df['Total'].mode()
Interpretasi Modus
Modus menunjukkan transaksi yang paling sering terjadi.
4. Persentase
Persentase sangat sering digunakan dalam dunia bisnis.
Rumus Dasar
Persentase=TotalBagian×100%
Contoh Kasus
Total penjualan = Rp10.000.000
Penjualan sepatu = Rp2.500.00010.000.0002.500.000×100%=25%
Artinya, sepatu menyumbang 25% dari total penjualan.
Persentase di Excel
=(B2/B10)*100
Atau format cell ke persen.
Persentase di Python
(df['Total'] / df['Total'].sum()) * 100
5. Growth Rate (Pertumbuhan)
Growth sangat penting untuk melihat perkembangan bisnis.
Rumus Growth
Growth=Nilai LamaNilai Baru−Nilai Lama×100%
Contoh
Penjualan Januari = 5 juta
Penjualan Februari = 7 juta57−5×100%=40%
Artinya ada kenaikan 40%.
Growth di Excel
Jika Januari di A2 dan Februari di B2:
=(B2-A2)/A2*100
Growth di Python
df['Growth'] = df['Total'].pct_change() * 100
6. Analisis Tren
Apa Itu Tren?
Tren adalah pola perubahan data dari waktu ke waktu.
Jenis tren:
- Naik (uptrend)
- Turun (downtrend)
- Stabil
- Musiman (seasonal)
Contoh Tren Penjualan
| Bulan | Penjualan |
|---|---|
| Jan | 5.000.000 |
| Feb | 6.000.000 |
| Mar | 7.500.000 |
| Apr | 8.000.000 |
Terlihat tren naik.
Tren di Excel
Gunakan Line Chart:
- Blok data
- Insert → Line Chart
Tren di Python
import matplotlib.pyplot as plt
plt.plot(df['Tanggal'], df['Total'])
plt.show()
7. Moving Average
Moving average digunakan untuk menghaluskan fluktuasi.
Contoh
Rata-rata 3 hari:3Hari1+Hari2+Hari3
Moving Average di Python
df['MA_3'] = df['Total'].rolling(window=3).mean()
8. Menggabungkan Semua dalam Analisis Nyata
Misalnya kita menemukan:
- Mean transaksi = Rp150.000
- Median = Rp120.000
- Modus = Rp100.000
- Growth bulan ini = 25%
- Tren = naik
Interpretasi:
- Mayoritas pelanggan belanja sekitar Rp100–120 ribu
- Ada sedikit transaksi besar yang menaikkan mean
- Bisnis sedang berkembang
9. Kesalahan Umum Pemula
❌ Mengandalkan satu metrik saja
❌ Tidak melihat tren
❌ Tidak mengaitkan dengan konteks bisnis
❌ Tidak memeriksa outlier
SQL untuk Data Analyst – Full Praktik Query dengan Studi Kasus Penjualan
Pada bagian ini, kita akan masuk ke salah satu skill wajib bagi seorang Data Analyst, yaitu SQL (Structured Query Language). SQL digunakan untuk mengambil, memfilter, mengelompokkan, dan menganalisis data yang tersimpan dalam database.
Di dunia nyata, hampir semua perusahaan menyimpan data dalam bentuk database, bukan Excel. Karena itu, kemampuan SQL sangat penting.
1. Apa Itu SQL?
SQL adalah bahasa yang digunakan untuk:
- Mengambil data dari database
- Menyaring data
- Mengelompokkan data
- Menghitung statistik
- Menggabungkan tabel
- Membuat laporan
Contoh penggunaan SQL:
- Menampilkan semua data penjualan
- Menghitung total penjualan per bulan
- Mencari produk terlaris
- Menghitung rata-rata transaksi
2. Struktur Tabel Penjualan
Kita akan menggunakan tabel ini:

CREATE TABLE penjualan (
OrderID INT,
Tanggal DATE,
Produk VARCHAR(100),
Kategori VARCHAR(50),
Harga INT,
Jumlah INT,
Total INT,
MetodeBayar VARCHAR(50)
);
3. Memasukkan Data (INSERT)

INSERT INTO penjualan VALUES
(1, '2024-01-01', 'Sepatu', 'Fashion', 250000, 2, 500000, 'Transfer'),
(2, '2024-01-01', 'Kaos', 'Fashion', 100000, 1, 100000, 'E-Wallet'),
(3, '2024-01-02', 'Headset', 'Elektronik', 300000, 1, 300000, 'COD'),
(4, '2024-01-02', 'Kopi', 'Makanan', 20000, 5, 100000, 'Cash'),
(5, '2024-01-03', 'Sepatu', 'Fashion', 250000, 1, 250000, 'Transfer'),
(6, '2024-01-03', 'Kopi', 'Makanan', 20000, 10, 200000, 'Cash');
4. SELECT – Menampilkan Data
Menampilkan Semua Data
SELECT * FROM penjualan;

Menampilkan Kolom Tertentu
SELECT Produk, Total FROM penjualan;

5. WHERE – Filter Data
Menampilkan Data Kategori Fashion
SELECT * FROM penjualan
WHERE Kategori = 'Fashion';

Menampilkan Transaksi di Atas 200.000
SELECT * FROM penjualan
WHERE Total > 200000;

Menampilkan Transaksi di Tanggal Tertentu
SELECT * FROM penjualan
WHERE Tanggal = '2024-01-01';

6. ORDER BY – Mengurutkan Data
Urutkan dari Terbesar ke Terkecil
SELECT * FROM penjualan
ORDER BY Total DESC;

Urutkan dari Terkecil ke Terbesar
SELECT * FROM penjualan
ORDER BY Total ASC;

7. GROUP BY – Pengelompokan Data
Ini adalah fitur paling penting untuk data analyst.
Total Penjualan per Produk
SELECT Produk, SUM(Total) AS TotalPenjualan
FROM penjualan
GROUP BY Produk;

Total Penjualan per Kategori
SELECT Kategori, SUM(Total) AS TotalKategori
FROM penjualan
GROUP BY Kategori;

Jumlah Transaksi per Metode Bayar
SELECT MetodeBayar, COUNT(*) AS JumlahTransaksi
FROM penjualan
GROUP BY MetodeBayar;

8. Fungsi Agregat SQL
SUM
SELECT SUM(Total) FROM penjualan;

AVG
SELECT AVG(Total) FROM penjualan;

MAX dan MIN
SELECT MAX(Total) FROM penjualan;
SELECT MIN(Total) FROM penjualan;

COUNT
SELECT COUNT(*) FROM penjualan;

9. HAVING – Filter Setelah GROUP BY
Misalnya kita hanya ingin produk dengan total penjualan di atas 300.000:
SELECT Produk, SUM(Total) AS TotalPenjualan
FROM penjualan
GROUP BY Produk
HAVING SUM(Total) > 300000;

10. Analisis Tren dengan SQL
Total Penjualan per Hari
SELECT Tanggal, SUM(Total) AS TotalHarian
FROM penjualan
GROUP BY Tanggal
ORDER BY Tanggal;

Total Penjualan per Bulan
SELECT MONTH(Tanggal) AS Bulan, SUM(Total) AS TotalBulanan
FROM penjualan
GROUP BY MONTH(Tanggal);

11. Studi Kasus Nyata
Sekarang kita jawab beberapa pertanyaan bisnis:
1. Produk Apa yang Paling Laris?
SELECT Produk, SUM(Jumlah) AS TotalTerjual
FROM penjualan
GROUP BY Produk
ORDER BY TotalTerjual DESC;
2. Produk dengan Omset Tertinggi
SELECT Produk, SUM(Total) AS Omset
FROM penjualan
GROUP BY Produk
ORDER BY Omset DESC;
3. Kategori Terbaik
SELECT Kategori, SUM(Total) AS TotalKategori
FROM penjualan
GROUP BY Kategori
ORDER BY TotalKategori DESC;
4. Metode Pembayaran Favorit
SELECT MetodeBayar, COUNT(*) AS Jumlah
FROM penjualan
GROUP BY MetodeBayar
ORDER BY Jumlah DESC;
12. Menghitung Growth dengan SQL
Misalnya kita ingin melihat perubahan harian:
SELECT
Tanggal,
SUM(Total) AS TotalHarian,
LAG(SUM(Total)) OVER (ORDER BY Tanggal) AS HariSebelumnya
FROM penjualan
GROUP BY Tanggal;

Jika database mendukung window function, kita bisa lanjutkan:
SELECT
Tanggal,
TotalHarian,
((TotalHarian - HariSebelumnya) / HariSebelumnya) * 100 AS Growth
FROM (
SELECT
Tanggal,
SUM(Total) AS TotalHarian,
LAG(SUM(Total)) OVER (ORDER BY Tanggal) AS HariSebelumnya
FROM penjualan
GROUP BY Tanggal
) t;

13. Interpretasi Hasil SQL
Misalnya hasil menunjukkan:
- Produk terlaris: Kopi
- Omset terbesar: Sepatu
- Metode bayar favorit: Cash
- Tren: Meningkat
Maka insight:
- Kopi sering dibeli, tapi murah
- Sepatu jarang dibeli, tapi mahal
- Promosi e-wallet bisa ditingkatkan
- Bisnis berkembang
Analisis Data dengan Python, Visualisasi, Insight Bisnis, dan Kesimpulan
Di bagian terakhir ini, kita akan menggunakan Python untuk melakukan analisis lanjutan dan membuat visualisasi data. Inilah tahap di mana seorang data analyst benar-benar mengubah angka menjadi cerita yang mudah dipahami.
Kita akan menggunakan:
pandas→ pengolahan datanumpy→ perhitungan numerikmatplotlib→ visualisasi
1. Mengapa Python Penting untuk Data Analyst?
Excel sangat bagus untuk pemula, dan SQL sangat kuat untuk mengambil data. Namun Python memiliki keunggulan:
✅ Bisa menangani data sangat besar
✅ Otomatisasi analisis
✅ Visualisasi fleksibel
✅ Statistik lanjutan
✅ Machine learning (lanjutan)
Karena itu, Python adalah skill wajib data analyst modern.
2. Persiapan Data
Import Library
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
Load Dataset
df = pd.read_csv("data_penjualan.csv")
Melihat Data
df.head()
Informasi Dataset
df.info()
3. Analisis Deskriptif dengan Python
Statistik Dasar
df.describe()
Total Penjualan
total_penjualan = df['Total'].sum()
print(total_penjualan)
Rata-Rata Transaksi
rata_rata = df['Total'].mean()
print(rata_rata)
Transaksi Terbesar & Terkecil
df['Total'].max()
df['Total'].min()
4. Analisis Produk Terlaris
Berdasarkan Jumlah
produk_terlaris = df.groupby('Produk')['Jumlah'].sum().sort_values(ascending=False)
print(produk_terlaris)
Berdasarkan Omset
omset_produk = df.groupby('Produk')['Total'].sum().sort_values(ascending=False)
print(omset_produk)
5. Analisis Kategori
kategori_omset = df.groupby('Kategori')['Total'].sum()
print(kategori_omset)
6. Analisis Metode Pembayaran
metode_bayar = df['MetodeBayar'].value_counts()
print(metode_bayar)
7. Analisis Tren Waktu
Pastikan kolom tanggal sudah dalam format datetime:
df['Tanggal'] = pd.to_datetime(df['Tanggal'])
Total Penjualan per Hari
harian = df.groupby('Tanggal')['Total'].sum()
print(harian)
8. Visualisasi Data
Visualisasi membantu kita melihat pola dengan cepat.
1. Grafik Penjualan Harian
plt.figure()
plt.plot(harian.index, harian.values)
plt.xlabel("Tanggal")
plt.ylabel("Total Penjualan")
plt.title("Tren Penjualan Harian")
plt.show()
2. Produk Terlaris (Bar Chart)
produk_terlaris.plot(kind='bar')
plt.title("Produk Terlaris")
plt.xlabel("Produk")
plt.ylabel("Jumlah Terjual")
plt.show()
3. Omset per Kategori
kategori_omset.plot(kind='bar')
plt.title("Omset per Kategori")
plt.xlabel("Kategori")
plt.ylabel("Total Penjualan")
plt.show()
4. Metode Pembayaran
metode_bayar.plot(kind='bar')
plt.title("Metode Pembayaran")
plt.xlabel("Metode")
plt.ylabel("Jumlah Transaksi")
plt.show()
9. Menghitung Growth di Python
harian_growth = harian.pct_change() * 100
print(harian_growth)
10. Moving Average
harian_ma = harian.rolling(window=3).mean()
Visualisasi Moving Average
plt.figure()
plt.plot(harian.index, harian.values)
plt.plot(harian_ma.index, harian_ma.values)
plt.title("Tren dengan Moving Average")
plt.show()
11. Menarik Insight dari Data
Ini adalah bagian paling penting. Data analyst tidak hanya menghitung, tapi menjelaskan arti data.
Contoh Insight:
- Produk paling sering dibeli: Kopi
- Produk dengan omset terbesar: Sepatu
- Metode bayar favorit: Cash
- Tren penjualan: Meningkat
- Rata-rata transaksi: Rp120.000
12. Contoh Rekomendasi Bisnis
Dari insight di atas, kita bisa menyarankan:
📌 Fokus stok kopi karena sering dibeli
📌 Promosi sepatu karena margin tinggi
📌 Optimalkan metode cashless
📌 Buat promo saat tren menurun
📌 Paket bundling untuk menaikkan nilai transaksi
Inilah inti dari pekerjaan data analyst:
Data → Analisis → Insight → Keputusan
13. Workflow Lengkap yang Sudah Kamu Pelajari
Dalam artikel ini, kamu sudah mempelajari:
- Memahami data
- Membersihkan data
- Statistik dasar
- Matematika data analyst
- SQL query
- Analisis Python
- Visualisasi
- Insight
- Rekomendasi
Ini adalah alur kerja data analyst profesional.
14. Kesalahan Umum Pemula
- Terlalu fokus ke rumus
- Tidak melihat konteks bisnis
- Tidak membersihkan data
- Tidak membuat visualisasi
- Tidak menarik kesimpulan
15. Langkah Selanjutnya Setelah Artikel Ini
Jika kamu ingin benar-benar menjadi data analyst, lakukan ini:
- Latihan dengan dataset lain
- Upload hasil ke GitHub
- Buat portfolio
- Coba Kaggle
- Pelajari dashboard (Power BI / Tableau)
Kesimpulan
Menjadi seorang data analyst bukan hanya tentang menghitung angka, tetapi tentang mengubah data menjadi cerita yang membantu pengambilan keputusan.
Dalam artikel ini, kamu telah belajar:
✅ Dasar data analyst
✅ Data cleaning
✅ Statistik dasar
✅ Fungsi matematika
✅ SQL
✅ Python
✅ Visualisasi
✅ Insight bisnis
Dengan latihan rutin, kamu bisa berkembang dari pemula menjadi data analyst yang andal.