Penulis: Claresta – Junior Data Analyst
📊 Latar Belakang
Perusahaan retail modern menghadapi tantangan yang semakin kompleks: persaingan antara kanal online dan offline, tekanan untuk memberikan diskon guna meningkatkan volume penjualan, serta kebutuhan untuk mengidentifikasi produk-produk yang benar-benar menggerakkan bisnis.
Tanpa analisis data yang tepat, keputusan bisnis seringkali diambil berdasarkan intuisi semata — padahal data transaksi menyimpan pola berharga yang bisa menjadi fondasi strategi yang jauh lebih efektif.
Pertanyaan Bisnis Utama: Kategori dan item produk mana yang paling menguntungkan? Apakah strategi diskon yang sedang berjalan efektif? Dan bagaimana pola musiman memengaruhi penjualan?
Proyek ini menjawab pertanyaan-pertanyaan tersebut melalui analisis data transaksi retail periode 2022–2025, menghasilkan insight yang dapat langsung diimplementasikan oleh tim bisnis.
📁 Dataset yang Digunakan
Dataset berisi catatan transaksi penjualan dari perusahaan retail yang beroperasi melalui dua kanal: Online dan In-store. Data mencakup periode Januari 2022 hingga Januari 2025 dengan 13 variabel yang menggambarkan detail setiap transaksi.
| Metrik | Nilai |
|---|---|
| Total Transaksi | 12.418 |
| Unique Customer | 25 |
| Kategori Produk | 8 |
| Periode Data | 3 Tahun (2022–2025) |
Struktur Data
| Variabel | Tipe | Keterangan |
|---|---|---|
| transaction_id | String | ID unik setiap transaksi |
| customer_id | String | ID pelanggan (25 unik) |
| category | String | 8 kategori produk utama |
| item | String | Nama produk spesifik |
| price_per_unit | Numerik | Harga satuan produk |
| quantity | Integer | Jumlah unit (1–10) |
| total_spent | Numerik | Total pengeluaran pelanggan |
| payment_method | String | Cash / Credit Card / Digital Wallet |
| location | String | Online / In-store |
| transaction_date | DateTime | Tanggal transaksi |
| discount_applied | Boolean | True = ada diskon |
| Revenue | Numerik | Pendapatan bersih per transaksi |
🧹 Proses Data Cleaning
Sebelum analisis dimulai, dilakukan serangkaian langkah data preparation untuk memastikan kualitas dan konsistensi data. Berikut langkah-langkah yang dilakukan:
1. Cek Missing Values
Tidak ada missing value pada kolom kritis setelah dilakukan validasi.
2. Konversi Tipe Data Numerik
Kolom Revenue, total_spent, dan price_per_unit dikonversi ke format numerik untuk memastikan perhitungan akurat.
3. Validasi Duplikasi
Tidak ditemukan duplikasi pada transaction_id — data unik per transaksi.
4. Validasi Range Nilai
Quantity transaksi berkisar antara 1–10 unit, semua dalam batas wajar.
5. Ekstraksi Fitur Waktu
Ditambahkan kolom YearMonth dan Year untuk keperluan analisis tren musiman.
✅ Hasil: Dataset siap dengan 12.418 baris dan 15 kolom, tanpa missing value atau duplikasi.
📈 Exploratory Data Analysis
EDA dilakukan untuk menemukan pola bisnis yang tersembunyi. Berikut temuan utama:
1. Revenue by Category (Rp)
| Kategori | Revenue (Rp) |
|---|---|
| Computers & Electronics | 1.317.716 |
| Electric Household | 1.315.838 |
| Butchers | 1.260.382 |
| Food | 1.252.312 |
| Beverages | 1.242.407 |
| Furniture | 1.205.065 |
| Milk Products | 1.153.072 |
| Patisserie | 1.146.373 |
Insight: Gap antar kategori sangat kecil (~Rp 171K) — menunjukkan distribusi revenue yang sehat dan kompetitif di semua lini produk.
2. Top 10 Items by Revenue
| Item | Revenue (Rp) |
|---|---|
| Item_2_BEV ⭐ | 904.918 |
| Item_25_FUR | 148.010 |
| Item_19_MILK | 134.240 |
| Item_25_EHE | 123.533 |
| Item_19_CEA | 120.512 |
| Item_20_BUT | 111.086 |
| Item_22_BUT | 108.843 |
| Item_25_BUT | 105.862 |
| Item_17_PAT | 105.386 |
| Item_15_EHE | 101.218 |
Insight: Satu item Beverages (Item_2_BEV) menghasilkan Rp 904.918 — setara 6× lipat item terbesar kedua. Ini adalah tulang punggung bisnis sekaligus sinyal risiko konsentrasi.
3. Discount Impact Analysis
| Status | Rata-rata Revenue | Jumlah Transaksi |
|---|---|---|
| Tanpa Diskon | Rp 848 | 3.893 |
| Dengan Diskon | Rp 842 | 7.832 |
⚠️ Temuan Kritis: Selisih rata-rata revenue hanya Rp 6 (Rp 848 vs Rp 842). Meskipun 66,9% transaksi mendapatkan diskon, strategi ini tidak efektif meningkatkan nilai transaksi per pelanggan.
4. Monthly Revenue Trend 2024 (Rp)
- Puncak tertinggi: Desember → Rp 330.972
- Terendah: Februari → Rp 234.485
Pola Musiman: Desember konsisten menjadi bulan dengan revenue tertinggi (+13% vs November). Pola ini dapat diprediksi untuk perencanaan inventori dan kampanye promosi.
5. Dual-Channel Performance
| Kanal | Revenue | Persentase |
|---|---|---|
| Online | Rp 5.028.262 | 50,5% |
| In-store | Rp 4.864.903 | 49,5% |
Insight: Keseimbangan yang hampir sempurna — perusahaan berhasil membangun ekosistem penjualan yang tidak bergantung pada satu kanal.
💡 Insight Utama dari Data
01 — Computers & Electronics Memimpin Revenue
Kategori ini menghasilkan revenue tertinggi (Rp 1.317.716), diikuti Electric Household Essentials (Rp 1.315.838). Distribusi revenue yang merata menunjukkan portofolio produk yang sehat.
02 — Item_2_BEV adalah Star Product dengan Dominasi Ekstrem
Satu item menyumbang revenue setara 6× lipat item terbesar kedua. Ini adalah aset sekaligus risiko yang perlu dimitigasi.
03 — Strategi Diskon Tidak Efektif Meningkatkan Nilai Transaksi
Dengan 66,9% transaksi berdiskon, selisih rata-rata revenue hanya Rp 6. Diskon lebih berdampak ke volume daripada nilai per transaksi — biaya diskon tidak sepadan.
04 — Dual-Channel Strategy Berhasil Diterapkan
Online (50,5%) vs In-store (49,5%) — keseimbangan ideal yang menunjukkan adaptasi digital yang baik.
05 — Pola Musiman Kuat di Akhir Tahun
Desember menjadi puncak revenue, Februari terendah. Pola konsisten dan dapat diprediksi.
🎯 Rekomendasi Bisnis
🔹 Proteksi & Diversifikasi Star Product
Prioritas: TINGGI
Item_2_BEV menyumbang revenue yang tidak proporsional. Rekomendasi:
- Pastikan ketersediaan stok secara konsisten
- Analisis faktor keberhasilan (harga, positioning, demand elasticity)
- Replikasi formula ke produk Beverages lain untuk mengurangi ketergantungan
🔹 Revisi Total Kebijakan Diskon
Prioritas: TINGGI
Strategi diskon saat ini tidak efektif. Rekomendasi:
- Ganti diskon massal dengan targeted discount berbasis nilai minimum transaksi
- Implementasikan program loyalty points sebagai alternatif
- Monitor ROI setiap kampanye diskon secara bulanan
- Target: Turunkan discount rate dari 66,9% ke 40% sambil menjaga atau meningkatkan total revenue
🔹 Kampanye Q4 Terencana & Terstruktur
Prioritas: MENENGAH
Desember terbukti sebagai bulan puncak. Rekomendasi:
- Siapkan inventory lebih awal mulai Oktober
- Buat kampanye promosi bertahap (November teaser, Desember peak)
- Manfaatkan momentum untuk cross-selling antar kategori
🔹 Evaluasi & Stimulus Kategori Bawah
Prioritas: MENENGAH
Patisserie dan Milk Products berada di posisi terbawah (Rp 1,15 M vs rata-rata Rp 1,24 M). Rekomendasi:
- Analisis mendalam faktor penyebab (harga, visibilitas, preferensi)
- Pertimbangkan bundle pricing dengan kategori laris
- Kampanye sampling untuk meningkatkan trial rate
Expected Impact: Dengan mengimplementasikan keempat rekomendasi di atas secara konsisten dalam 6 bulan, estimasi peningkatan revenue sebesar 10–15% melalui kombinasi efisiensi diskon, stimulus kategori bawah, dan maksimalisasi puncak musiman.
📝 Kesimpulan
Analisis ini menunjukkan bahwa bisnis retail ini memiliki fondasi yang kuat:
- Revenue terdistribusi relatif merata di 8 kategori
- Dual-channel strategy berjalan efektif
- Ada star product yang sangat kuat
Namun ada dua isu kritis yang perlu segera di-address:
- Ketergantungan berlebihan pada satu item produk
- Efektivitas strategi diskon yang rendah
Dengan mengoptimalkan kedua hal tersebut dan memanfaatkan pola musiman yang sudah terbukti konsisten, perusahaan memiliki potensi pertumbuhan yang signifikan tanpa perlu menambah biaya operasional besar.
🛠 Tools yang Digunakan
- Python (pandas, matplotlib) — untuk data cleaning & analisis
- Excel — untuk dashboard & visualisasi awal
- Notion / Medium — untuk dokumentasi & storytelling
Dibuat untuk keperluan portfolio data analyst. Dataset merupakan data sintetis yang merepresentasikan skenario retail nyata.
📁 GitHub Repository | 📊 Excel Dashboard | 📑 Laporan Lengkap