Pendahuluan
Kalau kamu pernah dengar istilah “data is the new oil”, mungkin kamu penasaran — apa sih sebenarnya yang bisa dilakukan dengan data? Nah, selama masa PKL ini saya berkesempatan untuk langsung terjun dan merasakan sendiri bagaimana data bisa diubah menjadi sesuatu yang benar-benar berguna bagi sebuah bisnis.
Salah satu proyek yang paling berkesan adalah ketika saya diminta untuk menganalisis data penjualan sebuah cafe selama tahun 2023. Data mentahnya? Lumayan berantakan. Ada nilai yang kosong, ada yang error, format tanggalnya tidak konsisten, dan masih banyak lagi masalah lainnya. Tapi justru di situlah serunya — proses mengubah data yang berantakan itu menjadi insight yang bisa dibaca oleh siapa saja, termasuk orang yang tidak mengerti data sekalipun.
Dalam artikel ini saya mau cerita secara lengkap tentang perjalanan itu — mulai dari proses membersihkan data, membuat dashboard interaktif di Looker Studio, sampai insight-insight menarik yang berhasil saya temukan dari data tersebut. Semoga bisa jadi referensi buat kamu yang juga lagi belajar data analytics atau sedang menjalani PKL di bidang yang sama!
Kondisi Data Awal
Saat pertama kali membuka file data penjualan cafe itu, jujur saya cukup kaget. Data yang saya terima berisi 10.000 baris transaksi selama setahun penuh — dari Januari sampai Desember 2023. Sekilas terlihat lengkap, tapi begitu dicermati lebih dalam, ada banyak sekali masalah yang perlu diselesaikan.
Pertama, ada nilai-nilai yang bertuliskan ERROR dan UNKNOWN di banyak kolom — terutama di kolom Quantity, Price Per Unit, dan Total Spent. Ini adalah masalah serius karena kolom-kolom ini adalah inti dari seluruh analisis. Kalau tidak dibersihkan, hasil analisanya bisa jauh meleset dari kenyataan.
Kedua, format tanggal tidak konsisten. Ada yang pakai format DD/MM/YYYY, ada yang MM-DD-YYYY, bahkan ada beberapa baris yang tanggalnya tidak valid sama sekali — seperti 32 Januari atau 30 Februari yang jelas-jelas tidak mungkin ada di kalender manapun.
Ketiga, ada kolom-kolom kategoris seperti Payment Method dan Location yang beberapa barisnya kosong tanpa keterangan apapun. Ini membuat analisis distribusi metode pembayaran dan lokasi penjualan menjadi tidak akurat jika dibiarkan begitu saja.
“Data cleaning bukan pekerjaan yang glamor, tapi ini adalah fondasi dari semua analisis yang akan dilakukan setelahnya. Kalau fondasinya lemah, bangunannya pasti akan goyah.”
Setelah proses pembersihan data selesai, dari 10.000 baris data awal tersisa 9.485 baris data yang valid dan siap dianalisis. Artinya ada sekitar 515 baris data yang harus dibuang karena tidak bisa diselamatkan — terlalu banyak nilai penting yang hilang atau tidak valid.
Ringkasan masalah dan solusinya:
- Nilai ERROR dan UNKNOWN → Diganti NaN lalu diisi atau dihapus
- Format tanggal tidak konsisten → Dikonversi ke format standar YYYY-MM-DD
- Kolom numerik bertipe teks → Dikonversi ke tipe data numerik
- Nilai Total Spent kosong → Dihitung ulang: Quantity x Price Per Unit
- Kolom kategoris kosong → Diisi label “Unknown”
- Baris dengan data kritis hilang → Dihapus dari dataset
Proses Data Cleaning
Proses data cleaning dilakukan menggunakan Python dengan library pandas — salah satu tools paling populer untuk pengolahan data. Berikut cerita lengkap proses pembersihan yang saya lakukan:
1. Menangani Nilai ERROR dan UNKNOWN
Langkah pertama adalah mengganti semua nilai bertuliskan ERROR dan UNKNOWN dengan NaN (Not a Number) — sebuah representasi standar untuk nilai yang hilang atau tidak valid dalam dunia data. Setelah itu, saya mencoba menyelamatkan sebanyak mungkin baris data dengan cara mengisi nilai yang hilang menggunakan logika sederhana.
Misalnya untuk kolom Total Spent yang kosong — kalau Quantity dan Price Per Unit-nya masih ada dan valid, maka Total Spent bisa dihitung ulang dengan rumus Total = Quantity x Price Per Unit. Cara ini berhasil menyelamatkan ratusan baris data yang tadinya hampir dibuang!
2. Konversi Tipe Data
Masalah umum lain yang sering muncul di data transaksi adalah kolom yang seharusnya berisi angka malah tersimpan sebagai teks. Ini terjadi karena pada saat input data, ada karakter non-numerik yang ikut masuk — seperti spasi, tanda dolar, atau tanda koma sebagai pemisah ribuan.
Solusinya adalah menggunakan fungsi pd.to_numeric() dengan parameter errors=’coerce’ yang akan mengkonversi nilai-nilai yang valid ke angka, dan mengubah nilai yang tidak bisa dikonversi menjadi NaN secara otomatis. Setelah itu tinggal di-handle NaN-nya sesuai kebutuhan.
3. Validasi dan Pembersihan Tanggal
Kolom Transaction Date adalah salah satu kolom terpenting karena digunakan untuk analisis tren bulanan. Setelah dikonversi ke format datetime, saya melakukan validasi untuk memastikan semua tanggal masuk dalam rentang yang wajar — yaitu antara 1 Januari 2023 sampai 31 Desember 2023. Baris-baris dengan tanggal di luar rentang tersebut langsung dihapus karena kemungkinan besar adalah kesalahan input yang tidak bisa diperbaiki tanpa informasi tambahan.
Membangun Dashboard di Looker Studio
Setelah data bersih, saatnya tahap yang paling menyenangkan — membuat dashboard! Untuk tahap ini saya menggunakan Google Looker Studio, sebuah tools visualisasi data gratis dari Google yang sangat powerful dan mudah digunakan.
Konsep dasar Looker Studio adalah drag and drop — kamu tinggal menghubungkan sumber data, lalu pilih jenis visualisasi yang ingin dibuat, atur dimensi dan metriknya, dan grafik langsung terbentuk secara otomatis. Tidak perlu coding sama sekali di tahap ini.
Bagian 1: Kartu Skor KPI
Di bagian paling atas dashboard, saya menempatkan 4 kartu skor yang menampilkan angka-angka kunci bisnis cafe secara sekilas — Total Pendapatan ($84.643), Total Transaksi (9.485), Rata-rata Nilai Order ($8,92), dan Total Item Terjual (28.664). Ini adalah hal pertama yang akan dilihat oleh siapapun yang membuka dashboard, dan keempat angka ini sudah cukup untuk memberikan gambaran besar tentang kondisi bisnis cafe.
Bagian 2: Grafik Tren Waktu
Grafik line chart untuk tren pendapatan bulanan ditempatkan di baris kedua dashboard. Grafik ini adalah salah satu yang paling informatif karena langsung memperlihatkan pola penjualan sepanjang tahun dalam satu tampilan. Untuk membuatnya di Looker Studio, saya menggunakan tipe “Rangkaian Waktu” dengan dimensi Transaction Date yang diset ke granularitas “Tahun Bulan” agar setiap bulan tampil sebagai satu titik data yang terpisah.
Bagian 3: Grafik Perbandingan
Di baris berikutnya, saya menempatkan beberapa grafik batang dan donat yang membandingkan berbagai dimensi data — pendapatan per menu, distribusi metode pembayaran, perbandingan penjualan in-store vs takeaway, dan rata-rata nilai order per menu. Pemilihan jenis grafik disesuaikan dengan kebutuhan: grafik batang untuk perbandingan nilai, grafik donat untuk distribusi proporsi.
Bagian 4: Kotak Insight Teks
Yang membuat dashboard ini berbeda dari dashboard biasa adalah adanya kotak-kotak teks berisi insight di samping setiap grafik. Idenya sederhana — tidak semua orang yang melihat dashboard adalah orang yang jago membaca grafik. Dengan adanya teks insight, siapapun bisa langsung memahami apa arti dari data yang ditampilkan tanpa harus berpikir keras. Misalnya di samping grafik tren bulanan, ada kotak yang bertuliskan “Pendapatan paling stabil di $6.600–$7.350 per bulan. Puncak di Juni dan Oktober, terlemah di Februari.”
Temuan Insight
Nah, ini adalah bagian yang paling saya suka dari seluruh proses analisis ini. Setelah dashboard jadi dan semua grafik terpasang rapi, saatnya membaca insight dari data yang sudah divisualisasikan. Dan ternyata ada beberapa temuan yang cukup mengejutkan!
Insight 1: Salad Adalah Raja!
Siapa yang menyangka kalau menu yang paling laris di sebuah cafe adalah Salad? Bukan Kopi, bukan Sandwich, tapi Salad! Menu ini berhasil menyumbang $16.545 atau 19,5% dari total revenue cafe selama 2023 — jauh melampaui menu-menu lainnya.
Yang lebih menarik lagi, rata-rata nilai transaksi yang melibatkan Salad mencapai $15,11 per order — hampir dua kali lipat rata-rata keseluruhan cafe yang hanya $8,92. Ini mengindikasikan bahwa pelanggan yang memesan Salad cenderung membeli dalam jumlah lebih besar atau mengkombinasikan dengan menu lain. Diikuti Sandwich ($12.996) dan Smoothie ($12.736) di posisi kedua dan ketiga, ketiga menu ini bersama-sama menyumbang hampir 50% dari total revenue cafe.
Insight 2: Pendapatan Super Stabil — Ini Luar Biasa!
Kalau kamu pernah mengelola atau bekerja di bisnis F&B, kamu pasti tahu betapa sulitnya menjaga pendapatan tetap stabil sepanjang tahun. Biasanya ada bulan-bulan ramai dan bulan-bulan sepi yang perbedaannya bisa sangat drastis.
Tapi data cafe ini menunjukkan sesuatu yang luar biasa — pendapatan bulanannya sangat stabil di kisaran $6.600 hingga $7.350 setiap bulannya! Selisih antara bulan terbaik (Juni, $7.350) dan bulan terlemah (Februari, $6.626) hanya $724 atau kurang dari 10% dari nilai bulan terbaik. Ini adalah indikator yang sangat kuat bahwa cafe ini sudah punya basis pelanggan setia yang rutin datang setiap bulan — bukan hanya ramai saat ada event atau momen tertentu saja.
Insight 3: Tiga Metode Pembayaran yang Hampir Sempurna Merata
Temuan ketiga yang cukup mengejutkan adalah distribusi metode pembayaran. Digital Wallet, Cash, dan Credit Card masing-masing berkontribusi sekitar 22-23% dari total revenue — dengan selisih antara ketiganya yang sangat kecil, hanya $75,50 dari total revenue $84.643!
Ini menunjukkan bahwa pelanggan cafe memiliki preferensi pembayaran yang sangat beragam. Kondisi ini bagus untuk bisnis karena tidak bergantung pada satu metode pembayaran saja. Namun di sisi lain, semua terminal pembayaran harus selalu berfungsi optimal — kalau mesin EDC untuk kartu kredit tiba-tiba rusak di hari sibuk, cafe bisa kehilangan sekitar 23% potensi revenue di hari itu!
Insight 4: In-store dan Takeaway Sama Kuatnya!
Perbandingan penjualan antara In-store ($25.784) dan Takeaway ($25.287) menunjukkan keseimbangan yang hampir sempurna — selisihnya hanya $497! Ini artinya cafe berhasil melayani dua segmen pelanggan yang berbeda dengan sama baiknya. Pelanggan In-store adalah mereka yang datang untuk menikmati suasana atau bekerja sambil ngopi, sementara pelanggan Takeaway adalah mereka yang sibuk tapi tetap loyal. Kedua channel yang seimbang ini membuat bisnis cafe jauh lebih tahan terhadap berbagai risiko eksternal.
Bonus: Otomatisasi Insight dengan Google Apps Script
Selain membuat dashboard di Looker Studio, saya juga membuat sebuah tools kecil yang sangat berguna — sebuah script otomatis yang bisa menghasilkan laporan insight lengkap langsung di Google Sheets hanya dengan satu klik!
Tools ini dibuat menggunakan Google Apps Script — bahasa pemrograman berbasis JavaScript yang bisa digunakan untuk mengotomatisasi berbagai tugas di dalam ekosistem Google Workspace. Cara kerjanya sederhana: script membaca data dari sheet utama, menghitung semua metrik yang dibutuhkan, lalu menuliskan hasilnya ke sheet baru bernama “INSIGHT” dengan format yang sudah dirapikan dan diberi warna yang menarik.
Yang paling berguna adalah bagian rekomendasi strategisnya. Misalnya script akan secara otomatis menghitung: “Kalau rata-rata order bisa dinaikkan $3 saja per transaksi, maka total pendapatan tahunan akan bertambah $28.455” — angka yang sangat konkret dan actionable untuk dijadikan target bisnis.
Pelajaran yang Saya Dapat dari Pengalaman Ini
1. Data Cleaning Adalah 80% dari Pekerjaan
Ini bukan lebay — ini fakta. Dari seluruh waktu yang saya habiskan untuk proyek ini, hampir 80%-nya digunakan untuk membersihkan dan memvalidasi data. Sisanya baru untuk analisis dan visualisasi. Kalau kamu ingin berkarir di bidang data, biasakan diri dengan pekerjaan cleaning karena ini adalah kenyataan di lapangan.
2. Visualisasi yang Baik Harus Bisa Dipahami Semua Orang
Dashboard yang bagus bukan yang penuh dengan grafik-grafik kompleks. Dashboard yang bagus adalah yang bisa dipahami dalam 30 detik pertama oleh siapapun — termasuk orang yang tidak mengerti data sekalipun. Itulah mengapa saya selalu menambahkan kotak teks insight di setiap grafik.
3. Otomatisasi adalah Investasi Waktu yang Worth It
Membuat Apps Script untuk otomatisasi laporan memang butuh waktu ekstra di awal. Tapi begitu selesai, laporan yang biasanya butuh berjam-jam untuk dibuat secara manual bisa selesai dalam hitungan detik hanya dengan satu klik. Untuk bisnis yang perlu update laporan secara reguler, investasi waktu ini sangat sepadan.
4. Insight Tanpa Rekomendasi Itu Tidak Lengkap
Menemukan bahwa Salad adalah menu terlaris itu menarik, tapi belum cukup. Yang lebih penting adalah “Apa yang harus dilakukan dengan informasi ini?” Itulah mengapa setiap insight yang saya buat selalu diikuti dengan rekomendasi konkret yang bisa langsung ditindaklanjuti oleh pemilik bisnis.
Penutup
Pengalaman menganalisis data penjualan cafe selama PKL ini adalah salah satu pengalaman paling berharga yang saya dapat. Bukan hanya karena ilmu teknisnya — cara membersihkan data, membuat dashboard, menulis script otomatis — tapi juga karena saya jadi benar-benar memahami bagaimana data bisa memberikan dampak nyata bagi sebuah bisnis.
Yang tadinya hanya sekumpulan angka membosankan di spreadsheet, bisa berubah menjadi cerita yang menarik dan informasi yang actionable. Pemilik cafe bisa tahu menu mana yang harus dipromosikan lebih agresif, bulan mana yang perlu disiapkan lebih matang, dan bagaimana cara meningkatkan rata-rata nilai order tanpa harus menambah pelanggan baru.
