Dalam dunia Data Analyst, sebuah project tidak hanya berisi file kode dan dataset saja. Agar pekerjaan menjadi terstruktur, mudah dikembangkan, dan dapat dipahami oleh orang lain, seorang analyst perlu memiliki struktur folder project yang rapi dan profesional.
Struktur folder membantu seorang Data Analyst mengatur alur kerja mulai dari pengumpulan data, proses pembersihan, analisis, visualisasi, hingga penyusunan laporan akhir.
Mengapa Struktur Folder Penting?
Dalam project analisis data, biasanya terdapat banyak file seperti dataset, notebook, script Python, grafik, dan laporan. Jika semua file disimpan tanpa aturan, project akan sulit dikelola.
Dengan struktur folder yang baik, seorang analyst dapat:
- Memisahkan data mentah dan data hasil proses
- Menjaga project tetap rapi
- Memudahkan kolaborasi dengan tim
- Mempermudah proses dokumentasi
- Membuat project terlihat profesional saat dibagikan melalui GitHub
Contoh Struktur Folder Project Analyst Profesional
project-data-analyst/
├── README.md
├── .gitignore
├── data/
│ ├── raw/
│ └── processed/
├── notebooks/
├── src/
├── reports/
├── images/
└── requirements.txt
Penjelasan Struktur Folder
1. README.md
README merupakan halaman utama sebuah project.
Berisi informasi seperti:
- Deskripsi project
- Tujuan analisis
- Dataset yang digunakan
- Tools yang digunakan
- Kesimpulan hasil analisis
Contohnya seperti readme yang ada dibawah ini jika ingin melihat readmenya secara langsung sihlakan cek akun github saya https://github.com/juniorbenerd2-byte/simulasi-industri-junior-alfredo

README membantu orang lain memahami project tanpa harus membaca seluruh kode.
2. .gitignore
.gitignore digunakan untuk menentukan file yang tidak perlu dimasukkan ke repository GitHub.
Contohnya:

Biasanya dataset asli tidak diupload karena ukurannya besar atau memiliki informasi yang bersifat pribadi.
Folder Data
3. data/raw/
Folder ini menyimpan data asli dari sumber awal.
Contoh:

Data pada folder ini belum mengalami perubahan dan masih dalam kondisi mentah.
4. data/processed/
Folder ini menyimpan data yang sudah melalui proses pembersihan.
Contoh proses:
- Menghapus data kosong
- Menghilangkan data duplikat
- Memperbaiki format data

Hasil akhirnya siap digunakan untuk analisis.
Folder Analisis
5. notebooks/
Folder ini berisi file Jupyter Notebook untuk proses analisis.
Contoh:

Urutan tersebut menggambarkan alur kerja Data Analyst:
Mengambil data → Membersihkan data → Menganalisis → Membuat visualisasi
Folder Source Code
6. src/
Berisi kode Python yang sudah dibuat lebih rapi dan dapat digunakan kembali.
Contoh:
src/
├── cleaning.py
├── analysis.py
└── visualization.py
Fungsinya agar kode tidak terlalu panjang di notebook dan lebih mudah dipelihara.
Folder Hasil
7. reports/
Folder ini menyimpan hasil akhir dari project.
Contoh:
Karena saya belum membuat projectnya jadi hanya ada .gitkeep

ini jika struktur project sudah ada isinya dan di simpan
reports/
├── dashboard/
└── laporan_analisis.pdf
Isi folder ini biasanya:
- Dashboard
- Grafik hasil analisis
- Laporan insight
Berikut Folder yang tidak wajib tapi bisa berguna
Folder Pendukung
8. images/
Berisi gambar yang digunakan untuk dokumentasi.
Contoh:
images/
└── grafik_penjualan.png
Biasanya digunakan untuk mempercantik tampilan README GitHub.
9. requirements.txt
Berisi daftar library Python yang digunakan.
Contoh:
pandas
numpy
matplotlib
seaborn
jupyter
File ini membantu orang lain menginstall kebutuhan project dengan mudah.
Alur Kerja Seorang Data Analyst
Secara sederhana prosesnya seperti ini:
Dataset Mentah
↓
Data Cleaning
↓
Data Processing
↓
Exploratory Data Analysis
↓
Visualization
↓
Insight & Report
Seorang Data Analyst tidak hanya membuat grafik, tetapi juga mengubah data mentah menjadi informasi yang dapat membantu pengambilan keputusan.
Kesimpulan
Struktur folder project merupakan salah satu kebiasaan penting bagi seorang Data Analyst profesional. dengan penataan folder yang baik, project menjadi lebih mudah dipahami, dikembangkan, dan dipresentasikan.
Menguasai struktur project sejak awal akan membantu membangun kebiasaan kerja seperti yang digunakan dalam lingkungan industri.
