top of page
Gambar penulisCornellius Yudha Wijaya

Data Scientist Wajib Tahu: Bisnis x Statistik


Secara definisi, statistik adalah ilmu yang berhubungan dengan pengumpulan, klasifikasi, analisis, dan interpretasi data. Bidang ini sering didukung oleh penggunaan teori matematika probabilitas dan digunakan untuk menilai hipotesis tertentu.


Definisi tersebut mungkin terdengar sangat teknis, dan sepertinya tidak ada hubungannya dengan bisnis. Lalu, mengapa Data Scientist perlu mengetahui kedua hal ini?


Nah, statistik lebih dari sekadar kelas matematika tingkat lanjut. Ini adalah cara bagi setiap bisnis untuk mendapatkan keunggulan dari pesaing mereka. Saya berpendapat bahwa banyak pemimpin bisnis hebat membuat keputusan bisnis mereka tidak hanya berdasarkan naluri mereka tetapi juga didukung oleh statistik.

Setiap proyek Data Scientist adalah proyek untuk memecahkan masalah perusahaan. Tidak masalah jika model deep learning Anda memiliki presisi 99% dan bisa menebak setiap orang yang melewati ruangan; jika itu tidak memecahkan masalah bisnis, itu tidak berguna.

Masalahnya adalah, seberapa penting statistik untuk bisnis dan mengapa kita, sebagai Data Scientists, perlu memahami kedua sisi statistik dan bisnis? Inilah pertanyaan yang mungkin membuat Anda penasaran. Nah, izinkan saya menjelaskan sedikit lebih lanjut tentang bisnis dan statistik bagi Data Scientists.

Bisnis x Statistik

Bisnis dan Statistik tampak seperti dua dunia yang tidak akan bersatu, tetapi keduanya sangat terintegrasi. Bagaimana bisa? Izinkan saya menjelaskan dalam beberapa paragraf di bawah ini.


Data-Driven Bussines and Statistic

Anda mungkin sering mendengar istilah “Data-Driven” dalam banyak artikel atau materi studi terkait data science. Mungkin ada yang mengatakan “Bisnis ini data-driven,” atau “Keputusan ini based on data, sehingga disebut “Data-Driven” dan banyak lagi.


Sampai sini, mungkin Anda berpikir bahwa menggunakan data untuk keputusan bisnis berarti bisa disebut data-driven. Apakah benar? Jika berdasarkan data berarti hanya melihat angka dan menjalankan keputusan berdasarkan gambaran data, maka jawabannya adalah tidak.

Bisnis yang Data-Driven lebih dari itu. Perusahaan mungkin memiliki banyak data, tetapi jika informasi tersebut tidak berhubungan dengan bisnis saat ini, itu tidak berguna.


Sebagai contoh, perusahaan A yang sudah berdiri selama sepuluh tahun ingin menjual produk baru untuk pasar baru. Mereka meminta tim data untuk membuat profil segmen pasar baru untuk produk baru tersebut berdasarkan data yang mereka miliki, yang mereka klaim telah memiliki banyak data. Tim kemudian melihat data perusahaan dan mengetahui bahwa yang dimaksud “banyak data” adalah data spreadsheet yang hanya berisi atribut yang tidak berguna seperti id, nama, email, dan nomor telepon.


Di atas adalah contoh data yang tidak dapat menyelesaikan masalah bisnis Anda, tetapi bagaimana jika kita memiliki dataset yang “mungkin” bisa membagi pelanggan baru. Katakanlah gaji, pekerjaan, preferensi, dan usia mereka. Maka, ini adalah titik di mana kita membutuhkan statistik pada bisnis untuk mengevaluasi kualitas data dan membantu perusahaan menentukan strategi bisnis apa yang harus dilakukan.


Mempertimbangkan Statistik dalam Bisnis

Saya sudah menjelaskan secara singkat mengapa statistik penting dalam bisnis, tetapi jenis statistik apa yang secara khusus krusial dalam bisnis. Di sini, kita perlu kembali ke inti pertanyaan bisnis “Apa yang menjadi hal utama dalam pertanyaan bisnis Anda?”; Apakah itu jumlah penjualan, keuntungan (profit), atau jenis pertanyaan apa pun yang bisa Anda ajukan. Ini disebut key metrics.


Sebagai contoh, key metrics perusahaan A adalah jumlah monthly sales mereka. Dalam hal ini, apa yang perlu diatasi oleh perusahaan A adalah jenis analisis apa yang mereka inginkan dari key metrics tersebut. Nah, yang paling jelas adalah bagaimana jumlah monthly sales selama bertahun-tahun. Berikut contoh datanya.


Sekarang, dengan statistik dan analisis sederhana, kita bisa melihat bahwa jumlah penjualan meningkat hingga Februari, di mana penjualan turun setiap tahun dengan sangat signifikan. Dalam hal ini, statistik dapat membantu dengan menyediakan persentase penurunan setiap tahun, dan dari perspektif bisnis, ini layak diselidiki apa menentukan penyebab penurunan ini.


Inilah bagaimana statistik dapat membantu bisnis; ini tidak hanya memetakan masalah yang dimiliki perusahaan dan membantu perusahaan membuat keputusan bisnis, tetapi juga memahami jenis profil penjualan yang dimiliki bisnis.


Bisnis dan Statistik bagi Data Scientist

Lalu, bagaimana dengan Data Scientist? Sepertinya apa yang saya jelaskan di atas hanya berlaku untuk bisnis dan tidak untuk Data Scientist. Nah, mungkin kita perlu mendefinisikan apa yang sering dilakukan Scientist.


Grafik di atas adalah aktivitas teoretis yang dilakukan Data Scientist setiap hari. Meskipun tidak salah, kenyataannya di lingkungan kerja jauh berbeda.

Pada grafik di atas, kita bisa melihat bahwa pekerjaan Data Scientist bukan hanya tentang membersihkan dan mempersiapkan data, tetapi kita perlu mematuhi kepatuhan dan etika data serta mengintegrasikan setiap proyek data kita dengan masalah bisnis.


Setiap proyek Data Scientist adalah proyek untuk memecahkan masalah perusahaan. Tidak masalah jika model deep learning Anda memiliki presisi 99% dan bisa menebak setiap orang yang melewati ruangan; jika itu tidak memecahkan masalah bisnis, itu tidak berguna.

Setiap Data Scientist perlu memahami jenis bisnis yang dijalani perusahaan dan masalah bisnis apa yang ingin selesaikan. Ini tidak dapat dihindari ketika bekerja di perusahaan ketika harus berinteraksi dengan departemen lain.


Misalnya, departemen sales ingin meningkatkan jumlah penjualan. Untuk melakukannya, tim sale meminta tim Data Scientist untuk membuat model prediksi pelanggan baru. Anda mungkin berpikir hanya perlu menarik data dan melatihnya ke model machine learning apa pun, bukan?


Tidak, seringkali kasusnya bukan seperti ini. Yang perlu Anda lakukan pertama kali adalah meyakinkan departemen sales bahwa proyek ini layak atau tidak serta menetapkan target yang wajar. Inilah sebabnya mengapa Data Scientist perlu memahami kedua sisi Bisnis dan Statistik.


Untuk menentukan apakah dapat menjalankan suatu proyek data, Anda memerlukan data yang berguna. Dalam hal ini, Anda membutuhkan statistik untuk mengevaluasi kualitas data Anda.


Selain itu, sering kali orang yang tidak bekerja dengan data akan menetapkan target yang tidak masuk akal. Misalnya, departemen sales ingin meningkatkan jumlah penjualan sebesar 100% bulan depan. Untuk membuktikan apakah target ini masuk akal atau tidak, Anda perlu mengevaluasinya dari data yang ada saat ini. Analisis tren sederhana dan estimasi akan cukup, tetapi Anda bisa melakukannya hanya jika Anda memahami statistik dan bisnis.


Anda mungkin mengatakan, “Bukankah model machine learning dibuat untuk meningkatkan penjualan? Jika demikian, estimasi akan menjadi tidak berguna”. Nah, tujuan memiliki model machine learning adalah untuk memecahkan masalah bisnis, seperti meningkatkan jumlah penjualan. Meskipun benar, Anda tetap harus menjaga target Anda di bawah angka yang wajar.


Pasti akan ada masalah yang tidak diperkirakan oleh model pembelajaran mesin Anda; misalnya pengunduran diri salesman, restrukturisasi departemen, kecelakaan distribusi, dan masih banyak lagi. Memiliki ambisi memang bagus, tetapi cobalah untuk mencapai target yang dijanjikan dalam batas wajar.


Memilih Key Metrics yang sesuai juga bisa menjadi tanggung jawab Data Scientist, terutama ketika perusahaan baru mengadopsi bisnis yang data-driven. Dalam hal ini, bisnis dan statistik akan menjadi teman dekat Anda.

Kesimpulan

Data Scientist tidak dapat bekerja tanpa mengetahui Bisnis dan Statistik. Kedua aspek ini adalah peralatan kerja Data Scientist, dengan mengetahuinya dapat memberi Anda keunggulan menjadi Data Scientist yang lebih baik.


Sebagai Data Scientist, Anda perlu memahami aspek bisnis dan statistik karena:

  1. Proyek data bukan hanya tentang membersihkan data dan membuat model, tetapi melibatkan pemecahan masalah bisnis.

  2. Menilai apakah proyek data layak atau tidak untuk memecahkan masalah bisnis membutuhkan statistik.

  3. Statistik juga diperlukan untuk menentukan target yang wajar untuk proyek data Anda, karena model machine learning Anda tidak bisa memprediksi segalanya.

  4. Bisnis dan statistik adalah pengetahuan yang bisa Anda gunakan untuk meningkatkan posisi Anda di perusahaan atau ketika Anda melamar posisi Data Scientist.

Semoga bermanfaat!

14 tampilan0 komentar

コメント


bottom of page