top of page
Gambar penulisCornellius Yudha Wijaya

7 Data Science Quote yang Perlu Diingat

7 Data Science Quote yang Perlu Diingat

Orang-orang suka membaca quotes karena quotes adalah kalimat singkat yang mengungkapkan kata bijak, berasal dari pengalaman, dan membangkitkan inspirasi. Saya suka quotes karena quotes cukup menarik untuk diingat dan mengubah cara berpikir menjadi lebih baik.


Apakah ada quotes di bidang Data Science? Ya, Data Science mungkin terdengar teknis, tetapi Data Science bukan hanya tentang mengetik kode dan membuat model. Ada banyak hal lain di dalamnya; Eksplorasi, Komunikasi, Kreativitas, Kejujuran, hanya beberapa hal terkait Data Science.


Sebagai seorang Data Scientist, saya cukup kaku. Saya percaya pada angka yang saya lihat, hasil statistik yang saya dapatkan, dan informasi dari data. Namun, saya juga manusia dengan kesadaran dan bukan robot; oleh karena itu, pikiran saya dibentuk oleh nasihat dari quotes yang saya baca. Saya percaya quotes dapat memberdayakan kita, dan oleh karena itu saya ingin berbagi beberapa quotes yang selalu saya ingat ketika bekerja sebagai Data Scientist.

“Data that is loved tends to survive.” -Kurt Bollacker

Anda mungkin berpikir akan bagus jika kita menyukai data dan data itu lolos dari beberapa kriteria? Jawabannya mungkin tidak. Mengapa? Karena ini dapat menyebabkan Survivorship Bias. Ini adalah kekeliruan di mana kita menarik kesimpulan dari kumpulan data yang tidak lengkap yang lolos dari seleksi kriteria kita.


Dalam kasus favoritisme, kita selalu mencoba memastikan data kita bertahan, baik disengaja atau tidak. Saya percaya ketika kita menyukai data tertentu, kita secara tidak sadar akan memikirkan kesimpulan yang kita inginkan, dan itu buruk. Bahkan jika kita ahli pada suatu bidang, kita tetap perlu bersikap netral terhadap data kita; berpikirlah seperti kita tidak tahu apa-apa dan biarkan data bercerita.


Kenyataan berbeda dengan idealisme. Saya selalu mencoba untuk menjadi “Data-Driven” sebisa mungkin, tetapi idealisme terkadang bukan pendekatan terbaik. Ketika berhadapan dengan pemangku kepentingan atau pimpinan, mungkin pemangku kepentingan ini menyukai data yang kita hapus dan mereka mengkritik kita karena itu.


Anda mungkin akan merasa tidak enak karena Anda tahu mana yang benar, tapi itulah kenyataannya; bekerja dengan seseorang berarti selalu ada orang yang berada di posisi lebih tinggi. Tetap ingat, Anda mungkin perlu berbohong karena pekerjaan Anda, tetapi cobalah untuk tetap berpikiran objektif dan Anda akan baik-baik saja.

“If you torture the data long enough, it will confess.” — Ronald H. Coase*

Oh, betapa saya menyukai quote ini dari Coase. Meskipun data bisa bercerita, kita selalu bisa mendapatkan kesimpulan apa pun yang kita inginkan jika kita “menyiksanya” cukup lama. Kata menyiksa disini bisa merujuk pada apa saja — Menghapus data, memilih metode tertentu, memasukkan data, dll.


Quote ini menggambarkan sejauh mana kita sebagai Data Scientist pperlu (atau mau) berusaha untuk mendapatkan kesimpulan tertentu yang kita inginkan. Melakukan upaya ekstra dalam memproses data tidak selalu buruk, tetapi tergantung pada niat kita.

Apakah Anda melakukan begitu banyak hal pada data karena Anda sudah memiliki kesimpulan di kepala? atau hanya karena Anda ingin menggali data tersebut?

Menjawab “Ya” untuk pertanyaan pertama akan menyebabkan bias dan berhati-hatilah jika Anda memiliki bias; itu berarti Anda cenderung menolak apa pun kecuali bias Anda. Menjawab “Ya” untuk pertanyaan kedua mungkin lebih baik, tetapi ingatlah untuk menyelesaikan masalah bisnis Anda terlebih dahulu. Saya tahu beberapa orang adalah maniak data.


Quote ini dekat dengan realita yang terjadi dalam kehidupan kerja sehari-hari. Pemangku kepentingan mungkin sudah memiliki kecenderungan yang ingin mereka lihat, dan kita sebagai Data Scientist mungkin hanya perlu menyiksa data sampai mereka mengaku sehingga pemangku kepentingan puas.

“The temptation to form premature theories upon insufficient data is the bane of our profession”. — Sherlock Holmes (from The Valley of Fear, by Sir Arthur Conan Doyle)

Ya, ini adalah quote dari seorang detektif, dan ya, ini dari karakter fiksi yang ditulis oleh Sir Arthur Conan Doyle. Namun, ini benar untuk profesi kita karena saya percaya bahwa Data Scientist adalah detektif dalam bentuk lain.


Quote ini tidak bisa menjelaskan dengan lebih baik apa yang perlu kita percayai sebagai Data Scientist; Jangan menarik kesimpulan sebelum kita memiliki data yang cukup (sufficient data). Meskipun beberapa orang dapat berargumen bahwa “cukup/sufficient” sulit untuk didefinisikan. Dalam kasus itu, kita perlu kembali ke subjek yang dapat membuktikan sufficiency — Statistik (atau keyakinan Anda, pemangku kepentingan, pengalaman, dll. tergantung pada keputusan Anda).


Dalam situasi apapun, usahakan untuk membangun portofolio data science dan pola pikir yang berpusat pada sufficiency data. Anda tidak ingin dituduh memberikan kesimpulan yang salah. Terutama untuk calon data scientist; seringkali data yang Anda dapatkan sudah bersih, terproses, dan cukup baik untuk dibawa ke langkah selanjutnya. Di dunia kerja nyata, hal itu jarang terjadi. Inilah sebabnya mengapa calon data scientist secara praktis tidak pernah mendapat kesempatan untuk menangani masalah data yang tidak sufficient. Saran saya, coba kumpulkan data sendiri untuk keperluan latihan.

“Every company has big data in its future, and every company will eventually be in the data business.” — Thomas Hayes Davenport

Secara pendidikan saya seorang ahli Biologi dan secara pekerjaan sebelumnya saya adalah peneliti. Saat ini, saya adalah seorang Data Scientist. Mungkin terlihat seperti perubahan drastis, tetapi sebenarnya tidak. Pengalaman saya sebelumnya dan apa yang saya lakukan sekarang pada dasarnya sama; hanya domain dan lingkungannya yang berbeda.


Alasan saya memilih bidang Data Science karena saya melihat masa depan akan mirip dengan quote di atas. Cepat atau lambat, semua hal akan berhubungan dengan data. Ini tidak bisa dihindari; Kita sudah hidup di era di mana data ada di mana-mana, dan kita perlu memanfaatkannya. Pada akhirnya, pepatah ‘pencuri pertama yang mendapat keuntungan’ artinya Anda harus memulainya lebih awal sebelum persaingan datang. Namun juga perlu diingat, selalu persiapkan rencana cadangan jika terjadi kegagalan.

“Talented data scientists leverage data that everybody sees; visionary data scientists leverage data that nobody sees.” — Vincent Granville

Quote ini mewakili aspirasi saya sebagai Data Scientist, dan saya merasa semua orang harus memiliki keinginan yang sama. Ketika data scientist berbakat dapat menggunakan data yang jelas untuk menjawab masalah bisnis, visioner sejati melihat pola yang tidak begitu jelas, dan itulah bakat sebenarnya. Anda memerlukan kreativitas dan pola pikir outside-of-the-box untuk dapat memahami data yang tidak terlihat.


Sebagai Data Scientist, saya masih terus berlatih pola pikir dan keterampilan saya untuk menjadi Visionary Data Scientist. Saya akan mengatakan jika seseorang benar-benar ingin masuk ke bidang Data Science, cobalah menjadi Visionary Data Scientist. Itulah yang akan membedakan Anda dari yang lain, bahkan dengan yang berbakat sekalipun.

“Data is not information, Information is not knowledge, Knowledge is not understanding, Understanding is not wisdom.” — Clifford Stoll

Beberapa orang tidak tahu perbedaan antara Data dan istilah terkait lainnya. Karena tidak semua orang ingin tahu apa itu Data dan bagaimana perbedaannya dari yang lain. Bagi saya, kutipan ini adalah pengingat terbaik untuk mendapatkan pola pikir yang benar.


Mengapa mengetahui perbedaan ini penting? Bukankah itu hanya semacam definisi yang tidak penting untuk pekerjaan Data Scientist?. Ini bukan hanya tentang bekerja dengan data, tetapi ini tentang cara berpikir kita. Pada akhirnya, ada perbedaan mendasar antara istilah-istilah tersebut.


Anda bisa mencoba membayangkan data seperti batu; itu hanya ada di sana dan tidak berguna sama sekali. Untuk mendapatkan sesuatu dari batu, kita perlu memolesnya agar menjadi berlian. Data juga sama; ketika kita membersihkan (atau mengubah dan menjelajahinya), itu akan menjadi sebuah informasi.


Seperti yang kita tahu, berlian itu mahal, tetapi itu karena kita sudah menganalisis batu dan memutuskan bahwa berlian itu berharga. Seperti Informasi, itu akan tetap sebagai informasi dan tidak akan menjadi pengetahuan tanpa proses analisis.


Hanya karena kita tahu harga berlian tidak berarti kita memahami berlian itu sendiri; mengapa itu mahal? Mengapa warnanya cerah? dll. Kita memiliki pengetahuan, tetapi kita perlu mengajukan pertanyaan yang tepat untuk memahami sepenuhnya.


Terakhir, kita mungkin tahu segalanya tentang berlian, tetapi itu tidak berarti kita bisa tiba-tiba menjadi kaya dari itu; kita perlu menjualnya kepada orang yang tepat. Kita mungkin memahami segalanya, tetapi hanya dengan menerapkan pemahaman kita pada situasi yang tepat, kita bisa memanfaatkan semua data.

“If we have data, let’s look at data. If all we have are opinions, let’s go with mine.” — James Love Barksdale

Ini adalah Quote sederhana yang suka saya renungkan setiap kali saya berdebat. Ketika berdebat, mari kita lihat datanya jika ada. Saya percaya pada data, daripada kata-kata rumit atau imajinasi dalam bentuk kata-kata indah. Jika data tidak mendukung argumen, lebih baik mengikuti pendapat saya karena tidak ada yang bisa dibuktikan. Pada akhirnya, jika tidak ada yang tahu apa-apa, ikuti saja nasihat yang Anda rasa benar.

Kesimpulan

Berikut adalah beberapa kutipan yang saya ingat sebagai Data Scientist. Memang, pekerjaan ini tidak semegah seperti programming dan membuat model machine learning, tetapi Data Scientist masih manusia dan oleh karena itu memerlukan pola pikir yang tepat untuk menjadi Data Scientist yang hebat.


86 tampilan0 komentar

Comments


bottom of page