Ada Lebih Banyak Ilmu Data daripada Pengembangan Perangkat Lunak

Pendapat

OSalah satu hal paling mengecewakan yang saya temukan saat berbicara dengan Data Scientist adalah fokus yang sangat besar pada pengembangan perangkat lunak. “Apakah Anda membuat kode dalam R atau Python? Panda punya fitur baru! Berapa tahun pengalaman yang Anda miliki dengan perpustakaan 'x'?”

Sejalan dengan itu, baru-baru ini saya melihat tweet bahwa Ilmu Data memiliki hambatan masuk yang sangat rendah. Tweet tersebut menyarankan bahwa yang harus Anda lakukan hanyalah mengikuti beberapa kursus pengembangan perangkat lunak secara online dan Anda siap melakukannya! Itu membuat perutku mual. Ini membingungkan seluruh bidang Ilmu Data dengan pengembangan perangkat lunak.

Mengapa Data Scientist berpura-pura menjadi pengembang perangkat lunak? Ilmu Data lebih dari itu. Sangat mengecewakan melihat Data Scientist secara khusus mendorong sisi pengembangan perangkat lunak di bidangnya.

Foto oleh James Healy on Unsplash

Apakah perangkat lunak penting bagi Data Scientist? Tentu saja. Apakah keterampilan coding merupakan bagian penting dari pekerjaan ini? Ya. Apakah ada banyak hal yang dapat dipelajari oleh Data Scientist dari pengembang perangkat lunak? Sangat. Apakah keterampilan pengembangan perangkat lunak merupakan atribut terpenting dari seorang Data Scientist? TIDAK.

Ketika kami mendorong pengembangan perangkat lunak sebagai bagian terpenting dari Ilmu Data, kami berisiko mengubah tim kami, dan bidang kami, menjadi departemen TI lain. Itu bukan untuk mengkritik pekerjaan TI. Saya telah bekerja dengan banyak bisnis besar, dan saya tidak dapat memberi tahu Anda berapa banyak individu yang sangat cerdas dan berbakat yang saya temui di departemen TI. Namun tim-tim tersebut memainkan peran tertentu dalam organisasi mereka. Secara umum, mereka tidak mengarahkan strategi bisnis secara keseluruhan. Namun, saya melihat begitu banyak Ilmuwan Data yang terjun ke bidang ini ingin memengaruhi keputusan besar dan penting dalam bisnis, lalu fokus sepenuhnya pada memaksimalkan keterampilan pengembangan perangkat lunak.

Pengembangan perangkat lunak adalah alat penting bagi Anda. Tapi itu bukan satu-satunya alat. Kita tidak bisa membuat janji-janji muluk untuk mendukung pengambilan keputusan penting bagi bisnis dan kemudian kembali berbicara secara eksklusif tentang pengembangan perangkat lunak.

Saya telah menulis tentang lebih banyak alat sikap yang dibutuhkan oleh Data Scientist di sini. Namun, bahkan dari sisi teknis, ada lebih dari sekedar perangkat lunak.

Ini adalah empat keterampilan penting, di luar pengembangan perangkat lunak, yang tidak dimiliki oleh banyak Data Scientist.

Latar Belakang Statistik Dasar

Anda tidak akan benar-benar memahami apa yang dilakukan kode Anda kecuali Anda mengetahui statistik dasar di baliknya. Saya telah bertemu dengan banyak Ilmuwan Data yang dapat membuat kode model deep-learning yang rumit dalam waktu singkat, namun mereka hampir tidak memahami arti dari distribusi normal.

Ilmuwan Data yang Terampil mengetahui dasar-dasar alat mereka. Mike Tyson mengatakannya dengan baik, “Semua orang punya rencana sampai wajahnya ditinju.” Nah, ketika model Ilmu Data Anda berperilaku buruk dan menyerang Anda, sering kali pemahaman tentang dasar-dasarnyalah yang memungkinkan Anda memperbaiki arah.

Foto oleh Bogdan Yukhymchuk on Unsplash

Anda harus memiliki dasar matematika dan statistik yang kuat. Apakah Anda familiar dengan konsep inti Statistik frequentist? Bagaimana dengan Statistik Bayesian? Jika Anda harus menulis kodesemu prinsip pertama untuk model yang Anda manfaatkan, bukan? Apa saja kesenjangan yang Anda lewatkan dan bagaimana cara mengisinya?

Lebih lanjut, saya berpendapat bahwa seringkali solusi terbaik dalam Ilmu Data lebih mendasar daripada yang diakui banyak orang. Keanggunan solusi sederhana dan mendasar adalah pelajaran yang telah berulang kali ditunjukkan oleh para Data Scientist paling sukses kepada saya.

Berpikir Kritis

Ilmuwan Data terbaik pandai memahami argumen, mempertanyakan orang lain, dan mengungkap kebenaran tentang apa yang dibawa seseorang ke dalam percakapan. Ilmu Data bukan tentang memuntahkan informasi baris demi baris; ada lebih banyak seni daripada itu. Seni yang bermula dari kemampuan menguraikan kualitas informasi yang Anda terima.

Beberapa kesalahan terbesar yang pernah saya lihat dalam proyek Ilmu Data dimulai ketika seseorang menganggap remeh informasi yang buruk, atau argumen yang lemah, tanpa menantangnya. Jika Anda mengerjakan sebuah proyek, tugas Anda adalah mengajukan pertanyaan yang tepat dan menganalisis situasinya dari awal. Mengatakan bahwa Anda menerima perintah atau mendapat informasi yang buruk adalah penolakan yang tidak akan membawa Anda terlalu jauh.

Menurut saya, pemikiran kritis adalah salah satu penentu paling kuat apakah seseorang akan berhasil dalam Ilmu Data. Pemikiran kritis diperlukan untuk posisi apa pun dalam bisnis, namun hal ini sangat penting terutama dalam Ilmu Data. Pertanyaan yang diajukan terlalu ambigu untuk ditangani tanpa pemeriksaan yang tepat. Mengapa? Karena dalam konteks bisnis Anda akan menerima banyak informasi, teori, dan opini. Beberapa di antaranya akan beralasan, dan beberapa di antaranya tidak terlalu beralasan. Sebagai Ilmuwan Data, Anda mencoba mengubah informasi dan ide tersebut menjadi model statistik. Jika Anda tidak dapat menguraikan kualitas informasi yang Anda terima, Anda akan tersesat di laut.

Foto oleh Anastasia Taioglou on Unsplash

Untuk membangun kekuatan dalam debat, Data Scientist memerlukan pengetahuan dasar tentang filsafat. Ada kursus gratis yang tersedia online yang akan membantu Anda mencapainya. Yang terbaik tidak ditargetkan pada Ilmu Data secara khusus. Bagi banyak Data Scientist, kursus-kursus tersebut akan membuat frustrasi — jawaban yang benar tidak akan bersifat hitam-putih. Itulah intinya.

Komunikasi

Sangat disayangkan, namun saya telah melihat model berkualitas tinggi gagal karena komunikasi yang buruk. Ilmuwan Data tidak dapat menjelaskan dengan jelas apa yang dilakukan model mereka atau apa maksud dari hasil tersebut. Karena tidak ada yang dapat memahami pekerjaan mereka, proyek tersebut dianggap gagal. Pada kenyataannya, hasilnya bisa sangat bermanfaat. Namun, jika Anda tidak dapat memberikan wawasan tersebut dengan cara yang jelas, bermakna, dan dapat diterima oleh klien dan anggota tim Anda, maka Anda tidak akan pernah mendapatkan dampak besar yang Anda inginkan.

Saya berani mengatakan bahwa tidak peduli seberapa baik proyek Ilmu Data dilaksanakan, proyek tersebut tidak akan dianggap berhasil tanpa komunikasi yang baik. Jika Anda tidak tahu seperti apa proyek Anda, maka Anda menempatkan semua kerja keras Anda dalam risiko untuk segera diberhentikan.

Foto oleh Pembuat Kampanye on Unsplash

Beberapa komunikasi yang baik berasal dari latar belakang statistik yang baik, dan beberapa dari kemampuan berpikir kritis yang kuat. Namun komunikasi, pada hakikatnya, adalah keterampilan utama. Itulah alasannya mengapa Anda sering menemukan orang-orang yang sangat cerdas tersingkir di sudut kantor yang gelap dan terpencil. Mereka hanya tidak tahu cara berkomunikasi dan akibatnya banyak dampak dari pekerjaan mereka yang hilang.

Ada sesuatu yang bisa dikatakan untuk melatih komunikasi secara khusus. Sekali lagi, ada banyak kursus online untuk membawa Anda ke level yang Anda inginkan. Dan sekali lagi, kursus terbaik tersebut tidak khusus untuk Ilmu Data.

Keahlian Domain

Baru-baru ini saya mendengar diskusi antara Data Scientist tentang analisis harga, bidang yang saya punya pengalaman. Saya dapat melihat kurangnya pemahaman tentang sisi bisnis dari pertanyaan tersebut. Para Data Scientist langsung mengajukan pertanyaan tentang pemilihan model, namun mereka hampir tidak memahami keterbatasan data praktis yang akan mereka hadapi. Tanpa keahlian domain, mereka sedang menuju kegagalan tertentu.

Hanya karena Anda bisa menanam tanaman hias, bukan berarti Anda bisa mengelola kebun anggur. Nuansa itu penting. Penting untuk mempelajari secara spesifik masalah yang ingin Anda selesaikan.

Foto oleh Jaime Casap on Unsplash

Kadang-kadang saya melihat ke dunia akademis dan bingung dengan keadaan Ilmu Data saat ini. Di dunia akademis, Anda memulai dengan keahlian domain dan kemudian menerapkan model statistik. Pemodelan statistik merupakan hal sekunder setelah pemahaman teoritis. Namun, dalam Ilmu Data kita memulai dengan pemodelan statistik dan sering kali mengabaikan pemahaman teoretis, keahlian domain, yang mendasari pertanyaan yang diajukan.

Apakah menurut saya model akademisnya sempurna? Jauh dari itu. Dan saya tidak akan merekomendasikan semua Ilmuwan Data untuk menjadi pakar domain. Namun, Data Scientist perlu menemukan cara untuk memasukkan keahlian domain ke dalam pekerjaan mereka. Baik melalui bekerja di ceruk industri tertentu atau dengan mencari mitra bisnis yang dapat memberikan latar belakang pengetahuan untuk suatu proyek.

Ada Lebih Banyak Ilmu Data daripada Pengembangan Perangkat Lunak Diterbitkan ulang dari Sumber https://towardsdatascience.com/theres-more-to-data-science-than-software-development-eb8c2fd5ac0c?source=rss—-7f60cf5620c9—4 melalui https:// menujudatascience.com/feed

<!–

->

Stempel Waktu:

Lebih dari Konsultan Blockchain