Data Science is meer dan softwareontwikkeling

Advies

OEen van de meest onaangename dingen die ik tegenkom als ik met datawetenschappers praat, is een laserachtige focus op softwareontwikkeling. “Codeer je in R of Python? Panda's heeft een nieuwe functie! Hoeveel jaar ervaring heb je met bibliotheek ‘x’?”

In die zin zag ik onlangs een tweet dat Data Science extreem lage toetredingsdrempels kent. De tweet suggereerde dat je alleen maar een aantal softwareontwikkelingscursussen online hoeft te volgen en je bent klaar om te gaan! Het deed mijn maag omdraaien. Het verwarde het hele vakgebied van Data Science met softwareontwikkeling.

Waarom doen datawetenschappers zich voor als softwareontwikkelaars? Data Science is zoveel meer dan dat. Het is enorm teleurstellend om te zien dat datawetenschappers op unieke wijze de softwareontwikkelingskant van het vakgebied stimuleren.

Foto door James Healey on Unsplash

Is software belangrijk voor datawetenschappers? Natuurlijk. Is vakkundig coderen een groot deel van het werk? Ja. Kunnen datawetenschappers veel leren van softwareontwikkelaars? Absoluut. Zijn softwareontwikkelingsvaardigheden het belangrijkste kenmerk van een datawetenschapper? Nee.

Wanneer we softwareontwikkeling als het allerbelangrijkste onderdeel van Data Science pushen, lopen we het risico dat onze teams en ons vakgebied in een andere IT-afdeling veranderen. Dat is niet om IT-werk te bekritiseren. Ik heb met veel grote bedrijven gewerkt, en ik kan je niet vertellen hoeveel ongelooflijk slimme, getalenteerde individuen ik heb ontmoet binnen de IT-afdelingen. Maar die teams spelen gedefinieerde rollen in hun organisaties. Over het algemeen zijn ze niet bepalend voor de algemene bedrijfsstrategie. Toch zie ik zoveel datawetenschappers die het veld ingaan en grote, belangrijke beslissingen in een bedrijf willen beïnvloeden en zich vervolgens volledig richten op het maximaliseren van softwareontwikkelingsvaardigheden.

Softwareontwikkeling is een belangrijk hulpmiddel in uw riem. Maar het is niet het enige hulpmiddel. We kunnen geen verheven beloften doen over het ondersteunen van bedrijfskritische besluitvorming en dan weer uitsluitend over softwareontwikkeling praten.

Ik heb geschreven over de meer houdingsinstrumenten die datawetenschappers nodig hebben hier. Maar ook aan de technische kant is er meer dan alleen software.

Dit zijn de vier cruciale vaardigheden, buiten de softwareontwikkeling, die veel datawetenschappers missen.

Basisstatistische achtergrond

U zult niet echt begrijpen wat uw code doet, tenzij u de basisstatistieken erachter kent. Ik ben veel datawetenschappers tegengekomen die in een mum van tijd een ingewikkeld deep-learning-model konden coderen, maar die nauwelijks de betekenis van een normale verdeling begrepen.

Geschoolde datawetenschappers kennen de basis van hun tools. Mike Tyson zei het goed: "Iedereen heeft een plan totdat ze in het gezicht worden geslagen." Welnu, als uw Data Science-model zich misdraagt ​​en u in het gezicht slaat, is het vaak een goed begrip van de grondbeginselen waarmee u de koers kunt corrigeren.

Foto door Bogdan Yukhymchuk on Unsplash

Je moet over een solide wiskundige en statistische basis beschikken. Bent u bekend met de kernbegrippen van Frequentist Statistics? Hoe zit het met de Bayesiaanse statistiek? Als u de eerste pseudocode zou moeten schrijven voor een model dat u gebruikt, zou u dat dan kunnen doen? Wat zijn de gaten die je mist en hoe vul je die in?

Verder zou ik willen betogen dat de beste oplossingen in Data Science vaak fundamenteler zijn dan velen zouden willen toegeven. De elegantie van eenvoudige, fundamentele oplossingen is een les die de meest succesvolle datawetenschappers mij herhaaldelijk hebben laten zien.

Kritisch Denken

De beste datawetenschappers zijn goed in het begrijpen van argumenten, het ondervragen van anderen en het achterhalen van de waarheid over wat iemand in het gesprek brengt. Data Science gaat niet over het regel voor regel opnieuw uitbraken van informatie; er zit veel meer kunst in dan dat. Kunst die voortkomt uit het kunnen ontcijferen van de kwaliteit van de informatie die je ontvangt.

Enkele van de grootste missers die ik in Data Science-projecten heb gezien, begonnen met iemand die slechte informatie of een zwak argument als vanzelfsprekend aannam zonder deze ter discussie te stellen. Als u een project op zich neemt, is het uw taak om de juiste vragen te stellen en de situatie vanaf het begin te analyseren. Als u zegt dat u bevelen aannam of met slechte informatie op pad ging, is dat een ontsnapping waarmee u niet ver komt.

Ik vind kritisch denken een van de krachtigste bepalende factoren of iemand zal slagen in Data Science. Kritisch denken is nodig voor elke functie in het bedrijfsleven, maar is vooral cruciaal in Data Science. De gestelde vragen zijn te dubbelzinnig om zonder goed onderzoek te kunnen worden beantwoord. Waarom? Omdat je in een zakelijke context te maken krijgt met veel informatie, theorieën en meningen. Een deel ervan zal gegrond zijn, en een deel ervan niet zozeer. Als Data Scientist probeer je die informatie, en die ideeën, om te zetten in statistische modellen. Als u de kwaliteit van de informatie die u ontvangt niet kunt ontcijferen, raakt u verdwaald op zee.

Foto door Anastasia Taioglou on Unsplash

Om spieren op te bouwen voor debat hebben datawetenschappers een basiskennis van de filosofie nodig. Er zijn gratis cursussen online beschikbaar die u daarbij kunnen helpen. De beste zijn niet specifiek gericht op Data Science. Voor veel datawetenschappers zullen deze cursussen frustrerend zijn; de juiste antwoorden zullen niet zwart-wit zijn. Dat is het punt.

Communicatie

Het is jammer, maar ik heb modellen van hoge kwaliteit zien mislukken vanwege slechte communicatie. De datawetenschapper kon niet duidelijk uitleggen wat hun model deed of wat de resultaten betekenden. Omdat niemand hun werk kon bevatten, werd het project als een mislukking beschouwd. In werkelijkheid hadden de resultaten enorm inzichtelijk kunnen zijn. Als u deze inzichten echter niet op een duidelijke, betekenisvolle en herkenbare manier naar uw klanten en teamleden kunt brengen, zult u nooit de grote impact bereiken waar u naar streefde.

Ik zou zelfs willen zeggen dat hoe goed een Data Science-project ook wordt uitgevoerd, het zonder de juiste communicatie niet als een succes zal worden beschouwd. Als u niet weet hoe dat er voor uw project uitziet, loopt u het risico dat al uw harde werk snel wordt afgewezen.

Foto door Campagnemakers on Unsplash

Sommige goede communicatie komt voort uit het hebben van een goede statistische achtergrond, en sommige uit sterke kritische denkvaardigheden. Maar communicatie is op zichzelf een sleutelvaardigheid. Het is de reden dat je vaak ongelooflijk slimme mensen tegenkomt in een donkere, geïsoleerde hoek van het kantoor. Ze weten gewoon niet hoe ze moeten communiceren en het resultaat is dat een groot deel van de impact van hun werk verloren gaat.

Er valt iets te zeggen voor het specifiek beoefenen van communicatie. Nogmaals, er zijn veel cursussen online om je op het niveau te brengen dat je nodig hebt. En nogmaals, de beste van die cursussen zijn niet specifiek voor Data Science.

Domeindeskundigheid

Onlangs hoorde ik een discussie tussen datawetenschappers over prijsanalyse, een vakgebied waarmee ik enige ervaring heb. Ik kon het gebrek aan begrip van de zakelijke kant van de vraag zien. De datawetenschappers begonnen meteen met vragen over modelselectie, maar ze hadden bijna geen idee van de praktische databeperkingen waarmee ze te maken zouden krijgen. Zonder domeinexpertise waren ze op weg naar een zekere mislukking.

Het feit dat je een kamerplant kunt kweken, betekent niet dat je een wijngaard kunt runnen. Nuances zijn belangrijk. Het is van cruciaal belang dat u de details kent van het probleem dat u wilt oplossen.

Foto door Jaime Casap on Unsplash

Soms kijk ik naar de academische wereld en ben verbijsterd door de huidige staat van Data Science. In de academische wereld begin je met domeinexpertise en pas je vervolgens statistische modellen toe. Statistische modellering is ondergeschikt aan theoretisch begrip. Toch beginnen we bij Data Science met statistische modellering en verwaarlozen we vaak het theoretische inzicht, de domeinexpertise, die ten grondslag ligt aan de vragen die worden gesteld.

Denk ik dat het academische model perfect is? Verre van dat. En ik zou niet aanraden dat alle datawetenschappers domeinexperts zijn. Maar datawetenschappers moeten wel een manier vinden om domeinexpertise in hun werk te integreren. Of het nu gaat om het werken in een specifieke brancheniche of door het vinden van zakenpartners die achtergrondkennis voor een project kunnen bieden.

Data Science is meer dan softwareontwikkeling. Opnieuw gepubliceerd vanuit de bron https://towardsdatascience.com/theres-more-to-data-science-than-software-development-eb8c2fd5ac0c?source=rss—-7f60cf5620c9—4 via https:// richtingdatascience.com/feed

<!–

->

Tijdstempel:

Meer van Blockchain-adviseurs