Det finns mer inom datavetenskap än mjukvaruutveckling

Yttrande

OEn av de mest stötande sakerna jag hittar när jag pratar med dataforskare är ett laserliknande fokus på mjukvaruutveckling. "Kodar du i R eller Python? Pandas har en ny funktion! Hur många års erfarenhet har du av biblioteket 'x'?”

I den riktningen såg jag nyligen en tweet om att Data Science har extremt låga inträdesbarriärer. Tweeten föreslog att allt du behöver göra är att ta några programvaruutvecklingskurser online och du är igång! Det fick mig att kurra i magen. Det förväxlade hela området Data Science med mjukvaruutveckling.

Varför utger sig dataforskare för att vara mjukvaruutvecklare? Data Science är så mycket mer än så. Det är en enorm besvikelse att se Data Scientists enskilt driva på mjukvaruutvecklingssidan av fältet.

Foto: James Healy on Unsplash

Är programvara viktig för dataforskare? Självklart. Är skicklig kodning en stor del av arbetet? Ja. Finns det mycket som dataforskare kan lära sig av mjukvaruutvecklare? Absolut. Är färdigheter i mjukvaruutveckling den viktigaste egenskapen hos en dataforskare? Nej.

När vi driver mjukvaruutveckling som den singular viktigaste delen av Data Science riskerar vi att förvandla våra team och vårt område till en annan IT-avdelning. Det är inte för att kritisera IT-arbetet. Jag har arbetat med många stora företag och jag kunde inte berätta hur många otroligt smarta, begåvade individer jag har träffat inom IT-avdelningar. Men dessa team spelar definierade roller i sina organisationer. I allmänhet driver de inte den övergripande affärsstrategin. Ändå ser jag så många dataforskare som kommer in på fältet och vill påverka stora, viktiga beslut i ett företag och sedan fokuserar helt på att maximera färdigheter i mjukvaruutveckling.

Mjukvaruutveckling är ett viktigt verktyg i ditt bälte. Men det är inte det enda verktyget. Vi kan inte ge höga löften om att stödja affärskritiskt beslutsfattande och sedan återgå till att enbart prata om mjukvaruutveckling.

Jag har skrivit om de mer attitydverktyg som Data Scientists behöver här.. Men även på den tekniska sidan finns det mer än bara mjukvara.

Dessa är de fyra kritiska färdigheter, utanför mjukvaruutveckling, som många dataforskare saknar.

Grundläggande statistisk bakgrund

Du kommer inte riktigt att förstå vad din kod gör om du inte känner till den grundläggande statistiken bakom den. Jag har stött på många dataforskare som kunde koda en komplicerad djupinlärningsmodell på nolltid, men de fattade knappt innebörden av en normalfördelning.

Skickliga dataforskare känner till grunden för sina verktyg. Mike Tyson sa det bra "Alla har en plan tills de får ett slag i ansiktet." Tja, när din Data Science-modell beter sig illa och slår dig i ansiktet, är det ofta en förståelse för grunderna som gör att du kan korrigera kursen.

Foto: Bogdan Yukhymchuk on Unsplash

Du ska ha en solid matematisk och statistisk grund. Är du bekant med kärnbegreppen i Frequentist Statistics? Hur är det med Bayesian Statistics? Om du var tvungen att skriva den första pseudokoden för en modell som du använder, skulle du kunna? Vilka är luckorna som du saknar och hur fyller du dem?

Vidare vill jag hävda att de bästa lösningarna inom Data Science ofta är mer grundläggande än många skulle vilja erkänna. Elegansen med enkla, grundläggande lösningar är en läxa som de mest framgångsrika dataforskarna har visat mig upprepade gånger.

Kritiskt tänkande

De bästa dataforskarna är bra på att förstå argument, ifrågasätta andra och reta ut sanningen om vad någon tar med sig till konversationen. Data Science handlar inte om att få upp information rad för rad; det finns mycket mer konst i det än så. Konst som härrör från att kunna tyda kvaliteten på informationen du får.

Några av de största missarna jag har sett i Data Science-projekt började med att någon tog dålig information, eller ett svagt argument, för givet utan att ifrågasätta den. Om du tar dig an ett projekt är det din uppgift att ställa rätt frågor och analysera situationen från början. Att säga att du tog emot beställningar eller fick dålig information är en utmaning som inte kommer dig särskilt långt.

Jag tycker att kritiskt tänkande är en av de mest kraftfulla bestämningsfaktorerna för om någon kommer att lyckas inom Data Science. Kritiskt tänkande behövs för alla positioner i näringslivet, men det är särskilt viktigt inom datavetenskap. Frågorna som ställs är för tvetydiga för att kunna hanteras utan ordentlig granskning. Varför? För i affärssammanhang kommer du att ta emot mycket information, teorier och åsikter. En del av det kommer att vara välgrundat, och en del av det inte så mycket. Som dataforskare försöker du omvandla den informationen och de idéerna till statistiska modeller. Om du inte kan tyda kvaliteten på informationen du får kommer du att gå vilse till sjöss.

Foto: Anastasia Taioglou on Unsplash

För att bygga dessa muskler för debatt behöver datavetare en grundläggande kunskap om filosofi. Det finns gratis kurser tillgängliga online som hjälper dig att komma dit. De bästa är inte inriktade på Data Science specifikt. För många dataforskare kommer dessa kurser att kännas frustrerande – de rätta svaren kommer inte att vara svartvita. Det är poängen.

Kommunikation

Det är olyckligt, men jag har sett högkvalitativa modeller misslyckas på grund av dålig kommunikation. Dataforskaren kunde inte förklara tydligt vad deras modell gjorde eller vad resultaten betydde. Eftersom ingen kunde förstå deras arbete ansågs projektet vara ett misslyckande. I själva verket kunde resultaten ha varit enormt insiktsfulla. Men om du inte kan dra fram dessa insikter på ett tydligt, meningsfullt och relaterbart sätt för dina kunder och teammedlemmar, kommer du aldrig att få den stora inverkan du siktat på.

Jag skulle gå så långt som att säga att oavsett hur väl genomfört ett Data Science-projekt är, kommer det inte att anses vara en framgång utan korrekt kommunikation. Om du inte vet hur det ser ut för ditt projekt, riskerar du att snabbt bli avskedad med allt ditt hårda arbete.

Foto: Kampanjskapare on Unsplash

En del bra kommunikation kommer från att ha en bra statistisk bakgrund, och en del från starka kritiska tänkande. Men kommunikation, i sin egen rätt, är en nyckelfärdighet. Det är anledningen till att du ofta hittar otroligt smarta människor besegrade till ett mörkt, isolerat hörn av kontoret. De vet helt enkelt inte hur de ska kommunicera och resultatet är att mycket av effekten av deras arbete går förlorad.

Det finns något att säga för att specifikt träna kommunikation. Återigen, det finns många kurser online för att få dig till den nivå du behöver vara. Och återigen, de bästa av dessa kurser är inte specifika för datavetenskap.

Domänkompetens

Jag hörde nyligen en diskussion mellan dataforskare om prisanalys, ett område som jag har viss erfarenhet av. Jag kunde se bristen på förståelse för affärssidan av frågan. Dataforskarna hoppade rakt in i frågor om modellval, men de hade nästan ingen koll på de praktiska databegränsningarna de skulle möta. Utan domänexpertis var de på väg mot ett visst misslyckande.

Bara för att du kan odla en krukväxt betyder det inte att du kan driva en vingård. Nyanser spelar roll. Det är viktigt att lära sig detaljerna för det problem du planerar att lösa.

Foto: Jaime Casap on Unsplash

Ibland ser jag till den akademiska världen och är förbryllad över det nuvarande tillståndet inom datavetenskap. Inom akademin börjar man med domänexpertis och tillämpar sedan statistiska modeller. Statistisk modellering är sekundärt till teoretisk förståelse. Ändå, inom Data Science börjar vi med statistisk modellering och försummar ofta den teoretiska förståelsen, domänexpertisen, som ligger till grund för frågorna som ställs.

Tycker jag att den akademiska modellen är perfekt? Långt ifrån. Och jag skulle inte rekommendera att alla dataforskare är domänexperter. Men dataforskare behöver hitta ett sätt att införliva domänexpertis i sitt arbete. Vare sig genom att arbeta i en specifik branschnisch eller genom att hitta affärspartners som kan ge bakgrundskunskap till ett projekt.

Det finns mer i datavetenskap än mjukvaruutveckling publicerad på nytt från källan https://towardsdatascience.com/theres-more-to-data-science-than-software-development-eb8c2fd5ac0c?source=rss—-7f60cf5620c9—4 via https:// mot datascience.com/feed

<!–

->

Tidsstämpel:

Mer från Blockchain-konsulter