در علم داده بیشتر از توسعه نرم افزار وجود دارد

نظر

Oیکی از بدترین چیزهایی که من هنگام صحبت با دانشمندان داده می یابم تمرکز لیزری بر توسعه نرم افزار است. «آیا با R کد می‌زنید یا پایتون؟ پانداها یک ویژگی جدید دارند! چند سال سابقه کار با کتابخانه x را دارید؟

در همین راستا، اخیراً توییتی دیدم مبنی بر اینکه Data Science موانع بسیار کمی برای ورود دارد. توییت پیشنهاد می‌کرد که تنها کاری که باید انجام دهید این است که برخی از دوره‌های توسعه نرم‌افزار را به صورت آنلاین بگذرانید و آماده رفتن هستید! باعث شد شکمم تکون بخوره کل حوزه علم داده را با توسعه نرم افزار اشتباه گرفت.

چرا دانشمندان داده وانمود می کنند که توسعه دهندگان نرم افزار هستند؟ علم داده خیلی بیشتر از این است. مشاهده اینکه دانشمندان داده به طور منحصر به فردی در سمت توسعه نرم افزار در این زمینه پیش می روند، بسیار ناامید کننده است.

عکس جیمز هیلی on می Unsplash

آیا نرم افزار برای دانشمندان داده مهم است؟ البته. آیا کدنویسی ماهر بخش بزرگی از کار است؟ آره. آیا دانشمندان داده می توانند چیزهای زیادی از توسعه دهندگان نرم افزار بیاموزند؟ کاملا. آیا مهارت های توسعه نرم افزار مهمترین ویژگی یک دانشمند داده است؟ خیر

وقتی توسعه نرم‌افزار را به‌عنوان مهم‌ترین بخش علم داده مطرح می‌کنیم، در خطر تبدیل تیم‌ها و حوزه خود به بخش فناوری اطلاعات دیگری هستیم. این به معنای انتقاد از کار فناوری اطلاعات نیست. من با بسیاری از کسب و کارهای بزرگ کار کرده ام، و نمی توانم به شما بگویم که با چه تعداد از افراد فوق العاده باهوش و با استعداد در بخش های IT ملاقات کرده ام. اما این تیم ها نقش های مشخصی را در سازمان خود ایفا می کنند. به طور کلی، آنها استراتژی کلی کسب و کار را هدایت نمی کنند. با این حال، من تعداد زیادی از دانشمندان داده را می بینم که وارد این حوزه می شوند و می خواهند بر تصمیمات مهم و بزرگ در یک تجارت تأثیر بگذارند و سپس کاملاً روی به حداکثر رساندن مهارت های توسعه نرم افزار تمرکز می کنند.

توسعه نرم افزار یک ابزار مهم در کمربند شما است. اما این تنها ابزار نیست. ما نمی‌توانیم در مورد حمایت از تصمیم‌گیری‌های حیاتی برای کسب‌وکار، وعده‌های بلندی بدهیم و سپس به صحبت منحصراً درباره توسعه نرم‌افزار برگردیم.

من در مورد ابزارهای نگرشی بیشتری که دانشمندان داده نیاز دارند، نوشته ام اینجا کلیک نمایید. با این حال، حتی در جنبه فنی، چیزی بیش از نرم افزار وجود دارد.

اینها چهار مهارت حیاتی خارج از توسعه نرم افزار هستند که بسیاری از دانشمندان داده فاقد آن هستند.

پیشینه آماری پایه

شما واقعاً متوجه نمی شوید که کد شما چه کاری انجام می دهد مگر اینکه آمار اولیه پشت آن را بدانید. من با بسیاری از دانشمندان داده مواجه شده ام که می توانند یک مدل یادگیری عمیق پیچیده را در کمترین زمان رمزگذاری کنند، اما آنها به سختی معنای توزیع نرمال را درک کردند.

Skilled Data Scientists اساس ابزارهای خود را می دانند. مایک تایسون به خوبی گفت: «هر کس تا زمانی که به صورتش مشت بزند برنامه‌ای دارد». خوب، وقتی مدل علم داده شما بد رفتار می کند و به صورت شما مشت می زند، اغلب درک اصول اولیه است که به شما امکان می دهد مسیر را اصلاح کنید.

عکس بوگدان یوخیمچوک on می Unsplash

شما باید یک پایه ریاضی و آماری محکم داشته باشید. آیا با مفاهیم اصلی آمار متداول آشنا هستید؟ در مورد آمار بیزی چطور؟ اگر مجبور بودید اولین شبه کد اصلی را برای مدلی بنویسید که از آن استفاده می کنید، آیا می توانید؟ چه شکاف هایی را از دست داده اید و چگونه آنها را پر می کنید؟

علاوه بر این، من استدلال می‌کنم که اغلب بهترین راه‌حل‌ها در علم داده بنیادی‌تر از آن چیزی هستند که بسیاری دوست دارند بپذیرند. ظرافت راه حل های ساده و اساسی درسی است که موفق ترین دانشمندان داده بارها به من نشان داده اند.

تفکر انتقادی

بهترین دانشمندان داده در درک بحث‌ها، زیر سوال بردن دیگران، و به زبان آوردن حقیقت چیزی که کسی به گفتگو می‌آورد خوب هستند. علم داده در مورد بازگرداندن خط به خط اطلاعات نیست. هنر بسیار بیشتری در آن وجود دارد. هنری که از توانایی رمزگشایی از کیفیت اطلاعاتی که دریافت می کنید ناشی می شود.

برخی از بزرگ‌ترین اشتباهاتی که در پروژه‌های علم داده دیده‌ام، با کسی شروع شد که اطلاعات بد یا یک استدلال ضعیف را بدون به چالش کشیدن آن بدیهی می‌گرفت. اگر پروژه‌ای را انجام می‌دهید، این وظیفه شماست که سؤالات درستی بپرسید و از ابتدا وضعیت را تحلیل کنید. اینکه بگوییم سفارش می‌گیرید یا اطلاعات بدی در اختیار شما قرار داده‌اید، پلیسی است که شما را خیلی دور نمی‌برد.

به نظر من تفکر انتقادی یکی از قوی ترین عوامل تعیین کننده موفقیت فردی در علم داده است. تفکر انتقادی برای هر موقعیتی در تجارت مورد نیاز است، اما به ویژه در علم داده بسیار مهم است. سوالات مطرح شده بیش از حد مبهم هستند که بدون بررسی مناسب قابل حل نیستند. چرا؟ زیرا در یک زمینه تجاری اطلاعات، تئوری ها و نظرات زیادی را دریافت خواهید کرد. برخی از آن مستدل خواهد بود، و برخی از آن نه چندان. به عنوان یک دانشمند داده، شما سعی می کنید آن اطلاعات و ایده ها را به مدل های آماری تبدیل کنید. اگر نتوانید کیفیت اطلاعات دریافتی را رمزگشایی کنید، در دریا گم خواهید شد.

عکس آناستازیا تایوگلو on می Unsplash

برای ایجاد این عضلات برای بحث، دانشمندان داده نیاز به دانش پایه ای از فلسفه دارند. دوره های آنلاین رایگان وجود دارد که به شما کمک می کند تا به آنجا بروید. بهترین ها به طور خاص در Data Science هدف قرار نمی گیرند. برای بسیاری از دانشمندان داده، این دوره ها ناامید کننده خواهند بود - پاسخ های درست سیاه و سفید نخواهد بود. نکته همین است.

ارتباط

مایه تاسف است، اما من دیده ام که مدل های باکیفیت به دلیل ارتباط ضعیف شکست می خورند. دانشمند داده نمی تواند به وضوح توضیح دهد که مدل آنها چه کار می کند یا نتایج به چه معناست. از آنجایی که هیچ کس نمی توانست کار آنها را درک کند، پروژه شکست خورده تلقی شد. در واقع، نتایج می توانست بسیار روشنگر باشد. با این حال، اگر نتوانید این بینش‌ها را به روشی واضح، معنادار و قابل ربط برای مشتریان و اعضای تیم خود بیرون بیاورید، هرگز نمی‌توانید تأثیر بزرگی را که هدف آن بودید، داشته باشید.

تا آنجا پیش می‌روم که می‌گویم هر چقدر هم که یک پروژه علم داده به خوبی اجرا شود، بدون ارتباط مناسب موفقیت‌آمیز تلقی نمی‌شود. اگر نمی دانید پروژه شما چگونه به نظر می رسد، تمام تلاش خود را در معرض خطر اخراج سریع قرار می دهید.

عکس سازندگان کمپین on می Unsplash

برخی ارتباطات خوب از داشتن پیشینه آماری خوب و برخی دیگر از مهارت های تفکر انتقادی قوی ناشی می شود. اما ارتباط، در نوع خود، یک مهارت کلیدی است. به همین دلیل است که اغلب افراد فوق‌العاده باهوش را می‌بینید که در گوشه‌ای تاریک و منزوی از دفتر مغلوب شده‌اند. آنها فقط نمی دانند چگونه ارتباط برقرار کنند و نتیجه این است که بسیاری از تأثیر کار آنها از بین می رود.

برای تمرین خاص ارتباط چیزی باید گفت. مجدداً، دوره های زیادی به صورت آنلاین وجود دارد تا شما را به سطحی که باید باشید، برساند. و باز هم، بهترین این دوره ها مختص علم داده نیستند.

تخصص دامنه

من اخیراً بحثی را بین Data Scientists درباره تجزیه و تحلیل قیمت‌ها شنیدم، حوزه‌ای که تجربه‌ای در آن دارم. می‌توانستم عدم درک جنبه تجاری سؤال را ببینم. دانشمندان داده مستقیماً به پرسش‌هایی درباره انتخاب مدل می‌پرداختند، اما تقریباً هیچ درک از محدودیت‌های داده‌های عملی که با آن مواجه بودند نداشتند. بدون تخصص دامنه، آنها مسیری را به سمت شکست قطعی در پیش گرفتند.

فقط به این دلیل که می توانید یک گیاه آپارتمانی پرورش دهید، به این معنی نیست که می توانید یک تاکستان را اداره کنید. تفاوت های ظریف مهم است. یادگیری جزئیات مشکلی که قصد حل آن را دارید بسیار مهم است.

عکس جیمی کاسپ on می Unsplash

گاهی به دانشگاه نگاه می کنم و از وضعیت فعلی علم داده گیج می شوم. در دانشگاه، شما با تخصص حوزه شروع می کنید و سپس مدل های آماری را اعمال می کنید. مدل سازی آماری در درجه دوم درک نظری قرار دارد. با این حال، در علم داده ما با مدل‌سازی آماری شروع می‌کنیم و اغلب از درک نظری، تخصص حوزه، که زیربنای سؤالات مطرح شده است، غفلت می‌کنیم.

آیا به نظر من مدل تحصیلی کامل است؟ دور از آن. و من توصیه نمی کنم که همه دانشمندان داده متخصص حوزه باشند. اما، دانشمندان داده باید راهی بیابند تا تخصص دامنه را در کار خود بگنجانند. چه از طریق کار در یک صنعت خاص و چه از طریق یافتن شرکای تجاری که می توانند دانش پس زمینه یک پروژه را ارائه دهند.

در علم داده چیزهای بیشتری نسبت به توسعه نرم افزار وجود دارد که بازنشر شده از منبع https://towardsdatascience.com/theres-more-to-data-science-than-software-development-eb8c2fd5ac0c?source=rss—-7f60cf5620c9—4 از طریق https:// todatascience.com/feed

<!–

->

تمبر زمان:

بیشتر از مشاوران بلاک چین