نظر
چهار مهارت که نرم افزار نیستند
Oیکی از بدترین چیزهایی که من هنگام صحبت با دانشمندان داده می یابم تمرکز لیزری بر توسعه نرم افزار است. «آیا با R کد میزنید یا پایتون؟ پانداها یک ویژگی جدید دارند! چند سال سابقه کار با کتابخانه x را دارید؟
در همین راستا، اخیراً توییتی دیدم مبنی بر اینکه Data Science موانع بسیار کمی برای ورود دارد. توییت پیشنهاد میکرد که تنها کاری که باید انجام دهید این است که برخی از دورههای توسعه نرمافزار را به صورت آنلاین بگذرانید و آماده رفتن هستید! باعث شد شکمم تکون بخوره کل حوزه علم داده را با توسعه نرم افزار اشتباه گرفت.
چرا دانشمندان داده وانمود می کنند که توسعه دهندگان نرم افزار هستند؟ علم داده خیلی بیشتر از این است. مشاهده اینکه دانشمندان داده به طور منحصر به فردی در سمت توسعه نرم افزار در این زمینه پیش می روند، بسیار ناامید کننده است.
آیا نرم افزار برای دانشمندان داده مهم است؟ البته. آیا کدنویسی ماهر بخش بزرگی از کار است؟ آره. آیا دانشمندان داده می توانند چیزهای زیادی از توسعه دهندگان نرم افزار بیاموزند؟ کاملا. آیا مهارت های توسعه نرم افزار مهمترین ویژگی یک دانشمند داده است؟ خیر
وقتی توسعه نرمافزار را بهعنوان مهمترین بخش علم داده مطرح میکنیم، در خطر تبدیل تیمها و حوزه خود به بخش فناوری اطلاعات دیگری هستیم. این به معنای انتقاد از کار فناوری اطلاعات نیست. من با بسیاری از کسب و کارهای بزرگ کار کرده ام، و نمی توانم به شما بگویم که با چه تعداد از افراد فوق العاده باهوش و با استعداد در بخش های IT ملاقات کرده ام. اما این تیم ها نقش های مشخصی را در سازمان خود ایفا می کنند. به طور کلی، آنها استراتژی کلی کسب و کار را هدایت نمی کنند. با این حال، من تعداد زیادی از دانشمندان داده را می بینم که وارد این حوزه می شوند و می خواهند بر تصمیمات مهم و بزرگ در یک تجارت تأثیر بگذارند و سپس کاملاً روی به حداکثر رساندن مهارت های توسعه نرم افزار تمرکز می کنند.
توسعه نرم افزار یک ابزار مهم در کمربند شما است. اما این تنها ابزار نیست. ما نمیتوانیم در مورد حمایت از تصمیمگیریهای حیاتی برای کسبوکار، وعدههای بلندی بدهیم و سپس به صحبت منحصراً درباره توسعه نرمافزار برگردیم.
من در مورد ابزارهای نگرشی بیشتری که دانشمندان داده نیاز دارند، نوشته ام اینجا کلیک نمایید. با این حال، حتی در جنبه فنی، چیزی بیش از نرم افزار وجود دارد.
اینها چهار مهارت حیاتی خارج از توسعه نرم افزار هستند که بسیاری از دانشمندان داده فاقد آن هستند.
پیشینه آماری پایه
شما واقعاً متوجه نمی شوید که کد شما چه کاری انجام می دهد مگر اینکه آمار اولیه پشت آن را بدانید. من با بسیاری از دانشمندان داده مواجه شده ام که می توانند یک مدل یادگیری عمیق پیچیده را در کمترین زمان رمزگذاری کنند، اما آنها به سختی معنای توزیع نرمال را درک کردند.
Skilled Data Scientists اساس ابزارهای خود را می دانند. مایک تایسون به خوبی گفت: «هر کس تا زمانی که به صورتش مشت بزند برنامهای دارد». خوب، وقتی مدل علم داده شما بد رفتار می کند و به صورت شما مشت می زند، اغلب درک اصول اولیه است که به شما امکان می دهد مسیر را اصلاح کنید.
شما باید یک پایه ریاضی و آماری محکم داشته باشید. آیا با مفاهیم اصلی آمار متداول آشنا هستید؟ در مورد آمار بیزی چطور؟ اگر مجبور بودید اولین شبه کد اصلی را برای مدلی بنویسید که از آن استفاده می کنید، آیا می توانید؟ چه شکاف هایی را از دست داده اید و چگونه آنها را پر می کنید؟
علاوه بر این، من استدلال میکنم که اغلب بهترین راهحلها در علم داده بنیادیتر از آن چیزی هستند که بسیاری دوست دارند بپذیرند. ظرافت راه حل های ساده و اساسی درسی است که موفق ترین دانشمندان داده بارها به من نشان داده اند.
تفکر انتقادی
بهترین دانشمندان داده در درک بحثها، زیر سوال بردن دیگران، و به زبان آوردن حقیقت چیزی که کسی به گفتگو میآورد خوب هستند. علم داده در مورد بازگرداندن خط به خط اطلاعات نیست. هنر بسیار بیشتری در آن وجود دارد. هنری که از توانایی رمزگشایی از کیفیت اطلاعاتی که دریافت می کنید ناشی می شود.
برخی از بزرگترین اشتباهاتی که در پروژههای علم داده دیدهام، با کسی شروع شد که اطلاعات بد یا یک استدلال ضعیف را بدون به چالش کشیدن آن بدیهی میگرفت. اگر پروژهای را انجام میدهید، این وظیفه شماست که سؤالات درستی بپرسید و از ابتدا وضعیت را تحلیل کنید. اینکه بگوییم سفارش میگیرید یا اطلاعات بدی در اختیار شما قرار دادهاید، پلیسی است که شما را خیلی دور نمیبرد.
به نظر من تفکر انتقادی یکی از قوی ترین عوامل تعیین کننده موفقیت فردی در علم داده است. تفکر انتقادی برای هر موقعیتی در تجارت مورد نیاز است، اما به ویژه در علم داده بسیار مهم است. سوالات مطرح شده بیش از حد مبهم هستند که بدون بررسی مناسب قابل حل نیستند. چرا؟ زیرا در یک زمینه تجاری اطلاعات، تئوری ها و نظرات زیادی را دریافت خواهید کرد. برخی از آن مستدل خواهد بود، و برخی از آن نه چندان. به عنوان یک دانشمند داده، شما سعی می کنید آن اطلاعات و ایده ها را به مدل های آماری تبدیل کنید. اگر نتوانید کیفیت اطلاعات دریافتی را رمزگشایی کنید، در دریا گم خواهید شد.
برای ایجاد این عضلات برای بحث، دانشمندان داده نیاز به دانش پایه ای از فلسفه دارند. دوره های آنلاین رایگان وجود دارد که به شما کمک می کند تا به آنجا بروید. بهترین ها به طور خاص در Data Science هدف قرار نمی گیرند. برای بسیاری از دانشمندان داده، این دوره ها ناامید کننده خواهند بود - پاسخ های درست سیاه و سفید نخواهد بود. نکته همین است.
ارتباط
مایه تاسف است، اما من دیده ام که مدل های باکیفیت به دلیل ارتباط ضعیف شکست می خورند. دانشمند داده نمی تواند به وضوح توضیح دهد که مدل آنها چه کار می کند یا نتایج به چه معناست. از آنجایی که هیچ کس نمی توانست کار آنها را درک کند، پروژه شکست خورده تلقی شد. در واقع، نتایج می توانست بسیار روشنگر باشد. با این حال، اگر نتوانید این بینشها را به روشی واضح، معنادار و قابل ربط برای مشتریان و اعضای تیم خود بیرون بیاورید، هرگز نمیتوانید تأثیر بزرگی را که هدف آن بودید، داشته باشید.
تا آنجا پیش میروم که میگویم هر چقدر هم که یک پروژه علم داده به خوبی اجرا شود، بدون ارتباط مناسب موفقیتآمیز تلقی نمیشود. اگر نمی دانید پروژه شما چگونه به نظر می رسد، تمام تلاش خود را در معرض خطر اخراج سریع قرار می دهید.
برخی ارتباطات خوب از داشتن پیشینه آماری خوب و برخی دیگر از مهارت های تفکر انتقادی قوی ناشی می شود. اما ارتباط، در نوع خود، یک مهارت کلیدی است. به همین دلیل است که اغلب افراد فوقالعاده باهوش را میبینید که در گوشهای تاریک و منزوی از دفتر مغلوب شدهاند. آنها فقط نمی دانند چگونه ارتباط برقرار کنند و نتیجه این است که بسیاری از تأثیر کار آنها از بین می رود.
برای تمرین خاص ارتباط چیزی باید گفت. مجدداً، دوره های زیادی به صورت آنلاین وجود دارد تا شما را به سطحی که باید باشید، برساند. و باز هم، بهترین این دوره ها مختص علم داده نیستند.
تخصص دامنه
من اخیراً بحثی را بین Data Scientists درباره تجزیه و تحلیل قیمتها شنیدم، حوزهای که تجربهای در آن دارم. میتوانستم عدم درک جنبه تجاری سؤال را ببینم. دانشمندان داده مستقیماً به پرسشهایی درباره انتخاب مدل میپرداختند، اما تقریباً هیچ درک از محدودیتهای دادههای عملی که با آن مواجه بودند نداشتند. بدون تخصص دامنه، آنها مسیری را به سمت شکست قطعی در پیش گرفتند.
فقط به این دلیل که می توانید یک گیاه آپارتمانی پرورش دهید، به این معنی نیست که می توانید یک تاکستان را اداره کنید. تفاوت های ظریف مهم است. یادگیری جزئیات مشکلی که قصد حل آن را دارید بسیار مهم است.
گاهی به دانشگاه نگاه می کنم و از وضعیت فعلی علم داده گیج می شوم. در دانشگاه، شما با تخصص حوزه شروع می کنید و سپس مدل های آماری را اعمال می کنید. مدل سازی آماری در درجه دوم درک نظری قرار دارد. با این حال، در علم داده ما با مدلسازی آماری شروع میکنیم و اغلب از درک نظری، تخصص حوزه، که زیربنای سؤالات مطرح شده است، غفلت میکنیم.
آیا به نظر من مدل تحصیلی کامل است؟ دور از آن. و من توصیه نمی کنم که همه دانشمندان داده متخصص حوزه باشند. اما، دانشمندان داده باید راهی بیابند تا تخصص دامنه را در کار خود بگنجانند. چه از طریق کار در یک صنعت خاص و چه از طریق یافتن شرکای تجاری که می توانند دانش پس زمینه یک پروژه را ارائه دهند.
در علم داده چیزهای بیشتری نسبت به توسعه نرم افزار وجود دارد که بازنشر شده از منبع https://towardsdatascience.com/theres-more-to-data-science-than-software-development-eb8c2fd5ac0c?source=rss—-7f60cf5620c9—4 از طریق https:// todatascience.com/feed
<!–
->
- بیت کوین
- bizbuildermike
- بلاکچین
- انطباق با بلاک چین
- کنفرانس بلاکچین
- مشاوران بلاک چین
- coinbase
- coingenius
- اجماع
- کنفرانس رمزنگاری
- معدنکاری رمز گشایی
- کریپتو کارنسی (رمز ارزها )
- غیر متمرکز
- DEFI
- دارایی های دیجیتال
- ethereum
- فراگیری ماشین
- رمز غیر قابل شستشو
- افلاطون
- افلاطون آی
- هوش داده افلاطون
- پلاتوبلاک چین
- PlatoData
- بازی پلاتو
- چند ضلعی
- اثبات سهام
- W3
- زفیرنت