소프트웨어 개발보다 데이터 과학에 더 많은 것이 있습니다.

의견

O데이터 과학자와 대화할 때 제가 발견한 가장 불쾌한 것 중 하나는 소프트웨어 개발에 대한 레이저와 같은 초점입니다. “R이나 Python으로 코딩하시나요? Pandas에 새로운 기능이 있습니다! 도서관 'x'에 대한 경험은 몇 년입니까?”

그런 맥락에서 저는 최근 데이터 과학의 진입 장벽이 매우 낮다는 트윗을 보았습니다. 트윗에서는 온라인에서 소프트웨어 개발 과정을 수강하기만 하면 된다고 제안했습니다. 그것은 내 배를 휘젓게 만들었습니다. 데이터 과학 전체 분야를 소프트웨어 개발과 혼동했습니다.

데이터 과학자가 소프트웨어 개발자인 척하는 이유는 무엇입니까? 데이터 과학은 그 이상입니다. 데이터 과학자들이 단독으로 해당 분야의 소프트웨어 개발 측면을 추진하는 것을 보는 것은 매우 실망스럽습니다.

님이 촬영 한 사진 제임스 힐리 on Unsplash

데이터 과학자에게 소프트웨어가 중요한가요? 물론. 숙련된 코딩이 작업의 큰 부분을 차지합니까? 예. 데이터 과학자가 소프트웨어 개발자로부터 배울 수 있는 것이 많이 있습니까? 전적으로. 소프트웨어 개발 기술이 데이터 과학자의 가장 중요한 특성인가요? 아니요.

소프트웨어 개발을 데이터 과학의 가장 중요한 부분으로 추진하면 팀과 분야가 다른 IT 부서로 바뀔 위험이 있습니다. IT 업무를 비판하려는 것이 아닙니다. 저는 많은 대기업과 일해 왔으며 IT 부서에서 믿을 수 없을 정도로 똑똑하고 재능 있는 사람들을 얼마나 많이 만났습니다. 그러나 이러한 팀은 조직에서 정의된 역할을 수행합니다. 일반적으로 이들은 전반적인 비즈니스 전략을 주도하지 않습니다. 그러나 비즈니스에서 크고 중요한 결정에 영향을 미치고 소프트웨어 개발 기술을 극대화하는 데 전적으로 집중하기 위해 현장에 들어간 데이터 과학자가 너무 많습니다.

소프트웨어 개발은 ​​벨트에서 중요한 도구입니다. 그러나 이것이 유일한 도구는 아닙니다. 비즈니스에 중요한 의사 결정 지원에 대해 거창한 약속을 한 다음 소프트웨어 개발에 대해서만 이야기하는 것으로 되돌아갈 수는 없습니다.

저는 데이터 과학자에게 필요한 보다 태도적인 도구에 대해 썼습니다. 여기에서 지금 확인해 보세요.. 그러나 기술적인 측면에도 소프트웨어 이상의 것이 있습니다.

이는 소프트웨어 개발 외에 많은 데이터 과학자에게 부족한 네 가지 중요한 기술입니다.

기본 통계 배경

코드 이면의 기본 통계를 알지 못하면 코드가 수행하는 작업을 진정으로 이해할 수 없습니다. 복잡한 딥러닝 모델을 단숨에 코딩할 수 있지만 정규 분포의 의미를 거의 이해하지 못하는 데이터 과학자를 많이 만났습니다.

숙련된 데이터 과학자는 도구의 기초를 알고 있습니다. 마이크 타이슨은 “얼굴에 한 대 맞기 전까지는 누구나 계획을 갖고 있다”고 잘 말했습니다. 데이터 과학 모델이 ​​잘못 작동하여 뺨을 때릴 때 방향을 바로잡을 수 있는 기본 사항을 이해하는 경우가 많습니다.

님이 촬영 한 사진 보그단 유킴추크 on Unsplash

탄탄한 수학적, 통계적 기초를 갖추고 있어야 합니다. 빈도주의 통계(Frequentist Statistics)의 핵심 개념을 알고 있나요? 베이지안 통계는 어떻습니까? 활용 중인 모델에 대한 첫 번째 원칙 의사코드를 작성해야 한다면, 그렇게 할 수 있습니까? 당신이 놓치고 있는 공백은 무엇이며 어떻게 채우나요?

또한, 나는 데이터 과학의 최고의 솔루션이 많은 사람들이 인정하고 싶어하는 것보다 더 근본적이라고 주장하고 싶습니다. 간단하고 근본적인 솔루션의 우아함은 가장 성공적인 데이터 과학자들이 나에게 반복해서 보여준 교훈입니다.

비판적 사고

최고의 데이터 과학자는 논쟁을 이해하고, 다른 사람에게 질문하고, 누군가가 대화에 가져오는 내용의 진실을 알아내는 데 능숙합니다. 데이터 과학은 한 줄씩 정보를 역류하는 것이 아닙니다. 그것보다 훨씬 더 많은 예술이 있습니다. 당신이 받은 정보의 질을 해독할 수 있는 능력에서 비롯된 예술입니다.

데이터 과학 프로젝트에서 제가 본 가장 큰 실수 중 일부는 누군가가 나쁜 정보나 약한 주장을 이의를 제기하지 않고 당연하게 여기는 데서 시작되었습니다. 프로젝트를 맡는다면 처음부터 올바른 질문을 하고 상황을 분석하는 것이 당신의 임무입니다. 당신이 명령을 받고 있었다거나 나쁜 정보를 가지고 출발했다고 말하는 것은 당신을 그리 멀리 가지 못할 핑계입니다.

나는 누군가가 데이터 과학에서 성공할지 여부를 결정하는 가장 강력한 결정 요인 중 하나가 비판적 사고라고 생각합니다. 비판적 사고는 비즈니스의 모든 직위에 필요하지만 특히 데이터 과학에서 중요합니다. 질문이 너무 모호해서 적절한 조사 없이는 해결할 수 없습니다. 왜? 왜냐하면 비즈니스 맥락에서 당신은 많은 정보, 이론, 의견을 받아들이게 될 것이기 때문입니다. 그 중 일부는 근거가 충분할 것이고 일부는 그다지 많지 않을 것입니다. 데이터 과학자로서 귀하는 해당 정보와 아이디어를 통계 모델로 전환하려고 시도하고 있습니다. 받은 정보의 품질을 해독할 수 없다면 바다에서 길을 잃게 될 것입니다.

님이 촬영 한 사진 아나스타샤 타이오글루 on Unsplash

토론을 위한 근육을 키우려면 데이터 과학자에게는 철학에 대한 기본 지식이 필요합니다. 거기에 도달하는 데 도움이 되는 무료 코스가 온라인에서 제공됩니다. 최고의 것은 특별히 데이터 과학을 목표로 하지 않습니다. 많은 데이터 과학자에게 이러한 과정은 좌절감을 느낄 것입니다. 정답은 흑백이 아닐 것입니다. 그게 요점입니다.

의사 소통

안타깝지만 의사소통이 원활하지 않아 품질이 좋은 모델이 실패하는 경우를 본 적이 있습니다. 데이터 과학자는 모델이 수행하는 작업이나 결과가 무엇을 의미하는지 명확하게 설명할 수 없었습니다. 아무도 그들의 작업을 파악할 수 없었기 때문에 프로젝트는 실패한 것으로 간주되었습니다. 실제로 그 결과는 매우 통찰력이 있을 수 있었습니다. 그러나 고객과 팀 구성원을 위해 명확하고 의미 있고 공감할 수 있는 방식으로 이러한 통찰력을 끌어낼 수 없다면 목표한 큰 영향을 결코 얻을 수 없습니다.

데이터 과학 프로젝트가 아무리 잘 실행되더라도 적절한 의사소통이 없으면 성공으로 간주되지 않을 것이라고 말하고 싶습니다. 귀하의 프로젝트가 어떤 모습일지 모른다면 귀하의 모든 노력이 즉시 해고될 위험에 처하게 됩니다.

님이 촬영 한 사진 캠페인 제작자 on Unsplash

좋은 의사소통은 좋은 통계적 배경을 갖는 데서 나오고, 일부는 강력한 비판적 사고 능력에서 나옵니다. 그러나 의사소통은 그 자체로 중요한 기술입니다. 믿을 수 없을 만큼 똑똑한 사람들이 사무실의 어둡고 고립된 구석으로 쫓겨나는 경우가 종종 있는 이유도 바로 이 때문입니다. 그들은 의사소통 방법을 모르고 있으며 그 결과 작업의 영향 중 많은 부분이 손실됩니다.

구체적으로 의사소통을 실천하려면 할 말이 있다. 다시 말하지만, 필요한 수준에 도달할 수 있도록 도와주는 온라인 강좌가 많이 있습니다. 그리고 다시 말하지만, 이러한 과정 중 최고는 데이터 과학에만 국한되지 않습니다.

도메인 전문 지식

저는 최근에 제가 경험한 분야인 가격 분석에 관해 데이터 과학자들 사이에서 토론하는 것을 우연히 들었습니다. 질문의 비즈니스 측면에 대한 이해가 부족하다는 것을 알 수있었습니다. 데이터 과학자들은 모델 선택에 대한 질문에 곧바로 뛰어들었지만 그들이 직면하게 될 실질적인 데이터 한계를 거의 파악하지 못했습니다. 도메인 전문 지식이 없으면 특정 실패의 길로 향하게 됩니다.

관엽식물을 키울 수 있다고 해서 포도원을 운영할 수 있는 것은 아닙니다. 뉘앙스가 중요합니다. 해결하려는 문제의 세부 사항을 배우는 것이 중요합니다.

님이 촬영 한 사진 제이미 카사프 on Unsplash

때때로 나는 학계를 바라보며 데이터 과학의 현재 상태에 당황합니다. 학계에서는 도메인 전문 지식으로 시작한 다음 통계 모델을 적용합니다. 통계적 모델링은 이론적 이해에 부차적인 것입니다. 그러나 데이터 과학에서 우리는 통계 모델링으로 시작하고 질문의 기초가 되는 이론적 이해, 도메인 전문 지식을 종종 무시합니다.

나는 학문적 모델이 완벽하다고 생각하는가? 그것과는 거리가 멀다. 그리고 모든 데이터 과학자가 도메인 전문가가 되는 것을 권장하지 않습니다. 그러나 데이터 과학자는 해당 분야의 전문 지식을 업무에 통합할 수 있는 방법을 찾아야 합니다. 특정 산업 틈새 시장에서 일하거나 프로젝트에 대한 배경 지식을 제공할 수 있는 비즈니스 파트너를 찾는 등의 방법으로 가능합니다.

소스 https://towardsdatascience.com/theres-more-to-data-science-than-software-development-eb8c2fd5ac0c?source=rss—-7f60cf5620c9—4에서 https://를 통해 다시 게시된 소프트웨어 개발보다 데이터 과학에 더 많은 것이 있습니다. warddatascience.com/feed

<!–

–>

타임 스탬프 :

더보기 블록 체인 컨설턴트