사이언스타임즈 로고

기초·응용과학
이강봉 객원기자
2017-08-17

데이터 사이언티스트, '인기 폭발' 호기심, 스토리텔링 등 5가지 역량 갖춰야

  • 콘텐츠 폰트 사이즈 조절

    글자크기 설정

  • 프린트출력하기

빅데이터 시대를 맞아 ‘데이터 사이언티스트(Data Scientist)’의 인기가 하늘로 치솟고 있다. 16일 ‘인포월드(InfoWorld)’에 따르면 거의 모든 산업에 걸쳐 많은 기업들이 엄청난 보수를 제시하며 숙련된 전문가를 찾고 있는 중이다.

실제로 인터넷 경매업체인 이베이는 임직원 1만7000여 명 중 6000명이 데이터 관련 업무를 맡고 있는 중이다. 세계 최대 전자상거래업체인 아마존 역시 데이터 중심 조직 문화를 캐치프레이즈로 내걸고 데이터 사이언티스트 모시기에 나서고 있다.

많은 기업들이 데이터 전문가를 찾고 있지만 유능한 전문가를 찾기는 어려운 상황이다. IBM 연구에 따르면 오는 2020년까지 미국에서 필요로 하게 될 데이터 사이언티스트의 수는 272만 명에 이를 것으로 추산하고 있다.

빅데이터 시대 도래로 '데이터 사이언티스트'가 인기 직종으로 급상승하고 있다. 능력있는 전문가를 찾기 위해 많은 기업들이 치열한 경쟁을 벌이고 있다.
빅데이터 시대 도래로 '데이터 사이언티스트'가 인기 직종으로 급상승하고 있다. 능력있는 전문가를 찾기 위해 많은 기업들이 치열한 경쟁을 벌이고 있다. ⓒmakeuseof.com

그러나 현재 충원되고 있는 데이터 사이언티스트의 수는 36만4000명에 불과하다. 이에 따라 부족한 데이터 사이언티스트 수를 보충하려면 매년 약 70만 명의 데이터 전문가를 양성하거나 다른 나라 등에서 초빙해야 한다.

데이터 사이언티스트로서의 역량도 문제가 되고 있다. 방대한 데이터에서 목적에 따라 필요한 정보를 찾아내 제품이나 서비스를 개선해나가야 하는 만큼 새로운 것을 읽어낼 수 있는 판별력, 분석력이 필요하다.

많은 기업들이 자사 업무에 맞는 뛰어난 데이터 사이언티스트를 찾고 있지만 쉽지 않은 일이다. 인사 책임자들은 뛰어난 능력의 소유자가 아니라 자사 업무에 손쉽게 적응할 수 있는 데이터 사이언티스트를 구한다고 말했다.

‘인포월드’에서는 기업들이 어떤 데이터 사이언티스트를 원하는지 MS, 구글, IBM, AWS, 데이터브릭스(Databricks), HPE 등을 취재했다. 그리고 데이터 사이언티스트가 갖춰야 할 업무 역량을 5가지로 정리했다.

데이터 분석·양적추론 능력 갖춰야    

소프트웨어 회사인 SAS는 뛰어난 데이터 사이언티스트의 특징으로 데이터 분석(Analytical skills)·양적 추론(Analytical skills) 능력을 강조하고 있다. 강력한 논리를 지니고 있으면서 끊임없이 변화하고 있는 상황에서 새로운 팩트를 분석·추론해낼 수 있어야 한다는 것.

자사를 대상으로 한 조사 결과 전체 데이터 사이언티스트 가운데 41%가 이 능력을 갖추고 있는 것으로 나타났다. 기업들은 데이터 사이언티스트가 편견이 없어야 한다고 강조하고 있다. 데이터를 감정적으로 다루지 않고 냉철하게 볼 수 있어야 한다는 것.

이런 능력의 보유자들은 데이터 상황을 쉽게 이해하고 또한 명확하게 데이터 개념들을 설명할 수 있다고 보고 있다. 이 능력을 갖추기 위해서는 개인적인 역량을 갖추어야 하지만 수학, 통계적인 기반 역시 요구되고 있다.

데이터를 스토리텔링할 수 있어야

데이터 사이언티스트들은 데이터 분석을 한 후 그 결과를 사내 비전문가들에게 설명해야 한다. 그런 만큼 데이터 상황을 잘 모르더라도 데이터와 관련된 내용을 이해할 수 있도록 설명할 수 있는 능력이 필요하다.

능력 있는 데이터 사이언티스트일수록 이런 표현력을 지니고 있다는 것이 인사 담당자들의 견해다. 데이터를 어떻게 수집했으며, 그 데이터를 어떻게 분석했고, 그 결과 어떤 예측을 하게 되었는지 스토리텔링(story telling)을 하듯이 설명할 수 있어야 한다.

팀워크를 살릴 수 있는 요원이 되라   

크라우드 소싱 업체인 크라우드플라워(CrowdFlower)는 데이터 사이언티스트들을 대상으로 조사를 행했다. 조사 결과  이들은 자신에게 할당된 업무 시간의 60% 이상을 데이터 클리닝(data cleaning), 데이터 구성(data organization) 등 업무에 할애하고 있는 것으로 나타났다.

이전에 ‘뉴욕타임즈’는 이 비율을 80%로 발표한 바 있다. 이런 높은 수치가 나오는 것은 데이터 사이언티스트들이 자신의 업무에 집중하고 있다는 것을 말해주고 있다. 자신의 일에 만족하고 있다는 사실을 또한 말해주고 있다. 이런 집중력이 발휘될 수 있는 것은 팀 분위기 때문이다.

각 기업들은 이에 따라 일에 몰두할 수 있도록 팀 워크를 조율해나갈 수 있는 팀 플레이어(team player)를 찾고 있다. 이들을 통해 새로운 과제를 발굴하고, 또한 팀원들이 협력해 새로운 영역을 개척해나갈 수 있을 것으로 보고 있다.

기존 틀에서 벗어나 사고할 수 있어야

데이터 사이언티스트의 기본적인 임무는 데이터를 사용해 문제를 해결하는 일이다. 그러나 뛰어난 문제 해결자(problem solver)가 되기 위해 ‘정해진 틀에서 벗어나 상황 등을 추론해나갈 수 있는’ 능력을 갖춰야 한다.

이런 능력이 요구되고 있는 것은 산업 각 분야가 끊임없이 변화하고 있기 때문이다. 이에 따라 데이터 사이언티스트 역시 변화하고 있는 상황 안에서 많은 사람들이 생각하지 못하는 예고되지 않은 일들을 추론해낼 수 있어야 한다.

크라우드플라워에 따르면 그러나 이런 능력을 모두 갖추고 있는 것이 아니다. 자체 조사 결과 전체 데이터 사이언티스트 가운데 14%가 자신이 그런 능력을 갖추고 있다고 응답했다. 이에 따라 인사부서에서는 이런 능력을 갖춘 사람을 찾고 있는 중이다.

필요한 사람은 호기심이 가득한 사람  

데이터 사이언티스트의 일과 호기심(curiosity)은 밀접한 관계가 있다. 링크드인의 수닐 쉬르구피(Sunil Shirguppi) 인터내셔날 데이터 서비스 책임자는 데이터 사이언티스트의 자격 요건으로 호기심을 첫 번째로 꼽았다.

호기심으로 시작돼 데이터를 분석하게 되고 또한 자신의 직관력, 데이터 수집력, 표준화, 통계, 모델링, 비주얼라이제이션, 커뮤니케이션 능력을 발휘할 수 있다고 말했다. 가설을 세우고 데이터 분석과 추론을 시작할 수 있는 분기점이라고 할 수 있다.

이강봉 객원기자
aacc409@naver.com
저작권자 2017-08-17 ⓒ ScienceTimes

관련기사

목록으로
연재 보러가기 사이언스 타임즈에서만 볼 수 있는
특별한 주제의 이야기들을 확인해보세요!

인기 뉴스 TOP 10

속보 뉴스

ADD : 06130 서울특별시 강남구 테헤란로7길 22, 4~5층(역삼동, 과학기술회관 2관) 한국과학창의재단
TEL : (02)555 - 0701 / 시스템 문의 : (02) 6671 - 9304 / FAX : (02)555 - 2355
정기간행물 등록번호 : 서울아00340 / 등록일 : 2007년 3월 26일 / 발행인 : 정우성 / 편집인 : 윤승재 / 청소년보호책임자 : 윤승재
한국과학창의재단에서 운영하는 모든 사이트의 콘텐츠는 저작권의 보호를 받는 바 무단전재, 복사, 배포 등을 금합니다.

사이언스타임즈는 과학기술진흥기금 및 복권기금의 지원으로 우리나라의 과학기술 발전과 사회적 가치 증진에 기여하고 있습니다.