사이언스타임즈 로고

“컴퓨터가 인간 언어 파악한다” SW주간(3) 소프트웨어 교육 페스티벌

  • 콘텐츠 폰트 사이즈 조절

    글자크기 설정

  • 프린트출력하기

지난 4~5일 경기도 과천과학관에서 ‘2015 소프트웨어(SW) 교육 페스티벌’이 열렸다. 11월 30일부터 계속된 ‘SW 주간’ 행사의 일환으로 마련된 어린이와 청소년층 대상의 교육 프로그램이다.

4일에는 개막식과 더불어 SW 교육 공모전 시상식, SW교육 교사워크숍, 뚝딱뚝딱 SW공작소가 마련됐다. 5일에는 SW 전문가를 불러 현재 상황과 미래 예측을 들어보는 ‘SW 토크 콘서트’가 어울림홀에서 학생들을 맞이했다. 오전에는 IT 전문 토크쇼 ‘SW 톡톡’이, 오후에는 명사들의 강연을 듣는 ‘SW 전문가 특강’이 이어졌다.

이날 ‘SW 톡톡’ 토크쇼는 KBS의 IT 전문 프로그램 ‘차정인 기자의 T 타임’ 녹화와 더불어 진행됐다. 송길영 다음소프트 부사장, 서은아 마이크로소프트 부장, 이두희 멋쟁이사자처럼 대표, 김소정 KAIST 출신 가수 등이 패널로 등장해 각자의 입장에서 바라본 SW의 세계를 설명했다.

5일 ‘SW 톡톡’ 토크쇼는 KBS의 IT 전문 프로그램 ‘차정인 기자의 T 타임’ 녹화와 더불어 진행됐다.  ⓒ 임동욱 / ScienceTimes
5일 ‘SW 톡톡’ 토크쇼는 KBS의 IT 전문 프로그램 ‘차정인 기자의 T 타임’ 녹화와 더불어 진행됐다. ⓒ 임동욱 / ScienceTimes

이틀에 한 번씩 인류 역사만큼의 데이터가 생산된다

송길영 부사장은 ‘소프트웨어, 마음을 캐다’라는 주제로 빅데이터 SW의 원리를 설명했다. 최근 들어 ‘빅데이터’라는 표현이 자주 등장한다. 얼마나 많은 데이터를 다루어야 ‘빅’이라는 표현에 적합할까.

에릭 슈미트 전 구글 CEO는 2010년 “인간은 하루에 2.5헥사바이트 만큼의 정보를 만들어내고 있다”고 밝혔다. 일반적인 가정용 컴퓨터에 탑재되는 하드디스크 크기는 1테라바이트(TB) 가량이다. 250경 바이트는 1TB짜리 하드디스크를 200만 개 넘게 채울 수 있는 데이터 양이다.

인류 문명이 출발해서 2003년까지 만들어낸 정보량은 500경 바이트 정도다. 그런데 이 많은 양을 우리는 이틀에 한 번씩 생산하고 있다. SW 기업에서 분석해야 하는 데이터의 양도 그만큼 커졌다. 다음소프트에서 하루 평균 처리하는 소셜 데이터도 트윗 500만 건, 블로그 50만 건 수준이다. 총 100대의 서버 컴퓨터가 동시에 동작한다.

분석을 한 후에는 여러 정보가 추가로 삽입되기 때문에 데이터 양은 몇십 배가 된다. 하루에 3기가바이트(GB)의 문서를 분석할 경우 결과물은 90GB로 30배 가량 늘어난다.

분석할 때마다 정보량이 늘어나는 이유는 온라인 상의 문서가 ‘컴퓨터 언어’가 아닌 ‘인간 언어’로 작성되었기 때문이다. 컴퓨터 언어로 프로그램을 짜고 SW를 만드는 작업을 ‘코딩(coding)’이라고 부른다. 지금까지는 사람이 컴퓨터 언어를 배워 코딩을 했다면 앞으로는 컴퓨터가 인간 언어를 배우고 이해해서 분석하는 시대가 열린다.

컴퓨터가 인간 언어 이해하는 세상 온다

다음소프트도 인간 언어를 이해하기 위해 ‘자연어 처리 기법’을 사용한다. 표준국어대사전에 등재된 표제어 수는 50만 개 수준이지만 이를 조합해 만들어진 문장의 수는 무한대에 가깝다.

게다가 단순히 단어를 조립해서 문장을 만드는 것이 아니라 앞뒤 문맥을 살펴야 본래의 뜻을 알아낼 수 있다. ‘나는 민호와 철수의 집에 놀러갔다’고 하면 민호와 놀러갔다는 것인지 민호와 철수가 함께 사는 집에 놀러갔다는 것인지 불분명하다. SW의 일반적인 작동 원리인 반복 작업만으로는 파악이 어렵다.

자연어 처리 기법은 문장을 분석해서 인간의 숨은 감정까지도 밝혀낸다. 예를 들어 “엄마가 좋은가 아빠가 좋은가” 질문했을 때 절반이 넘는 아이들이 “아빠가 좋다”고 대답한다. ‘엄마’라는 단어는 오히려 부정적인 감정과 연결되는 경우가 많다.

그러나 이것만으로 “엄마를 싫어한다”고 결론 내릴 수는 없다. 엄마는 잔소리를 하지만 아빠는 선물을 사오는 경우가 잦은 데다가 실생활에서는 아빠보다 엄마와 함께 보내는 시간이 훨씬 많기 때문이다. 감정 분석은 단순하게 파악할 수 없다. ‘즐거움’이라는 감정도 기존에는 가족과 함께 할 때의 기분을 뜻했다면 1인 가족이 늘어나는 지금은 새롭게 정의 내려야 한다.

송 부사장은 “SW를 만들 때는 다양한 전공의 사람들이 모여 거대한 팀을 이뤄야 한다”며 인간의 마음을 알아내기 위해 SW는 계속 발전하는 동안 여러 인재가 필요할 것이라고 전망했다.

문제 해결하려는 노력이 ‘컴퓨팅적 사고 능력’

이어 서은아 마이크로소프트 부장이 아이를 키우는 입장에서 SW교육을 바라본 ‘컴퓨팅적 사고능력과 디지털 역량’ 주제를 강연했다. 컴퓨팅적 사고능력(computational thinking)은 최근 미국 정부가 SW교육을 통해 강조하고 있는 디지털 소양이다.

그러나 SW를 다룰 때만 사용하는 능력은 아니다. 논리적인 절차를 만들어 당면한 문제를 해결할 때는 누구나 컴퓨팅적 사고능력을 발휘한다. SW에서는 이러한 논리적 절차를 ‘알고리즘(algorithm)’이라 부른다.

아이들의 일상생활도 알고리듬의 연속이다. 아침마다 책가방을 쌀 때는 나중에 사용할 물건을 먼저 집어넣고 학교 도착하자마자 꺼낼 물건은 맨 위에 넣는다. 이것을 ‘캐싱 알고리즘’이라 부른다.

우산을 잃어버렸을 때는 어디에 놓고 왔는지 길을 되짚어서 생각해본다. 이것은 ‘거꾸로 되짚어보기 알고리즘’이다. 화장실에 줄이 길 때 어느 칸 앞에 서야 빨리 용무를 해결할 수 있는지 고민하는 것은 ‘성능 비교분석 알고리즘’이다.

발표와 작문을 통해 ‘말하기’ 능력을 키우는 것처럼 컴퓨팅적 사고를 통해 ‘생각하기’ 능력을 키울 수 있다. SW교육으로 창의적인 사고방식을 배양한 아이들은 분야를 넘나드는 새로운 전문가로 발돋움할 가능성이 높아진다. 마이크로소프트는 최근 ‘리이매진 더 클래스(Reimagine the Class)’ 캠페인을 통해 SW교육을 지원하고 있다.

임동욱 객원기자
im.dong.uk@gmail.com
저작권자 2015-12-07 ⓒ ScienceTimes

태그(Tag)

관련기사

목록으로
연재 보러가기 사이언스 타임즈에서만 볼 수 있는
특별한 주제의 이야기들을 확인해보세요!

인기 뉴스 TOP 10

속보 뉴스

ADD : 06130 서울특별시 강남구 테헤란로7길 22, 4~5층(역삼동, 과학기술회관 2관) 한국과학창의재단
TEL : (02)555 - 0701 / 시스템 문의 : (02) 6671 - 9304 / FAX : (02)555 - 2355
정기간행물 등록번호 : 서울아00340 / 등록일 : 2007년 3월 26일 / 발행인 : 정우성 / 편집인 : 윤승재 / 청소년보호책임자 : 윤승재
한국과학창의재단에서 운영하는 모든 사이트의 콘텐츠는 저작권의 보호를 받는 바 무단전재, 복사, 배포 등을 금합니다.

사이언스타임즈는 과학기술진흥기금 및 복권기금의 지원으로 우리나라의 과학기술 발전과 사회적 가치 증진에 기여하고 있습니다.