한국전자통신연구원 ETRI, 딥러닝 분산 학습 최적화 기술 개발

[이뉴스코리아 심건호 기자] 한국전자통신연구원(ETRI)이 `딥러닝 분산 학습’에 최적화된 고속 처리 기술을 개발했다고 밝혔다.

ETRI 연구진이 서버에 메모리박스 작동을 점검하는 모습(사진제공=ETRI)

본 기술을 적용하면 학습하는데 일주일이 걸리던 인공지능 모델을 같은 환경에서 단 1~2일 만에 학습할 수 있다. 최대 4배 효율을 내는 셈이다.

딥러닝은 컴퓨터가 사람처럼 생각하고 배울 수 있도록 하는 기술이다. 하지만 컴퓨터 역시 대규모 영상, 이미지, 음성 등의 데이터나 모델을 학습하는 데는 많은 시간이 걸린다.

이때 대규모 데이터를 처리하려면 여러 대의 컴퓨터를 활용해 학습 시간을 줄이는 ‘분산 학습’ 기술이 사용된다. 컴퓨터 하나로만 공부하지 않고 여러 대의 컴퓨터로 동시에 공부시켜 학습 분량을 분담해 시간을 단축시키는 기술이다.

하지만 분산 학습 기술도 대용량 모델을 여러 컴퓨터에서 동시에 실행하면 통신 병목 현상이 발생하는 한계가 있었다. 컴퓨터들 간 통신량이 많다 보니 특정 지점에서 성능이나 용량이 저하되는 현상이 나타난 것이다.

이를 해결하는 방법 중 하나는 컴퓨터의 계산 및 처리 능력을 담당하는 중앙처리장치(CPU) 혹은 그래픽처리장치(GPU)의 성능을 높이는 것이다. 그러나 이 방법은 장비를 계속 업그레이드해야 하는 비용 부담이 크다.

반면 ETRI는 `메모리 박스(Memory BoxTM)’ 라 불리는 공유기억장치를 개발해 분산 학습시 발생하는 통신 병목현상을 해소함으로써 학습 시간을 단축시켰다.

메모리 박스는 컴퓨터들 중간에 위치해 각 컴퓨터들이 학습한 것을 서로 공유하도록 돕고 통신량을 줄여준다. 일종의 가상 공유 메모리 역할을 수행하는 것이다.

ETRI 연구진이 개발한 메모리박스를 서버에 장착 후 관련 논의를 하는 모습(사진제공=ETRI)

연구진의 기술을 이용하면 대대적인 장비 교체 없이 최소 투자로 동일한 환경에서 딥러닝 학습 시간을 대폭 줄일 수 있다. 특히, 하드웨어(HW)와 소프트웨어(SW) 형태를 모두 제공할 수 있어 수요자 맞춤형 기술 이전이 가능하다.

이를 통해 1,000가지 종류의 이미지 128만 장을 분류하는 모델을 1만 번 반복 학습하는 실험을 진행한 결과, 기존 서버 방식이 16분 23초가 걸린 반면 본 기술을 이용한 방식은 7분 31초가 걸렸다.

그간 아마존, 구글, MS 등 글로벌 IT 기업들은 자사 소스코드를 공개하거나 대규모 컴퓨팅 자원을 클라우드 형태로 제공하며 개발자들을 유인하고 인공지능 컴퓨팅 인프라 시장의 점유율을 높여왔다.

이로 인해 인공지능을 연구하는 국내 기업이나 기관들은 외국 기업들의 서비스에 의존하거나 많은 비용을 들여 자체 서버를 구축해야 했다. 이에 ETRI 연구진은 국내 개발자들이 손쉽게 딥러닝 연구를 진행할 인공지능 컴퓨팅 환경을 제공하기 위해 `딥러닝 대시보드’도 개발했다.

연구진이 개발한 대시보드는 그래픽 기반 개발 환경을 제공해 개발자들이 코드를 하나하나 입력할 필요가 없다. 덕분에 학습시간은 물론 모델 개발 시간을 단축시키는데도 도움을 준다. 인공지능 개발에 주로 쓰이는 도구들도 지원해 대시보드상에서 개발한 그래픽 모델을 학습할 수 있다.

ETRI 연구진이 개발한 딥러닝 대시보드에서 인공지능 모델 학습 후 속도를 측정하는 모습(사진제공=ETRI)

본 기술은 해상도가 높은 의료 영상 분석이나 방대한 이미지 분석 등 딥러닝 및 인공지능이 필요한 다양한 산업 분야에서 활용이 가능하다. 특히, 컴퓨팅 환경이 열악한 중소기업, 학교, 스타트업에서도 ETRI 기술을 활용한다면 개발 시간과 비용을 대폭 절약할 수 있다.

현재 연구진의 기술은 세계 최대 가전 전시회인 독일 IFA 2019에도 참가해 관계자들로부터 큰 관심을 받고 있다. 본 기술과 관련된 논문 14편 및 13건의 특허도 출원된 바 있다.

또한 연구진이 개발한 딥러닝 고속 처리 시스템 기술은 현재 두 개의 중소기업이 기술을 이전 받아 연구소기업 설립을 추진 중이다. 연구진은 해당 기업을 통해 내년 상용화를 목표로 하고 있다.

사업책임자인 ETRI 인공지능연구소 최완 책임연구원은 “글로벌 기업이 독식하고 있는 인공지능 컴퓨팅 인프라 시장을 우리 기술로 대체하고 고난이도 딥러닝 기술과 독자적인 인공지능 슈퍼컴퓨팅 시스템을 개발하는데 도움이 되기를 바란다”고 말했다.

본 과제는 과학기술정보통신부의 대규모 딥러닝 고속처리를 위한 HPC 시스템 개발 사업의 일환으로 개발되었다.

Leave a Comment 응답 취소