시각지능 구현 알고리즘과 얼굴 사진 편집 툴 개발


<영상=ETRI 제공>

인공지능(AI)을 통해 쉽게 사진을 편집할 수 있는 기술이 일반에 공개된다. AI 핵심 알고리즘과 AI를 학습시키는데 필요한 학습데이터도 함께 업로드된다.

ETRI(한국전자통신연구원·원장 김명준)는 사물 인식, 행동 추적 등 시각 인공지능 구현에 필요한 핵심기술인 '백본 네트워크'와 포토샵 없이도 얼굴을 마음대로 편집할 수 있는 기술(SC-FEGAN) 2건을 공개한다고 12일 밝혔다. 

사람의 눈과 달리 컴퓨터가 영상 속 이미지를 분별하고 인식하기 위해서는 복잡한 과정이 필요하다. ETRI가 공개하는 백본 네트워크는 사진 속 객체들의 특징을 찾아내 정보를 추출하고 분석하여 인공신경망으로 모델을 만들어내는 기술이다. 

연구진에 따르면 해당 기술은 사물 검출, 객체 부분별 분할 인식, 안면 인식 등 다양한 기능들을 구현할 수 있다. 개발자들이 이 기술 활용하면 손쉽게 원하는 서비스나 혁신적인 기능을 구현해 부가가치를 창출할 수 있을 것으로 기대된다. ETRI는 시각 AI 기술을 학습시키는데 필요한 도심환경 사물 560종 대상 사물인식 학습 데이터 20만 장도 함께 지원한다.

연구진이 공개하는 또 하나의 핵심 기술은 전문 편집 프로그램 없이 사람의 얼굴을 쉽고 자연스럽게 편집하는 기술 'SC-FEGAN'이다. 얼굴표정, 머리모양 등을 바꾸고 훼손된 부분도 간단 복원 가능하다. 

해당기술에는 딥러닝 기법 중 하나인 갠 기술이 사용됐다. 인공적으로 데이터를 만들고 이를 판별하면서 진짜 같은 가짜 데이터를 만들어내는데 효과적인 기술이다. 

갠은 이미지를 합성하거나 변환하는데 효과적이지만 사용자의 의도나 조건 등을 반영하지 못한다는 단점이 있었다. 하지만 연구진은 기술을 보완해 입력값을 넣어 원하는 결과를 낼 수 있도록 개발했다. 해당 기술은 누구든 코드를 다운로드 받아 테스트해볼 수 있도록 깃허브(Github) 커뮤니티에 처음 공개된 상태다.

ETRI 박종열 시각지능연구실장은 "국내 시각 인공지능 기술이 급속도로 성장하고 있지만 외국 의존도가 점차 높아지고 있어 관련 기술을 공개해 국내 산·학·연이 보다 경쟁력 있는 기술을 확보하고 생태계 조성을 위해 적극 지원할 예정"이라고 말했다.

연구진은 앞으로 시각지능 관련 핵심 기반 기술들과 높은 품질의 데이터를 지속적으로 공개하는 한편 얼굴 뿐 아니라 냉장고, 가구 등 다른 객체를 대상으로도 쉽게 편집을 할 수 있도록 기술을 고도화할 계획이다.

해당 프로그램들은 링크에서 다운 가능하다.(VoVNet /SC-FEGAN/이미지 데이터 )

SC-FEGAN 기술을 활용하면 눈썹, 입모양, 머리스타일 등을 손쉽게 변화시킬 수 있다.<사진=ETRI 제공>
SC-FEGAN 기술을 활용하면 눈썹, 입모양, 머리스타일 등을 손쉽게 변화시킬 수 있다.<사진=ETRI 제공>
저작권자 © 헬로디디 무단전재 및 재배포 금지