19일 TBC서 혁신네트워크 제22회차 'AI학술세미나' 열려
윤진혁 KISTI 박사, '위키백과' 데이터 연구 사례 소개
19일 대덕테크비즈센터(TBC)에서 열린 'AI학술세미나'는 윤진혁 KISTI(한국과학기술정보연구원·원장 최희윤) 박사가 발표로 진행됐다.
그는 물리학 중 미시적인 성질에서 규칙성을 찾아 거시적인 성질을 이해하는 통계물리를 전공했다. 이를 사회현상으로 연장시켜 각자 개성을 지닌 사람들한테 보편적인 규칙성이 존재함을 연구하고 있다. 이날 윤 박사는 네이처 자매지 표지에 게재된 논문에서 사용한 데이터인 '위키백과'를 전반적으로 설명했다.
윤 박사는 물리학으로 박사학위를 취득했지만, 사회현상을 연구해 과학 저널 '네이처(Nature)'의 자매지인 '네이처 인간행동(Nature Human Behaviour)'의 표지 논문으로 선정된 독특한 이력을 갖고 있다.
위키백과의 문제는 '슈퍼에디터'에서 발생한다. 슈퍼에디터는 위키백과에서 문서를 수십만, 수백만 번 수정한 사람들을 말한다. 슈퍼에디터와 같은 소수의 사람들에 의한 문서 수정이 늘어나면서 다른 사람들은 수정을 못하는 '수정불평등' 현상이 발생하는 것.
윤 박사는 "위키백과는 본래 모든 사람들이 함께 지식을 쌓아가고 공유하는 유토피아를 지향했지만, 실제로는 소수의 사람들이 위키백과의 모든 지식을 만들어 온 것과 마찬가지다"면서 "실제로 10년간의 위키백과 에디터 Top100 리스트에서 상위권 그룹의 구성이 바뀌지 않았다"고 지적했다.
이 같은 수정불평등 현상은 결과적으로 지식이 소수에 의해 편향되는 '데이터 바이어스' 결과를 초래한다. 특히 위키백과에서는 여성이 남성보다 문서로 등록될 확률이 낮은 바이어스가 두드러진다.
윤 박사는 "서구권에서 30~50대의 교육을 잘 받고 충분한 경제력을 지닌 남성인 '메이저리티' 들이 세상을 지배하는 것 처럼, 똑같은 그룹이 위키백과에서 활동하고 있다"라고 말했다.
한편 격주로 진행되는 AI학술세미나는 페이스북 'AI프렌즈' 페이지에서 발표 내용 확인과 참가 신청이 가능하다. 다음 세미나는 'Pattern detection & Interpretation'의 주제로 최진혁 인포리언스 대표가 발표자로 나선다.
댓글 정렬