19일 TBC서 혁신네트워크 제22회차 'AI학술세미나' 열려
윤진혁 KISTI 박사, '위키백과' 데이터 연구 사례 소개

"소수의 사람들이 위키백과 지식을 만들면서 지식 편향의 우려가 발생할 수 있다는데 공감한다. 대덕의 출연연에는 과학기술분야 전문가들이 포진돼 있다. 올바른 지식 전달을 위해 과학계에서도 관심을 갖고 참여하는 것도 필요해 보인다."(AI 학술세미나 참석자)

19일 대덕테크비즈센터(TBC)에서 열린 'AI학술세미나'는 윤진혁 KISTI(한국과학기술정보연구원·원장 최희윤) 박사가 발표로 진행됐다.

그는 물리학 중 미시적인 성질에서 규칙성을 찾아 거시적인 성질을 이해하는 통계물리를 전공했다. 이를 사회현상으로 연장시켜 각자 개성을 지닌 사람들한테 보편적인 규칙성이 존재함을 연구하고 있다. 이날 윤 박사는 네이처 자매지 표지에 게재된 논문에서 사용한 데이터인 '위키백과'를 전반적으로 설명했다.

윤 박사는 물리학으로 박사학위를 취득했지만, 사회현상을 연구해 과학 저널 '네이처(Nature)'의 자매지인 '네이처 인간행동(Nature Human Behaviour)'의 표지 논문으로 선정된 독특한 이력을 갖고 있다.

19일 TBC서 열린 AI학술세미나에서 윤진혁 KISTI 박사가 발표자로 나섰다. <사진=문후윤 수습 기자>
19일 TBC서 열린 AI학술세미나에서 윤진혁 KISTI 박사가 발표자로 나섰다. <사진=문후윤 수습 기자>
윤 박사는 "누구나 이용할 수 있는 무료 백과사전인 위키백과는 수정·편집도 누구나 할 수 있어, 처음에는 사람들이 신뢰하지 않았다"며 "하지만 연구결과는 놀랍게도 위키백과에서 우리가 알 수 있는 에러가 13%뿐인 것으로 드러났다"라고 말했다. 또 오타나 에러도 전통적인 백과사전보다 정확하다고 설명했다.

위키백과의 문제는 '슈퍼에디터'에서 발생한다. 슈퍼에디터는 위키백과에서 문서를 수십만, 수백만 번 수정한 사람들을 말한다. 슈퍼에디터와 같은 소수의 사람들에 의한 문서 수정이 늘어나면서 다른 사람들은 수정을 못하는 '수정불평등' 현상이 발생하는 것.

윤 박사는 "위키백과는 본래 모든 사람들이 함께 지식을 쌓아가고 공유하는 유토피아를 지향했지만, 실제로는 소수의 사람들이 위키백과의 모든 지식을 만들어 온 것과 마찬가지다"면서 "실제로 10년간의 위키백과 에디터 Top100 리스트에서 상위권 그룹의 구성이 바뀌지 않았다"고 지적했다.

이 같은 수정불평등 현상은 결과적으로 지식이 소수에 의해 편향되는 '데이터 바이어스' 결과를 초래한다. 특히 위키백과에서는 여성이 남성보다 문서로 등록될 확률이 낮은 바이어스가 두드러진다.

윤 박사는 "서구권에서 30~50대의 교육을 잘 받고 충분한 경제력을 지닌 남성인 '메이저리티' 들이 세상을 지배하는 것 처럼, 똑같은 그룹이 위키백과에서 활동하고 있다"라고 말했다.

한편 격주로 진행되는 AI학술세미나는 페이스북 'AI프렌즈' 페이지에서 발표 내용 확인과 참가 신청이 가능하다. 다음 세미나는 'Pattern detection & Interpretation'의 주제로 최진혁 인포리언스 대표가 발표자로 나선다.

격주로 진행되는 AI학술세미나는 페이스북 'AI프렌즈' 페이지에서 참가 신청 가능하다. <사진=문후윤 수습 기자>
격주로 진행되는 AI학술세미나는 페이스북 'AI프렌즈' 페이지에서 참가 신청 가능하다. <사진=문후윤 수습 기자>
저작권자 © 헬로디디 무단전재 및 재배포 금지