페이스북, AI통해 '혐오 발언' 게시물 95% 걸러

사용자가 헤이트 스피치 볼 확률 0.10~0.11%

라이프스타일 | 2020-11-20 14:04:44

안희주 기자

페이스북에 올라오는 게시물을 1000건 봤다면 그 중 1건은 혐오 발언인 헤이트스피치(Hate speech)가 포함된 것으로 나타났다. 혐오 발언 콘텐츠 수 천만 건은 페이스북의 인공지능(AI)가 사용자 신고를 받기 전 미리 포착한다.

19일(현지시각) 페이스북이 3분기 콘텐츠 조정 보고서에서 플랫폼 내 게시글을 무작위로 선정해 분석한 결과, 이용자가 헤이트 스피치 규정을 위반한 내용을 볼 확률이 0.10~0.11%라고 밝혔다. 1000건 중 1건 꼴이다.

헤이트 스피치는 특정 집단에 대한 혐오발언 등을 말한다. 가령 ‘홀로코스트 부정’과 ‘큐어넌’(QAnon) 콘텐츠 등이 이에 해당한다.

페이스북에 따르면, 이용자가 특정집단 혐오발언인 '헤이트 스피치' 콘텐츠를 볼 확률은 1000건 중 1건 꼴이다. 사진 = Pixabay

페이스북이 삭제한 혐오 발언 컨텐츠는 지난 7~9월 사이 2,210만 건에 달했다. 이러한 헤이트 스피치 콘텐츠 중 94.7%는 페이스북의 AI 시스템이 사용자 신고 전 포착한다. 이는 2017년에 AI가 혐오 발언을 탐지하던 비율 24.0%, 지난해 3분기의 탐지 비율 80.5%에서 상승한 것이다.

마이크 슈레퍼 CTO는 "수십억명이 우리 플랫폼을 사용하는 가운데 콘텐츠 검토 작업을 확대하고 의사결정을 자동화하기 위해 우리는 AI에 의존한다"며 "우리의 목표는 혐오 발언과 가짜 뉴스, 그리고 다른 유형의 규정 위반 콘텐츠를 모든 형태와 전 세계 모든 언어, 공동체별로 재빨리, 정확하게 포착하는 것"이라고 말했다.

하지만 남은 약 5%가 문제다. 미묘한 콘텐츠나 맥락 속에서 의미를 파악해야해 AI가 판단하지 못하는 경우들이다. 가령 묘지 사진 위에 '여기가 너의 자리야'라는 문구가 쓰인 경우 AI는 그 의미를 이해하는 데 어려움을 겪고, 빈정대는 표현이나 은어·속어 등은 항상 잡아내지는 못한다 이런 경우, 사람이 개입해 해당 콘텐츠가 규정을 위반했는지 결정해야 한다.

슈레퍼 CTO는 "페이스북이 직면한 도전은 복잡하고 미묘하며 급속하게 진화하고 있다"며 "멀쩡한 콘텐츠를 혐오 발언이나 가짜 뉴스로 잘못 분류할 경우 사람들의 표현의 자유를 방해할 수 있다"고 설명했다.

안희주 기자 postmoneynews@gmail.com

THE LAW는 모든 기사에 대한 독자여러분의 의견을 수렴하고 있습니다. 위 기사에 대한 소감, 정정이나 이의제기, 반박등의 의견이 있으시면 아래 이메일로 보내주시기 바랍니다. 보내주신 내용을 확인 후, 신속히 답변 드리겠습니다.

postmoneynews@gmail.com

Crimeisight

헤드라인

제호: THE LAW | 발행·편집: 더저스티스앤코(주) 송기란 | 청소년보호책임자: 송기란
전화번호: 070-4485-9119 | 이메일 : thecjnews@naver.com | 주소: 서울특별시 영등포구 여의서로 43, 614-A32호