데이터 무단 수집 vs 어차피 공개된 데이터, 국내 크롤링전쟁 언제까지?

경제와 산업 | 2022-04-20 19:24:49

박성진 기자

데이터 무단 수집 vs 어차피 공개된 데이터, 국내 크롤링전쟁 언제까지?
네이버가 부동산 중개 플랫폼 ‘다원중개’를 대상으로 데이터베이스권 침해금지 가처분 소송을 냈다. 다원중개 사이트에 게시된 매물 정보가 네이버 부동산으로 이동할 수 있게 하는 아웃링크 방식으로 크롤링 됐다는 부분이 문제가 되고 있다. 크롤링이 데이터를 기반으로 한 비즈니스 산업의 중심인만큼 소송에 IT업계의 관심이 집중되고 있다.

크롤링이란?

웹 크롤링은 간단히 말해 웹상의 데이터를 수집하고 정보를 추출하는 작업을 말한다. 웹 문서는 다른 웹 문서들과 서로 연결되어있다. 소프트웨어가 웹을 돌아다니며 연결된 웹 문서들을 링크를 타고 데이터를 수집하는 작업이 크롤링이다. 웹 크롤링은 데이터가 중요해지면서 빅데이터를 수집하고 활용하는 거의 모든 분야에서 쓰인다.

지속되는 국내 크롤링 분쟁

데이터가 돈이 되는 시기에 웹 크롤링을 통한 데이터 수집은 플랫폼 간 분쟁을 만들어냈다.

  • 취업 정보 플랫폼 사람인 vs 잡코리아: 2010년 잡코리아는 자사의 채용 정보를 크롤링해 웹사이트에 게재하는 사람인에 대해 소송을 걸었다. 이에 대해 법원은 잡코리아의 손을 들어줬다.
  • 숙박정보 플랫폼 여기어때 vs야놀자: 야놀자는 자사의 숙박정보 무단 복제를 이유로 여기어때를 고소하고 민사 소송도 제기했다. 민사소송에서 법원은 여기어때의 손을 들어줬다. 하지만 형사 재판 1심에서 여기어때는 유죄를 선고받았지만, 항소심에서 무죄를 받았다.
  • 캐치패션 vs 발란, 머스트잇, 트렌비: 2021년 캐치패션이 발란, 머스트잇, 트렌비가 무단으로 상품 정보를 크롤링했다고 고발했다. 아직 재판부가 판단 중이다.


미국에서는 합법?

미국 항소 법원에서는 공개된 정보를 수집해 데이터를 스크래핑(크롤링)하는 걸 합법으로 판단한다. 하이큐랩스는 구인구직 SNS 링크드인 이용자의 프로필에서 개인정보를 수집해 직원 이직 가능성을 예측하는 알고리즘을 개발했다. 이에 링크드인은 하이큐랩스를 웹스크래핑 혐의로 고발했다. 하지만 법원에선 ‘컴퓨터 사기 및 남용 방지법'(CFAA)에 근거해 이미 링크드인에 공개된 정보를 하이큐랩스가 수집한 것이 위법하지 않다는 결론을 내렸다. 국내에선 대형 플랫폼과 스타트업 사이의 크롤링 분쟁에 대해 어떤 결론을 내릴지 귀추가 주목된다.

박성진 기자 postmoneynews@gmail.com
THE LAW는 모든 기사에 대한 독자여러분의 의견을 수렴하고 있습니다. 위 기사에 대한 소감, 정정이나 이의제기, 반박등의 의견이 있으시면 아래 이메일로 보내주시기 바랍니다. 보내주신 내용을 확인 후, 신속히 답변 드리겠습니다.

postmoneynews@gmail.com

<저작권자 © THE LAW, 무단 전재 및 재배포 금지>

모바일화면 이동