이디스커버리(eDiscovery)란 무엇일까

프론테오코리아
2019-05-30

프론테오를 잘 모르는 분들을 만나 "저희는 이디스커버리 등 법률과 관련된 데이터 처리 지원 및 관련 컨설팅 서비스를 제공하는 리걸테크 기업입니다"라고 소개하면 대부분 이해하기 어려워하십니다. 개념이 너무 생소하기 때문인데요. 오늘은 프론테오의 주 사업 영역인 이디스커버리가 무엇인지 등에 대해 상세하게 소개해드리려고 합니다.



이디스커버리란 무엇인가? 


이디스커버리를 알기 전 '디스커버리'라는 제도부터 설명해드리겠습니다. 디스커버리(Discovery)는 증거개시제도 혹은 소 제기 전 증거조사제도라고 번역할 수 있는 영미법계(Common Law, 미국/영국 등의 법률) 국가의 민사소송 절차 중 하나로, 사전 심리 단계에서 법적 소송 당사자가 소송 상대방이나 제 3자로부터 소송과 관련된 증거를 수집할 수 있도록 허용하는 제도입니다.  


법원의 사실심리(Trial) 전 사전심리 과정에서 피고와 원고 쌍방이 철저하게 '증거공개'를 하고 이를 통해 서로의 주장 및 소송의 쟁점을 객관적으로 파악해 상호 합의를 진행하는 것이죠. 미국의 경우 소송가액 4만달러 이상의 민사소송의 경우 90% 이상이 디스커버리를 시행하고 있으며, 디스커버리를 진행한 소송 건 수의 95%는 사실 심리 전에 합의 및 조정 등의 형태로 종결됩니다. 이렇게 수집된 자료들을 원고와 피고측의 법정 대리인이 확인 및 분석해 객관적으로 합의 또는 협의에 이르게 됩니다. 




미국 법정 드라마 등을 보면 변호사들이 산더미 같이 전달 돼 온 서류 박스들을 밤을 꼬박 새 분석하는 장면, 법정이 아닌 사무실에서 증인의 증언 녹취를 장면, 양측 변호사들이 모여 합의 및 협의를 진행하는 장면 등이 종종 등장하는데요. 이 과정이 바로 디스커버리입니다. 디스커버리 제도는 철저한 '증거공개'를 원칙으로 하고 있는 만큼, 자신에게 불리한 증거를 감추거나 왜곡했을 때, 혹은 제대로 자료 제출을 이행하지 않았을 때는 엄격한 제재를 받게 됩니다. '고의로 은폐했다'고 의심받게 되면 최대 패소판결까지 받을 수 있으며, 엄청난 규모의 배상금을 지급해야 할 경우도 생겨요.


이디스커버리(eDiscovery)는 디스커버리에 전자문서를 뜻하는 'e'를 붙인 것으로 미국에서 2006년부터 도입되어 활용되고 있어요. 이전 디스커버리 시대의 증거자료가 문서 형태로 된 자료였다면, 이디스커버리 시대에서는 '전자문서'의 형태를 띄는 것이죠. 전자문서의 범위는 매우 넓어서 워드, 엑셀, PPT 이런 개별 파일 뿐 아니라 이메일, 데이터베이스, 오디오와 비디오파일, 소셜미디어,웹사이트 등 다양한 형태가 포함됩니다. 또한, 전자문서의 경우 일반 문서보다 수정, 조작되기 쉬우므로 수정 및 업데이트 기록이 담긴 타임스탬프(Timestamp) 등 메타데이터도 중요한 자료입니다. 


2002년 미국의 Zubulake. V. UBS Warburg LLC사건은 이디스커버리 제도 도입에 있어 매우 중요한 영향을 끼친 사건인데요. 원고인 Laura Zubulake는 고용 차별을 이유로 고용주 UBS Warburg에 대한 소송을 진행합니다. 이때 고소가 합리적으로 예상된 상황에서 피고(UBS)는 고의적으로 서버에 저장된 '자신들에게 불리한' '증거의 가능성이 높은' 관련 이메일들을 삭제 및 훼손합니다. 또한 피고측은 실제 소송에서 증거개시 명령을 받았을 때 백업 자료에서 관련 이메일 복구가 기술적, 비용적으로 충분히 가능했지만 이를 이행하지 않았습니다. 증거개시를 부당하게 지연시켜 원고의 증거 수집을 방해했고 시간적, 비용적으로 원고에게 손실을 입힌 점이 인정되어 원고 Zublake는 2900만 달러의 배상판결을 받게 됩니다. 이디스커버리 제도 도입 전이었음에도 전자문서의 증거 인정 필요성을 확인하고 증거의 삭제, 수정, 은닉 등에 대해 엄한 처벌을 내린 사례로 유명합니다. 



  

이디스커버리에 도입된 리걸테크란?  


이디스커버리에 '기술'이 도입된 배경에 대해 살펴보겠습니다. 과거 종이 문서만 증거로 인정되던 시기에는 필요한 정보를 찾기 위해 대규모 변호사팀이 수 주 혹은 수 개월에 걸쳐 문서로 가득 찬 박스를 일일이 뒤져 증거를 찾았습니다. 시간이 오래걸리고 고된 작업이었죠. 때문에 소송 상대방을 괴롭히기 위해 고의로 많은 양의 증거를 신청하거나, 분류되지 않은 수많은 자료를 전달하는 일도 있었어요.  


이디스커버리가 도입되면서 증거의 범위가 전자문서로 확대되니 분석해야 할 정보의 양이 기하급수적으로 늘어났습니다. 법원에서 요구하는 시한 내에 사람이 처리하기 불가능한 수준의 데이터들을 분석해 증거와 관련이 있는 자료들을 찾아 법원에 제출되어야 하는 경우도 종종 생겨났죠. 1TB가 담고 있는 정보의 양을 종이에 뽑아 쌓아놓으면 3km 높이에 달한다고 하는데요. 그 수많은 문서 속에서 소송과 관련된 자료를 찾아내는 것은 사막에서 바늘찾기만큼 어렵습니다. 이 과정을 돕기 위해 머신러닝 등 인공지능 기술이 도입되기 시작했고 리걸테크가 발달하는 계기가 되었습니다.


문서 리뷰의 과정에서 변호사 등 전문가의 판단 기준을 학습해 관련성 있는 자료들을 자동으로 분류해주는 기술을 Technology Assisted Review(TAR) 또는 Predictive Coding(예측부호화) 라고 부르며, 처리 과정은 아래와 같습니다. 





1) 변호사 등 관련 전문가가 증거를 확인해 '중요문서' '비중요문서' 등으로 자료를 분류하는 '부호화'작업을 합니다

2) 이 부호화 작업을 마친 샘플데이터를 인공지능에 트레이닝 시킵니다 

3) 인공지능 입력된 표본을 바탕으로 나머지 자료들을 리뷰해 표본과 유사한 관련 문서를 찾아냅니다 

이러한 과정을 거쳐 표본과 근접한 순서대로 자료를 확인해 보다 빠르고 정확하게 증거로서의 가능성이 있는 자료들을 찾아낼 수 있습니다.    



법정에서 인정되는 리걸테크, Predictive Coding


2012년 4월, Da Silva Moore Case는 Predictive Coding 기술이 법적으로 처음 인정받은 사례입니다. 소송 당시 Predictive Coding 기술은 약 2백만개의 문서를 대상으로 한 1st Review(= Review 과정 중 가장 첫 번째 절차로써, 많은 양의 문서들은 오직 소송의 관련성에 따라 관련 및 비관련, 혹은 기밀문서로 구분하는 절차)에 활용되었습니다. Da Silva Moore Case 이후, Predictive Coding과 관련하여 많은 Article이 쏟아져 나왔고 기술에 대한 논의도 점차 활발하게 이루어졌습니다.  


<Source: Da Silva Moore, 287 F.R.D at 192 (Fourth and fifth alterations in original)>


현재 해당 기술은 법적으로 인정되며 적용방안 및 가이드라인도 구체적으로 정립되어 있습니다. Predictive Coding이 이디스커버리에 소요되는 시간과 비용을 상당수 절감해줘 제도의 원활한 운영에 도움을 주고 있습니다. 



프론테오코리아 이디스커버리 서비스 문의하기 


프론테오코리아

FRONTEO Korea, Inc.


전화 : 02-350-3000

문의 : koreainfo@fronteo.com

주소 : 서울시 강남구 테헤란로 142 아크플레이스

(구 캐피탈타워) 11층 (06236)

Copyright © FRONTEO Korea, Inc. All Rights Reserved.

프론테오코리아 (FRONTEO Korea, Inc.)


전화 : 02-350-3000

문의 : koreainfo@fronteo.com

주소 : 서울시 강남구 테헤란로 142 아크플레이스 (구 캐피탈타워) 11층 (06236)


Copyright © FRONTEO Korea, Inc. All Rights Reserved.