박경만 한서대 교수
박경만 한서대 교수

‘코로나19’ 사태는 IT업계로서도 예삿일이 아니다. 특히 모든 IT프로세스의 피와 같은 데이터와, 그 심장 역할을 하는 데이터 센터가 문제다. 이곳이 만약 외부 침입자에 의해 뚫린다면, 데이터 센터나 기업으로선 그 어떤 재앙이 닥칠지 상상하기 어렵다. 그런데 데이터를 도둑질당하는 것보다 더 무서운게 있다. 데이터의 포로가 된 나머지, ‘데이터교(敎)’ 광신도가 되는게 그것이다. 다시 말해 데이터교의 왜곡된 교의에 감염되어, 데이터에 기반한 알고리즘을 맹목적으로 신봉하는 포로가 되는 것이다.

데이터를 절취당하면 당사자로선 무척 고통스럽다. 절도범이나 침입자의 농단에 따라선 엄청난 물적, 정신적 피해를 감수해야 한다. 이에 비해 데이터의 포로가 된다면 어떨까. 왜곡되고 편향된 데이터 수집과 마이닝에 의한 알고리즘은 결코 그 결과도 정의롭지 못하다. 이는 결국 ‘사이버 절도’와는 차원이 다른 피해를 유발한다. IT시민사회, 나아가선 그 외연을 알 수 없는 기술 공동체와 한 사회의 왜곡과 모순, 부조리, 다중(多衆)의 불공정과 불평등의 문제로 비화된다. 그에 의한 만성적이고 광범위한 피해를 유발하는 인류 차원의 재앙이 되기 십상이다. 단순히 한 기업이나 조직체가 데이터를 절취당하는 것과는 비교할 수조차 없다. 그래서 수학자 캐시 오닐은 맹목적이거나 편향된 판단에 의한 자의적 데이터 마이닝과 알고리즘을 ‘대량살상무기’라고까지 했다. 

기실 디지털혁명이 낳은, 데이터를 맹신하는 ‘데이터교(敎)’의 도그마는 초월적 무한의 질서에 대한 종교적 믿음처럼 강고하다. 데이터야말로 모순과 편견 투성이의 인간보다 공정하며, 개인의 공평한 이익과 권리를 수호한다는 이진법적 교의로 무장되어 있다. 과연 그럴까. 과연 정부와 기업, 사회에 도입된 데이터 기반의 알고리즘 모형들이 보편적인 정의를 구현해낼 것인가. 캐시 오닐은 이에 대해 단연 ‘노(No)’라고 딱 잘라 말했다. 그는 오히려 알고리즘의 원천을 생산해낸 인간의 무지와 편견이 ‘빅 데이터’의 DNA를 구성하고 있다고 꼬집었다. 

따지고 보면 데이터 역시 불완전한 인간이 만든 작품이다. 당연히 인종차별, 빈부 격차, 성차별, 지역차별 등 인간의 화석화된 관념이 코드로 변주될 수 밖에 없고, 그렇게 생성된 데이터는 오히려 불평등을 확대하고 민주주의를 위협하곤 한다. 그래서 그 본래의 의도야 어떠하든 자칫 수학과 결합된 왜곡된 데이터는 ‘대량살상무기’가 되기 쉽다. 실제로 수많은 데이터 과학자들은 자신이 목도한 데이터의 함정과 허구를 객관화하며, 이를 진솔하게 우려하기도 한다. 인간이 불완전한 만큼, 데이터와 알고리즘 역시 불완전할 수도 있음을 과감히 고발하는 것이다.

잘못된 데이터와 알고리즘의 횡포와 폐해는 광범위하다. 편견을 바탕으로 학교와 학생들을 줄 세우는 언론매체도 많고, 빅데이터를 무기로 약자들을 노리는 약탈적 광고로 배를 채우는 탐욕스런 기업도 한 둘이 아니다. 알고리즘이 광고와 기업행위를 거치며 ‘선동의 도구’가 되며, 확증편향적 데이터에 의해 무고한 약자들이 대거 희생되고 있다. 금융과 수학의 결탁으로 금융약자를 갈취하고 극소수 슈퍼리치를 살찌우는 ‘셸 쇼크’도 비일비재하다. 또 애매한 통계와, 이에 바탕한 알고리즘으로 인종과 재산에 따라 형벌의 무게도 차이를 둔다. 사실상 비과학적인 관상풀이나 다름없는 디지털 골상학으로 사원을 뽑기도 하고, 신용평가 하나가 취업도 대출도 사랑도 인생도 평가하는 세상이다. 인간에게 이익이 되라고 만든 데이터가 거꾸로 인간을 해치는 격이다. 그야말로 알고리즘의 역습이라고 할까.

이런 식으로 계속 가다간, 디지털혁명의 종착지는 ‘데이터교’에 의한 디스토피아다. 오도된 데이터와 알고리즘으로 교육, 노동, 광고, 보험, 정치에 이르기까지 인간성이 처절하게 파괴되는, 음울한 디지털 암흑기를 초래할 것이다. 물론 ‘코로나19’ 사태로 혼란한 이 시기, 데이터센터 업계 사활의 문제는 ‘사이버 방역’이다. 외부 침입을 막고 데이터센터가 작동하고 복원력이 유지될 수 있도록 하는 것이다. 그러나 데이터 수집과 분석, 평가 과정에서의 공정하고 정의로움은 그 보다 더 본질적인 문제다. 철저한 사이버 보안을 통해 데이터와 데이터 센터를 온전하게 지켜낼 수는 있어도, 그것이 왜곡과 편견 투성이의 데이터라면 소용없는 일이다. 그래서 정작 노심초사할 일은 ‘데이터 정의(正義)’다.

저작권자 © 애플경제 무단전재 및 재배포 금지