박경만 한서대 교수
박경만 한서대 교수

우리 주변에선 사실 여부를 판명하는데, 객관적 사실보다 감정과 개인적 믿음이 영향력을 끼치는 ‘포스트 트루스(Post Truth)’ 현상이 난무하곤 한다. ‘지구는 둥글다’는 합리적 진리와는 달리, 한 가지 사실을 두고 다원적 주관에 따라 여러 가지로 ‘해석당하는’ 사실적 진리도 횡행한다. 이른바 알고리즘 혹은 빅데이터 모형의 경우 이런 갈짓자 해석과 결론이 비일비재하다. 알고리즘이란 본래 복잡한 인간 세상을 단순화한 개념이다. 세상을 장난감처럼 단순화시켜야 한다. 그렇다보니 개발자의 판단 기준과 주관에 의해 가지치기가 이뤄지기 십상이다. 선택하고픈 것, 믿고 싶은 것만 데이터로 추출하는 ‘확증편향’이 개입하고, 진실은 물론, 사실을 반영하지 않는 경우도 많다. 

미국 전역 1,500개 대학을 일렬로 순위 매기는 것으로 유명한 시사주간지 <유에스 뉴스&월드 리포트>는 그 대표적인 사례다. 이 매체는 SAT점수, 학생 대 교수 비율, 입학경쟁률, 신입생 잔류율과 졸업률, 동문들의 모교 기부 비율 등을 임의로 선택하고 가중치를 부여했다. 그러나 빅데이터를 구축하고, 알고리즘을 짜는 과정에서 ‘팩트’보단 ‘직감’이 중요한 역할을 했다. 수많은 변수 중에서 어떤 것이 과연 고려할 만한 가치인지에 관한 과학적이고, 통계 분석학적 근거는 미미했다. 그럼에도 순위가 발표될 때마다 대학들은 난리가 났다. 그야말로 평판에 의해 대학의 생존이 결정되는 ‘평판 생태계’가 팽배해졌다. 모든 대학들이 <유 에스 뉴스>의 알고리즘에 맞는 조건을 강화하느라 법석을 떠는 피드백 루프 현상이 이어졌다.

이보다 더 심한 경우도 있다. 미리 생각해둔 결론에 끼워넣기에 좋은 자료만 골라 빅데이터를 엮어내는 확증편향이나 체리 피킹(Cherry Picking) 현상이 그것이다. 흑인들의 ‘재범 위험성’을 빅데이터로 엮은 차별 모형이 그런 것들이다. 편견에 사로잡힌 가정을 전제로 이미 머릿 속에 존재하는 ‘흑인 비하 모형’이 빅데이터와 알고리즘의 포장을 뒤집어썼다. 이는 결국 불완전한 일반화의 오류로 가득 찬 데이터로 가득차있다. 이런 경우 알고리즘 개발자들은 차별의식에 사로잡혀 왜곡된 모형을 수정하긴 커녕, 신뢰성 있는 데이터를 수집할 노력도 거의 하지 않는다. 

이런 빅데이터의 오류로부터 비교적 자유로운 영역이 있다. 최근 대중화의 길로 들어선 모바일 금융이다. 이는 개인의 신용도 측정과 대출 관행 등에서 정태적(情態的)이고 경직된 기존 금융 모델과는 다르다. 모바일 통신 거래에 의해 수요자들은 금융기관이 활용할 수 있는, 실시간의 현장 정보를 제공한다. 이를 통해 은행은 더욱 수익성 있는 서비스를 개발하고, 직장이나 직업 등 공적인 신원정보나 금융 이력이 없어 신용등급이 낮은 고객에게도 금융 서비스를 제공할 수 있다. 또 모바일 플랫폼으로 은행과 고객을 실시간으로 연결한다. 상품 구매 현장에서 실시간으로 이뤄지는 모바일 결제와 모바일 플랫폼은 데이터 작업 과정에서 ‘확증편향’이나 피드백 루프의 소지를 원천적으로 없애준다. 

금융기관은 거래 현장에서 고객 습성을 실시간으로 추적해 유용하고 정밀한 데이터를 생성한다. 모바일 QR코드 하나만으로도 개인의 거래 유형이나 사용 통화의 종류를 들여다볼 수 있다. 성별, 직업별, 연령별, 지역별 고객군의 행동 양상에 대한 유용한 지식을 얻을 수 있고, 매일 혹은 매순간 변동하는 소득수준이나 근무 상태, 사회적 유대감이나 결혼 상태, 신용도 변화 등을 파악할 수 있다. 이를 토대로 앞으로 그가 어떤 소비패턴이나 라이프 스타일을 보일 것인지 짐작할 수 있는 것이다. 화석화되지 않은, 그야말로 살아 움직이는 세밀한 빅데이터의 보고가 모바일이라고 할 수 있다.

빅데이터는 AI와 자율조정장치 등 기술적 성취는 물론, 디지털 혁명의 성패를 좌우할 만한 무게를 갖고 있다. 그럴수록 무계획적인 데이터 수집이나 인과관계가 입증되지 않은 허위상관(correlation)에 의해 오염되어선 안 될 것이다. 거짓이라고 할 순 없지만, 사실에 대한 자의적 맥락의 해석, 의도된 결론을 정당화하기 위한 ‘과잉사실’의 무분별한 호출도 삼가야 할 것이다. 적어도 모바일 금융은 그런 굴절된 현상과는 거리가 있는, IT시대의 착한 도구라고 할 만 하다. 최소한 실시간의 리얼하고 정직한 데이터에 기반해 그나마 시장을 충실히 반영한다고 할까. 잘만 되면 장차 일궈야 할 디지털 혁명의 미덕 중 하나가 될지도 모른다.

박경만<한서대 교수>

저작권자 © 애플경제 무단전재 및 재배포 금지