인공위성 사진 분석 석유가 예측, 헤지펀드 ‘클러스터링’으로 수익 극대화

금융·투자 영역에서 AI와 빅데이터, 그리고 이를 활용한 클러스터링이 날로 활발하게 적용됙 있다. 이는 향후 국제 금융시장의 생태계를 근본적으로 바꿀 동력이 될 것이란게 많은 전문가들의 견해다.
물론 국제 금융시장의 메커니즘은 수많은 변수가 개입하며 복잡하게 얽히고 설켜 돌아가곤 한다. 이를 AI만을 활용하여 완벽하게 분석하고 미래를 예측하기에는 한계가 있어 보인다는게 대체적인 평가다. 그럼에도 불구하고, 인간이 분석하기에 한계가 있는 빅데이터나 이미지에 AI를 활용하여 이를 정밀하게 분석할 경우 종래의 투자 결정방식과는 또다른 큰 변화를 초래할 것이란 전망이다. 즉, 사람의 두뇌나 즉자적인 판단력 뿐만 아니라, 앞으로는 AI와 협력함으로써 한층 정확하고 정밀한 투자를 할 수 있다는 것이다.

AI의 복잡한 수학 원리로 ‘국제석유가격 예측’
그렇다면 AI는 어떻게 금융과 투자에 도움을 줄 수 있을까. 국제 금융시장에서 인공지능 펀드를 운용하는 인사이저가 최근 내놓은 사례에 따르면 국제 석유가격을 미리 족집게처럼 짚어내곤 하는 ‘오비털 인사이트’를 주목할 만하다.
이 회사는 인공위성 사진, 인공지능, 복잡한 수학 원리를 동원해 세계 산유국들의 석유 탱크 안까지 샅샅이 들여다보고, 며칠 후 혹은 몇 주 후의 국제 석유가격을 예측하는 곳이다.
그 과정에서 AI가 투자에 사용되는 전형적인 사례를 보여준다. 즉 인공위성으로 찍은 고선명도의 사진 속에서 석유탱크를 찾아내고, 석유탱크 사진에 드리워진 비정상적 장면이나 그림자를 통해 세계 석유 공급량을 예측하는 일에 AI를 동원한다. 이런 방식으로 오비털 인사이트는 세계 탱크의 80%를 매주 확인한다.
이렇게 수집된 데이터나 예측 자료를 통해 이 회사는 큰 수익을 거두고 있다. 미리 석유 가격을 예측하고 싶어 안달하는 헤지 펀드나, 에너지 기업 등에 비싼 값으로 데이터를 팔아넘기는 것이다.

인공위성에 비친 세계 석유 탱크 그림자 사진 분석
오비털 인사이트가 데이터를 얻기 위해서는 우선 세계 곳곳의 석유 탱크를 찾아야 한다. 아예 컴퓨터에 세계 각국이 석유를 저장하고 있는 오일 탱크 사진을 모조리 넣어둠으로써, 탱크를 포착할 수 있도록 했다. 그렇게 찾아낸 석유 탱크가 무려 25000개에 달한다.
이를 위해 이 회사는 지속적으로 탱크 이미지를 가져와서 컴퓨터로 분석한다. 분석의 열쇠는 석유 탱크에 드리워진 그림자에 있다.
탱크 바깥으로 뻗는 그림자는 탱크의 크기를 말해준다. 탱크는 5만에서 100만 배럴까지 다양한 크기가 있다. 반면 탱크 내부의 그림자는 탱크 안에 담긴 내용물의 양을 말해준다. 일반적으로 내부 그림자가 클수록 석유량이 적은 것으로 해석할 수 있다. 구체적으로는 위성과 태양의 위치까지 고려해서 산출한다. 이 모든 과정을 AI와 빅데이터 마이닝 기술을 통해 해낸다.
오비털 이런 방식이 등장하기 전까지 전통적으로 ​석유 공급량을 측정하는 방식은 다양하다. 굴착 장치의 수를 센다든지, 파이프라인을 본다던지, 선박물 카메라를 훈련시킨다든지, 호르무스처럼 수송선이 자주 다니는 해협을 지나는 유조선을 센다든지 하는 방식들이다. 
그러나 오비털은 석유 공급량을 측정하는 방식을 이처럼 AI와 빅데이터를 인공위성 사진의 해석에 접목함으로써 새로운 차원으로 바꿔놓은 것이다.
특히 지난해 사우디 석유 시설이 공격받은 후, 오비털은 사우디 석유 탱크의 그림자가 커지는 것에 주목했다. 그러나 중국과 미국 등의 석유 탱크는 가득했고, 인도는 사우디로부터의 수입이 줄면서 그림자도 커졌다는 사실도 예사롭게 넘기지 않았다. 

‘헤지펀드에 매우 유용한 정보’
이런 방식을 이용하면 주, 또는 월 단위로 발표되는 공식적인 발표보다 더 빠르게 재고 데이터를 제공해줄 수 있는 것이다. 인사이저에 따르면 “중국처럼 재고량을 공개하지 않는 경우”도 있긴 하다. 그럼에도 불구하고, ​석유 재고량 정보는 금융시장 참여자나 투자자들을 위시한 국제금융시장에 매우 유용하다. 금융시장 뿐 아니다. 산유국의 석유 생산자도 원유를 추출할지 결정하는 데 이용하고, 원유를 휘발유나 제트유로 바꾸는 정유소에서는 언제 원유를 살지를 판단한다. 그 중에서도 특히 헤지펀드는 이 정보를 이용해 투자를 하고, 수익을 얻는 등 요긴하게 활용하고 있다.

클러스터링 분석으로 펀드 수익 극대화
AI와 국제금융시장의 결합은 미국 헤지펀드에서도 볼 수 있다. 다름 아닌 클러스터링 분석(Cluster analysis)이다. 이는 주어진 데이터들의 특성을 고려해 데이터 집단(클러스터)을 정의하고 데이터 집단의 대표할 수 있는 대표점을 찾는 것으로 데이터 마이닝의 한 방법이다. 즉 투자 대상별로 비슷한 특성을 가진 데이터들의 집단을 ‘그룹’으로 묶는 방식이다.
클러스터(cluster)의 뜻은 ‘집단’, 즉, 독립 변수의 특성이 유사한 데이터 그룹이다. 주어진 데이터를 여러 개의 클러스터로 구분한 것이 클러스터링이다. 클러스터링은 독립 변수의 데이터 특성에 따라 '임의'로 데이터 그룹을 나누는 것이다. 즉 각 투자 대상이나 산업별로 특징들을 잘 파악해서 알아서 그룹화를 하는 것이다.
특히 헤지펀드 등에서 많이 쓰는 클러스터링 기법은 ‘k-means’ 클러스터링 기법이다. 이는 주어진 산업 특성이나 투자 목표, 가치 등 투자대상의 독립 변수 데이터를 K개의 군집으로 군집화 하는 것이다. 그 과정에선 이른바 모듈 방식을 활용하기도 한다.

산업 경계 무시한 데이터 마이닝으로 ‘군집화’ 
특히 컴퓨터 클러스터링의 기본적인 알고리즘은 우선 주어진 산업별 투자대상별 데이터 표본에서 임의의 샘플 값 하나를 고른 후 주어진 샘플 값에서 다른 샘플 데이터(산업 혹은 투자종목이나 대상)까지 거리(속성이나 특성 등 독립변수의 차이)를 측정하는 것이다. 그런 다음 각 데이터 샘플에서 가장 가까운 중심(특성 등 독립변수)을 선택하여, 다시 해당 샘플을 중심으로 다른 데이터 샘플 값까지의 거리를 계산한다. 이러한 과정을 반복하여, 군집화 즉 클러스터링이 이루어진다. 
이같은 클러스터링 방식은 AI를 금융에 적용하는 대표적인 방식으로 꼽힌다. 특히 산업 간 경계가 무너지고 있는 상황에서 클러스터링 방식은 매우 효율적인 수단으로 통용되고 있다. 전통적인 산업 분류 방식에 의한 투자보단, 종래의 산업별 특성은 무시하다시피 하고 대신에 새로운 독립변수 즉, 투자 기대가치나 목표가 유사한 특징을 갖고 있는 대상별로 군집화하고, 공략할 필요성이 높아지고 있다. 이로 인해 AI와 빅데이터를 활용한 클러스터링 기법이 펀드를 비롯한 금융시장에 폭넓게 활용되고 있는 추세다. 그 과정에선 종래의 전통적인 산업 간 경계도 허물어지고, 산업지형에 대한 새로운 개념이 새롭게 만들어지곤 한다는게 전문가들의 분석이다.

김예지 기자

저작권자 © 애플경제 무단전재 및 재배포 금지