소셜 데이터로 본 ’연결’과 ‘이주’의 현재
김선희(아시아연구소)
최근 몇 년 사이, 소셜 네트워크에 남겨진 포스팅 자료를 통해 실제로 사람들이 누구와 연결되어 있고 어디로 움직이는지를 소셜 데이터에서 거의 실시간으로 읽어내기 시작했다. 이는 국민 국가 단위를 기본으로 하여 수집, 축적, 분석되던 인구, 경제, 자연, 영토에 대한 통계에 균열을 일으키고 있으며, 전지구적 인구 활동의 새로운 측면을 드러내 주고 있다.
메타(AI and Data for Good)[1]는 소셜 데이터를 기반으로 하여 각종 지표들을 만들어 내고 공개하였다. 인구(Population), 이주(Mobility), 사회 연결(Social Connections) 등과 같이 소셜 네트워크에서 추출할 수 있을 법한 통계부터 인프라(Infrastructure), 경제(Economic), 건강(Health), 환경(Climate)까지 망라하고 있다. 가령, 사회연결지수(SCI – Social Connected Indicator)는 지역 간 ‘우정 네트워크’의 밀도를 보여준다. 이 단순한 연결지도는 전통적 이주 이론이 말해온 디아스포라 네트워크 효과를 미시적으로 포착하고 있다. 실제로, 이러한 데이터를 이용하여 누가 어느 나라·도시와 촘촘히 연결되어 있는지 시각화하고, 그 연결이 처음 발걸음이 향하는 곳과 정착이 이어지는 경로를 설명하는 데 유용하다는 연구가 이어졌다 (Bailey et al., 2018).
우크라이나 전쟁 이후 유럽의 수용도시 분포를 보면 이런 그림이 더욱 선명해진다. 국경을 넘는 순간의 첫번째 이주 물결 뿐만 아니라, 몇 주·몇 달 뒤에 자연적으로 이어지는2차 이동—친지나 지인 등 연고가 있는 도시로 다시 옮겨가는 흐름—을 SCI와 이동(Mobility) 데이터가 함께 보여준다. 덕분에 단순한 유입 뿐만 아니라 정착 및 재이동의 동학을, 거의 실시간으로 분석하고 읽을 수 있게 되었다(Data for Good at Meta – High Resolution Population Density Maps). 이러한 데이터를 활용해 지방 당국에서는 주거·교육·보건 자원을 어디에 얼마나 배치할지를 보다 선제적으로 가늠할 수 있게 되었다.[2]
또 하나 주목할 점은 광고 수용자 데이터를 연구에 활용하는 것이다. 페이스북 광고 관리자에서는 ‘어떤 나라 출신’과 같은 출신국을 기준으로 타깃 광고 대상자 수를 보여주는 기능이 있는데, 연구자들은 이 데이터를 활용하여 사실상 해외에 거주하는 디아스포라 집단의 대략적 규모를 실시간으로 추산하는 자료로 쓸 수 있는 것이다. 다시 말해, 기업을 위한 상업적 지표가 동시에 학계나 정책 연구에서 사회 집단의 규모를 가늠하는 자료로 기능하는 것이다. 이 지표는 ‘해외 한인’이나 ‘폴란드 내 우크라이나인’처럼 거대 디아스포라의 규모 변동을 민감하게 포착하는 도구로 부상했다 (Zagheni, Weber & Gummadi, 2017; Spyratos et al., 2018). 특히 계절, 정책 변화, 안보 사건 이후 나타나는 급격한 증감을 신속히 읽어내고 드러내는데 강점이 있다.
재난(Disaster), 이주(Displacement) 지도와 이동(Mobility) 지표도 흥미롭다. 대규모 재난이나 분쟁이 발생하면, 휴대폰 기반 위치·체류 패턴에서 ‘사람이 빠져나간 자리’와 ‘사람이 몰리는 곳’이 나타난다. 이때 네트워크 데이터와 겹쳐 보면 사람들이 빠져나가서 점점 몰리는 곳에 대한 답이 어느정도 나온다. 사람들은 연결 네트워크의 밀도가 많은 곳으로 모이는 경향을 보인다. 즉, 이주 연구 문헌에서 오랫동안 검증해온 이동의 동학인 ‘사람들이 원래 많이 연결되는 곳에 더욱 사람들이 모이는 패턴’이 시각적으로, 데이터를 통해 확인되는 셈이다.
물론 소셜 네트워크를 통해 취합한 자료의 한계는 존재한다. 플랫폼 이용자 구성이 특정 연령 및 지역에 치우쳐 있을 수 있다. 또한 알고리즘이나 기업 정책의 변화가 자료상에 직접적인 영향을 미치기도 할 것이다. 또한 익명화, 자료 분류 및 분석 단계에서 불가피하게 데이터가 왜곡되는 지점도 존재한다. 따라서 가장 현명한 접근법은 소셜 네트워크에서 수집된 데이터를 사용하되, 단일 지표로 과신하고 않고, 다른 여러 자료 – 국가 통계 자료 및 현지 조사 자료와 교차 검증한 한도 내에서 해석하는 것이다. 소셜 네트워크 데이터가 가지는 뚜렷한 차별적 가치는, 이 모든 한계점을 차치하고, 일정 수준의 현재 진행형의 움직임을 드러내 준다는 것이다. 즉, 소셜 네트워크 상의 데이터는 불완전하기는 하지만 동적인 움직임을 지니고 있기에 전통적 통계에서는 알기 쉽지 않은 현재의 긴급한 변화를 국경을 넘어 광범위하게 추적하는 주요한 도구가 될 수 있다.
참고문헌
[1] https://dataforgood.facebook.com/
[2] OCHA. 2024. OCHA and META: Partnering to Give Humanitarians Open Access to Population Data. OCHA-META Final Impact Story. (https://reliefweb.int/report/world/impact-story-ocha-and-meta-partnering-give-humanitarians-open-access-population-data?fbclid=IwZXh0bgNhZW0CMTEAYnJpZBExWWpJV3JjcHViWTRuVks1MQEexEWwiD4c6F00CFeTktJ5yyDO1OP43daCRkc_-xEWvpOoIMblfxgIliju6L8_aem_wMRHUQxCMeNfRY9erpWbdg)