팔란티어Palantir 기업의 온톨로지 개념
[팔란티어Palantir는 데이터 통합 분석을 전문으로 매우 비밀스러운 일을 하는 회사로 알려져 있다. 그러나 이 회사의 핵심 상품을 알고보면 이 기업의 미래 가치는 매우 크게 느껴진다. 이 기업은 아마도 인공지능과 결합해 앞으로 거의 모든 산업의 자율 운행시스템과 정보 관리시스템에 핵심 인프라를 제공하게 될 것이라 생각된다. 그 상품의 핵심 개념은 온톨로지(Ontology) 시스템에 있다. 온톨로지란 통상 존재론으로 번역되는데, 여기서 온톨로지란 파운드리(Foundary)에 통합된 데이터들위에 놓여진 의미론적인 계층으로 정의된다. 쉽게 말하면 어떤 대상의 개념을 그 대상의 종류, 속성, 관계, 기능 등으로 정의 또는 범주화해서 컴퓨터 언어로 정리해 놓은 것이다. 그리고 정보들끼리 관계를 규정해서 인공지능이 인식할 수 있는 구조화된 의미체계가 있다는 것이다.
사용자의 목적이 설정되고 데이터에 특정 의미가 부여되면 기존에 입력된 정보들에 의거해서 인공지능(AI)이 효율적으로 솔루션을 찾는다. 이러한 시스템을 바탕으로 자율 운행 시스템의 기반을 구축할 수 있다. 그리고 이 시스템은 모든 구성원들이 조직의 전체 목표를 명확하게 인지하게 되고, 목표를 위해 함께 나아갈 수 있어 효율성이 극대화되는 것이다. 그러나 개개의 의식이 전체 목표와 다르게 작동될 때, 시스템은 그 개개인의 활동을 제한하고, 결국 퇴출시키게 될 것이다. 이러한 시스템이 만약 악용된다면 상당히 심각한 문제가 발생하겠지만, 긍정적으로 보면 거짓이 통하지 않는 투명하고 정의로운 그리고 공공의 이익에 부합하는 효율적인 사회 시스템을 구현하는 것도 가능할 것 같다. 이걸 보면 각 개념들의 체계적인 정리가 얼마나 중요한지를 다시 한번 절감한다.]
우리가 기업에 대한 투자의 안목을 기른다라는 관점으로 본다면 사실은 2016년 이전에 테슬라로 갔을 때 그때 테슬라를 알아볼 수 있는 능력을 기르는 게 사실 진짜라고 저는 생각을 하거든요. 개인적으로는 2016년 정도 때부터 테슬라를 모니터링을 했었었는데 그때 당시에는 온라인에서 테슬라에 대해서 얘기하시는 분들이 거의 없었어요. 제 기억에는 레이어드님이란 분이 블로그 상에서 그나마 좀 활동을 하셨었고 초창기 기업의 안목을 기른다라는 게 되게 어려운 일인 것 같아요. 저는 팔란티어Palantir(웹사이트 클릭)가 2016년에 테슬라라고 생각을 합니다.
자 그러면 팔란티어는 무슨 기업인가요? 팔란티어에 대해서 찾아보면은 이런 얘기들이 나와요. 가장 비밀스러운 기업인데 너무 비밀이어서 비밀이라는 단어밖에 안 떠올라요. 전쟁과 관련이 있고 AI계의 리오넬 메시라는데 왜 메시인지도 알 수가 없고 데이터 통합 분석을 전문으로 하는 회사다. 데이터 기반 의사결정을 한다. 파운드리(Foundary)를 만들었다 대부분 요 정도의 표면적으로만 알고 계시고 레포트를 봐도 그냥 이런 그림으로만 나와 있는 거예요. 데이터가 어떤 데이터 웨어하우스에 저장됐다가 어떤 요리조리 과정들을 통해서 여러 가지 비즈니스의 가치를 창출한다. 그냥 요 정도의 개념만 지금 알고 있는 거죠. 이게 다죠. 그러니까 팔란티어의 미래를 얘기 한다라고 하면은 인제 빅데이터 시장을 얘기를 하게 되는 거죠. 근데 이건 너무 표면적인 얘기예요.
테슬라를 그냥 전기차 기업이라고 보는 관점이라고 할 수 있을 것 같아요. 제 생각에는 그렇습니다. 그래서 오늘 시간에는 팔란티어를 제 1원칙 사고법으로 좀 다가가 보려고 해요. 이게 인제 일론 머스크의 사고방식이라고 해서 되게 유명해졌는데 본질로 들어가서 새롭게 파헤쳐 보자는 내용이죠. 여러분이 팔란티어를 한번이라도 접해보셨다 라고 한다면, 이 특이하게 나오는 개념 하나가 있습니다. 온톨로지(Ontology)죠. 아마 1번 정도 들어보셨을 거예요. 온톨로지를 어떻게 설명하고 있냐고 하면, 통합된 데이터들위에 놓여진 의미론적인 계층이다. 아 근데 이게 무슨 말이에요. 저는 처음 이거 보고 나서 이게 뭔 얘기야? 계층이라는 말도 어렵고, 의미론적이라는 말이 무슨 말이에요. 그런데 재미난 게 뭐냐 하면 의미론적인 계층이라는 말보다 더 잘 표현할 수 있는 단어가 없어요. 이제 제 방송 다 보시고 나서는 그걸 아마 쉽게 이해하게 되실 겁니다.
그래서 원래 온톨로지 자체는 사실 철학에서 온 용어로 어떤 존재를 규명하는 겁니다. 존재를 정의하는 거예요. 예를 들어서 뭐 사과가 있는데, 사과는 이런 맛이 나고 색깔은 어떻고 등등 사과라는 개념을 정의하듯이 존재개념을 정의를 하는 건데, 이게 어떻게 과학계에 넘어오게 됐냐면 1989년도에 월드와이드 웹이 처음 만들어졌을 당시에 웹상의 데이터들이 산발적으로 있다 보니까 이런 생각을 한 거예요. 컴퓨터가 이 데이터들을 이해할 수 있을까? 규칙을 부여하면 되겠다라는 이런 아이디어를 인제 떠올리게 됩니다. 예를 들면은 웹상에 노랑색 바나나라는 데이터가 있는데, 컴퓨터는 이걸 이해하지 못하는 거예요.
이렇게 컴퓨터스럽게 굉장히 코딩스럽게 규칙을 부여해서 정의를 내리게 되면은 노란색이 바나나의 색깔이다라고 알 수 있게 된다는 거죠. 이렇게 개념을 정의하는 게 바로 온톨로지입니다. 그래서 팔란티어에서는 온톨로지를 어떻게 정리를 했냐면 세상을 카테고리화 하는 거라고 얘기하고 있어요. 개념을 정의한다는 것 자체부터가 사실은 카테고리가 되는 거거든요. 우리가 사과의 특징을 정의하는 순간 다 다른 과일들과 분류가 되는 거잖아요. 어떻게 그럼 개념을 정의하느냐?
이 4가지를 얘기하고 있어요. 이게 인제 말이 좀 어려울 수 있는데, 객체의 종류 그러니까 저는 남자이고 어떤 속성들을 갖고 있고 누구와 관계하고 있고 어떤 장단점들과 기능이 있고 이런 식으로 저를 정의를 하는 거죠. 이에 온논톨로지의 가장 대표적인 그림이 이 그림이거든요. 보시면 이건 항공산업에 관련된 매체들을 보여주는 온톨로지인데 근데 여기 보시면 플라이트에 보면은 출발, 도착이라는 속성이 있는 거예요. 얼마나 승객을 태울 수 있는가 이런 속성들을 표현을 하고 있는 거죠. 그럼 개념을 어떻게 정의하느냐? 코딩으로 정의하는 거예요. 프로그래밍 언어로 정의를 하는 겁니다.
팔란티어가 만들어 놓은 좀 더 정확히는 언어 자체는 자바 스크립트 계열의 언어이고 팔란티어가 여러 가지 코딩들을 다발 꾸러미로 일종의 라이브러리 형태로 모아놓은 거죠. 그런데 팔란티어는 그 개념을 정의하는 일을 개발자의 온전한 목소리로 한 게 아니라 일반인들도 이걸 개념을 정의할 수 있게 그 도구들을 만들어 놓고 있어요. 이런 식으로는 UI 창에서 가능한데, 이렇게 뉴 오브젝트를 눌러가지고 그 창에다가 속성들을 정의를 하는 거죠. 세이브를 누르면은 온톨로지가 선언이 되는 겁니다. 그래서 인제 어떻게 진행이 되느냐? 클라우드에 저장돼있는 데이터들을 통합을 해서 온톨로지 층에서 다시 한번 개념을 정의를 하는 겁니다. 처음 보셨던 이 그림을 보시면은 요 정도쯤에 온톨로지 층이 존재하고 있는 거죠.
그래서 기존에 있던 데이터들이 온톨로지라는 필터를 거쳐서 밖에 있는 컴퓨터 화면으로 표출이 되는 건거죠. 그 온톨로지를 이렇게 3가지 계층으로 돼있다라고 표현을 하는 사실 이게(Semantic) 가장 핵심이에요. 나머지는 기능적인 개념인 거고, 본질을 얘기한다면, 시멘틱 레이어가 뭔지를 알아야 됩니다. 일반적인 클라우드 기업들이 데이터 생태계를 구축할 때 이 4가지 질문을 한다고 해요.
이 데이터가 어디서 왔고, 어디로 가고, 거기서 무슨 역할을 하고, 이 데이터에는 누가 접근을 하는가? 이게 일반적인 질문인데 팔란티어는 여기서 1가지 의문을 더 던지는 거죠. 이 데이터가 무엇을 의미하는가? 데이터 자체에는 의미가 없다라는 거예요. 그냥 그거는 하나의 정보일 뿐이지. 데이터는 생태계 사용자에 의해서 의미가 부여된다라는 개념이에요. 좀 어려운 거예요. 여러분 저는 이 말을 딱 들었을 때 가장 먼저 떠올랐던 게 뭐냐면은 김춘수 시인의 '꽃'이라는 시였어요. 이름을 불러주었을 때 나에게 와서 꽃이 되었다. 이런 개념인 거죠. 모임에 갔는데 여러 사람들 있잖아요. 근데 어떤 사람이랑 얘기하기 전까지는 그 사람은 그냥 그룹의 멤버일 뿐이에요. 그런데 그 사람이랑 내가 통성명을 하고 얘기를 함으로 인해 그래서 어떤 관계가 형성이 되잖아요. 뭐 영철이라는 사람이 있다라고 한다면은 영철 씨, 영철이 형, 영철아 이렇게 부르는 순간부터 그 관계가 지어지게 되잖아요. 하나의 의미가 부여된다라고 할 수 있는 거죠. 그래서 그냥 데이터 자체랑 데이터에 의미가 부여된다는 것을 완전히 별개의 개념이라고 생각을 하시면 되겠습니다.
그러면은 사용자는 언제 데이터의 의미를 부여하게 될까? 원래 온톨로지가 의학의 영역에 있어요. 개념을 정의하는 거기 때문에 그러니까 질병을 정의하는 거잖아요. 정보들을 온톨로지화 하는 게 의사들이 하는 일이에요. 환자가 병원에 와서 자신의 무수한 정보들을 의사들한테 제공을 하거든요. 어디가 아프다 그럼 몸에 행색 피검사를 통해서 나온 수치적인 정보 그리고 CT를 찍었을 때 어떤 영상학 정보들 비정형 데이터 정형 데이터 의사한테 다 제공을 하는 거죠. 그러면은 의사는 카테고리화 시키는 거예요. 그런데 여기까지만 얘기하면 이거는 일반적인 기업들이 하는 겁니다. 팔란티어는 데이터들을 통합하고 분류하기 전에 뭔가를 꼭 한가지를 먼저 하라고 해요. 뭐냐면 문제를 정의하는 거예요. 해결하고자 하는 문제가 무엇이냐?
이제 질병을 예방할려고 하는 사람이 있어요. 사람은 심장병으로 아스피린을 먹고 있고 우연히 건강검진을 했는데 대장에서 용종이 발견된 거예요. 용종을 떼내야 되잖아요. 이 아스피린이라는 약을 먹으면 지혈이 잘 안 돼요. 피가 1번 나면 잘 멈추지가 않는 거죠. 그래서 이 상태에서 용종을 떼게 되면은 이 사람 출혈이 생기게 됩니다. 그런데 이 사람의 설정한 문제는 질병을 예방하는 거잖아요. 그럼 출혈이 생기면 안 되잖아요. 그래서 이 사람에게 내려진 솔루션이 뭐냐 하면은 아스피린을 일주일간 중단하고 그리고 용종을 떼내라는 거예요. 그러면은 출혈도 안 생기고 용종도 사라지니까.
두 번째 사례 이 사람은 죽음의 가능성을 낮추는 게 자신의 설정된 문제예요. 근데 이 사람도 똑같은 조건이에요. 그런데 이 사람에게 앞선 사례와 똑같이 아스피린을 중단하고 용종을 떼내면 어떤 일이 생기느냐 아스피린을 함부로 끊으면 안 되거든요. 왜냐하면, 심장병이 금방 재발을 해요. 그래서 대표적으로 심근경색이라는 게 있는데, 심근경색 게 재발을 하게 되면 즉사하거든요. 아스피린을 먹으면서 용종이 용종을 떼게 될 경우에는 출혈이라는 위험이 생기고 아스피린을 중단하고 용종을 떼게 되면 심근경색이 생기게 되니까. 둘 중에 뭐가 더 위험한지를 판단을 해야 되는 거예요. 그러면 당연히 심근 신경색이 훨씬 더 위험하니까 이 사람한테는 솔루션이 이렇게 바뀌게 돼요. 아스피린 그냥 유지하고 피나는 거 그냥 감수하고 용종 떼내라는 거예요.
그러니까 이 출혈이라는 데이터가 설정된 문제에 따라서 의미가 다르게 부여가 되는 거예요. 질병을 예방하는 차원에서는 금기시 되는 데이터인 거고, 죽음의 가능성을 낮추는 관점에서는 허용이 되는 데이터인 거죠. 그러니까 문제 해결이라는 목적에 따라서 데이터에 부여된 의미가 완전히 달라져 버리게 되는 거예요. 그래서 팔란티어가 데이터 자체는 의미가 없다 라고 한 겁니다. 사용자에 의해서 데이터의 의미가 부여된다는 얘기 얘기예요. 그래서 온톨로지화하는 과정을 팔란티어에서 공식화 해놨습니다. 팔란티어가 만들어놓은 프로그래밍 언어로 개념을 먼저 정의해서 의미론적인 계층을 만들고 실제 데이터를 연결하라는 거예요.
여기까지 이해하셨으면은 그다음 영상이 인제 완벽하게 이해가 되실 거예요. 파운드리를 설명하는 대표적인 영상이거든요. 그러니까 회사 내에 존재하는 여러 가지 로우 데이터(Raw data)가 첫 번째로는 회사 내 ERP 같은 기본적인 프로그램이 일반적으로 통합이 먼저 되고 우리가 방금 짜놓은 의미론적인 계층에 연결이 됩니다. 이 연결된 상태가 컴퓨터 화면으로 송출이 되는 겁니다. 이해가 인제 완벽하게 되시죠. 이게 파운드리에요. 자 그러면 그 다음으로, 생각해야 될 게 있습니다.
데이터의 의미가 부여되면 어떤 일이 생길까? 자 여러분 이 질문이 핵심이에요. 그니까 오늘 영상을 보신 이유도 사실 이 질문을 여러분이 보시기 위해서 본 거라고 생각하시면 됩니다. 팔란티어를 우리가 공부하고 다가 가는데, 이 질문을 1번이라도 안 했다 라고 한다면, 팔란티어의 본질에 전혀 접근하지를 않은 거예요. 이 질문을 하지 않았다라고 한다면, 진짜 깊이 있게 다가가질 못한 건 거죠. 왜 그런지 제가 설명을 드려볼게요.
환자가 있는데, 고혈압이 있으면 혈압약을 먹어서 인제 혈압을 낮춰야 되잖아요. 이게 일반적인 기업들이 하는 접근 방식입니다. 그런데 죽음의 가능성을 낮춘다라는 문제를 설정하자 의미가 부여되는 거예요. 혈압약을 먹으면 혈압을 떨어뜨리는 게 아니라 죽음의 가능성을 낮춘다라는 의미로 연결이 되는 거예요. 그러니까 환자 입장에서는 이거는 완전히 자세가 당연히 달라질 수밖에 없는 거죠. 근데 이게 기업에도 똑같이 적용이 됩니다. 각 직원들이 자기가 하는 일의 데이터 의미를 보게 되잖아요. 이거 어떻게 표현이 될 수 있냐면은 그냥 내 프로젝트를 완수하는 게 아니라 자기가 하는 일의 의미를 구체적으로 알게 되는 거예요. 저는 이게 첫 번째 혁신이라고 생각을 하거든요. 이 엄청난 혁신이에요.
급식팀이 있다 라고 해볼게요. 그러면 이 급식팀의 주된 목표는 오늘 하루 직원들에게 좋은 식사를 제공하자 이걸 뿐인데, 어떤 우연한 계기로 의미를 알게 된 거예요. 고기 반찬을 했더니, 매출이 오르더라 이때부터 인제 완전히 사고의 관점이 바뀌어 버릴 수밖에 없겠죠. 이것도 인제 파운드리의 대표적인 그 화면인데, 자기가 하는 일이 그냥 내 선에서 끝나는 게 아니라 주변에 어떤 영향을 끼치고, 결과적으로 기업의 최종 목표 어떻게 연결되는지를 알게 되면은 마치 살아있는 약간 유기체 생명체 같은 개념이 되는 거예요. 우리 몸도 그렇잖아요. 생존을 향해서 내 몸의 세포 하나하나가 기능을 하는데 각각의 세포들이 자기 역할을 명확하게 알고 있는 거죠. 이것만으로도 엄청난 혁신이라고 생각을 합니다. 인제 온톨로지를 이 관점으로 본다면은 온톨로지를 얼마나 잘 구축할 수 있는가 질문을 할 수밖에 없게 돼요.
왜냐하면은 온톨로지를 통해서 살아 움직이는 어떤 유기체 형태가 된다라고 말씀을 드렸는데, 그 살아있는 생명체도 고등생물이 있고 하등생물이 있고 그렇잖아요. 그 온톨로지의 질에 따라서 그게 차이가 완전히 달라진다는 거죠. 온톨로지를 잘 구축할 수 있는 기준을 팔란티어에서 인제 이렇게 정의를 해놨어요. 얼마나 다양한 데이터들하나의 온톨로지 언어로써 통일화시킬 수 있는가? 호환이 잘 되는가라는 개념이겠죠. 왜냐하면, 다양한 데이터들이 한번에 모이니까. 그리고 얼마나 효율적으로 아키텍처를 짤 수 있는가? 실시간 스트리밍 데이터를 어떻게 잘 반응하는가? 전쟁은 완전 실시간 데이터잖아요. 그런데 실시간 데이터에 잘 반응을 함과 동시에 이 전쟁이라는 빅 프로세스의 버퍼가 생기지 않고 이게 진행이 돼야 되잖아요. 누구나 쉽게 데이터의 의미를 파악을 해서 다른 사람들과 소통할 수 있는가? 그리고 의미가 언제든지 수정이 가능한가? 왜냐하면, 목적에 따라서 의미가 달라지게 되니까. 온톨로지가 잘 구축돼야 하는 그 기본적인 과정들에는 이 전제가 하나 깔려 있어야 돼요. 그게 뭐냐면 바로 보안입니다.
누구나 쉽게 데이터의 의미를 확인할 수 있는 환경이 되려면은 보안이 기본적인 전제가 당연히 돼야 돼요. 팔란티어가 보안 쪽에 있어서는 거의 끝판왕이거든요. DOD Impact Level - 6라는 개념인데, 미 국방부에서 최고 등급의 기밀 서류를 다룰 수 있는 권한을 준 겁니다. 이 팔란티어랑 아마존이랑 마이크로소프트 3개의 기업밖에 없는 거죠. 어떤 온톨로지가 좋은 온톨로지냐? 퀄리티가 높은 엄청난 온톨로지냐의 그 조건들이 우리가 봤을 때에는 뭐 그냥 데이터 통합 잘하고 아키텍처 잘 짜고 저렇게 저렇게 하면 되지라고 쉽게 생각할 수 있겠지마는 이 온톨로지를 구축한다라는 것 자체부터 기존에 없던 거거든요. 이게 어떤 게 완벽한 온톨로지인지 아무도 모르는 거예요. 그렇기 때문에 온톨로지를 제대로 구축한다는 게 정말로 어려운 일이라는 거죠. 이런 조건들이 필요하다라는 것조차 모르는 거예요. 그러니까 팔란티어가 표준을 만들어 가고 있는 거예요.
실제로 인제 팔란티어에서 오랫동안 근무했다가 이제 데이터브릭스라는 경쟁업체로 간 개발자가 이런 인터뷰를 남겼는데 자기 생각에는 이제 데이터 브릭스란 회사가 팔렌티오의 가장 경쟁업체인 것 같긴 한데, 그 회사조차도 온톨로지에 대한 개념이 부족하다라는 얘기를 한 거예요. 좀 더 와닿을 수 있게 표현을 해보면 이걸 거 같애요. OS 말만 갖다 붙이면 다 OS잖아요. 테슬라에도 OS가 있고 다른 차들에도 다 OS가 들어가 있어요. 그런데 여러분이 써보시면 알겠지마는 현저하게 차이가 나잖아요. 같은 OS가 아니잖아요. 실질적으로 퀄리티 차이가 엄청나잖아요. 그래서 팔란티어인 알렉스 카프가 이렇게 얘기를 하는 겁니다. 완벽한 온톨로지를 구축하기 위해서 우리는 20년이라는 시간을 보냈다고 그리고 이거는 제가 생각하는 완벽한 온톨로지가 되기 위한 조건은, 너네가 구축한 온톨로지로 실제 문제를 해결해 줬느냐? 저는 이게 되게 중요한 항목이라고 보거든요. 근데 팔란티어는 이걸 완벽하게 해냈죠. 팔렌티어는 전쟁 해결해 나가고 있죠. [정말 해결해나가고 있나?]
약소국이 강대국을 이겨나가는 전쟁이라는 문제를 해결해 나간 빅데이터 기업은 팔란티어가 유일하죠. 저는 이것만으로도 이미 넘사벽의 단계로 갔다라고 생각을 합니다. 여기까지가 첫 번째 단계고 두 번째 그 엄청난 시스템을 고객 스스로가 구축할 수 있느냐? 이게 인제 두 번째 필요한 장벽입니다. 지금까지 얘기 들으시면 알겠지만은 온톨로지를 구축하는 과정에서 의미가 부여가 돼야 되는데 그 의미가 부여되려면 결국 문제 설정을 제대로 해야 되고 그럼 이런 과정들은 결국에는 그 기업의 산업도의 흐름을 완벽하게 알고있는 사람밖에 할 수가 없거든요. 그럼 결국에는 그 데이터 플랫폼이 커스터마이징이 돼야 돼요. 그래서 기존의 팔란티어가 플랫폼을 구축했던 방식들이 파견 개발자를 해당 기업으로 보냈단 말이에요. 이게 지금까지 해오던 방식입니다. 팔란티어와 거래가 된 고객처 기업들은 이런 과정들을 거치게 돼요. 이벤트성의 고객으로 무료 체험 버전을 쓰다가 근데 이 과정에서 당연히 팔렌티오 개발자가 깊게 관여하게 되죠. 그래서 무료 체험 버전 같은 경우에는 거의 뭐 한 5~6개월을 함께 같이 생활을 한다고 합니다.
그리고 첫 유료 고객이 되고 나서도 최 계속 주기적으로 와서 이제 피드백을 줘야 되는 상황인 거죠. 그런데 아까 말씀드렸다시피 팔란티어는 어떻게든 고객이 스스로 구축할 수 있도록 프랜들리하게 그런 방식들을 계속 개발한다고 말씀드렸잖아요. 올해 초에 이런 소식이 처음으로 들린 겁니다. 팔란티어 개발자가 파견 오지 않은 상태임에도 불구하고, 그 해당 회사에 소속된 개발자들만으로 시스템 구축했다라는 얘기가 처음으로 들린 거예요. 제이콥스라는 회사인데 그리고 여기에 이제 한 발 더 넘어서서, AIP Bootcamp가 열렸는데 이게 1~2명의 팔란티어 직원들이 여러 명의 거래처 직원들을 상대하고 있죠. 이게 뭐냐면은 이제 온톨로지 가지를 구축하는 과정에서 팔란티어 개발자가 관여를 하는 게 아니라 AI가 관여를 하는 거예요. AI로 구축을 하는 겁니다. 이게 얼마나 큰 효율을 가져오게 됐냐면은 이번 어닝콜에서 되게 의미심장한 얘기 했는데 기존에는 파견 개발자가 직접 파견을 가서 시스템을 구축하는 데 6개월이나 걸렸다라는 거예요.
파일럿 과정이 그런데 이것을 AI를 통해서 같이 만들게 하다 보니까 이틀만에 이걸 해결됐다라는 거죠. 이틀만에 진짜 엄청난 혁신이잖아요. 그러니까 고객의 관점으로 다시 보자면은 무료체험 버전이 인제 6개월이나 걸리던 일이 AIP가 그 파견 개발자의 역할을 대신함으로 인해서 엄청난 인력의 효율을 가져오게 된 겁니다. 근데 저는 이 장면을 보니까 이게 떠오르더라고요. 옵티머스 대신 일을 해주는 거잖아요. 뭐 이거를 약간 과장됐다 라고 보실 수도 있는데, 6개월이 걸리던 걸 이틀 만에 끝냈다라는 거는 사실은 이것보다도 더한 혁신이라고 밖에 볼 수 없을 것 같아요. 제 관점에서는 그렇습니다. 지금까지 온톨로지 시스템에 대해서 말씀을 드렸고 저는 이게 이상하게 제 관점에서는 전기차 산업이랑 너무 비슷하게 보이는 거예요. 그러니까 우리가 흔히 얘기할 때 전기차를 떠올리게 되면은 그냥 뭐 차만 잘 만들면 되지라고 생각하실 수 있긴 한데 사실 그게 아니잖아요. 차도 잘 만들어 배터리도 만들어야 되고 충전소도 만들어야 되고 OSA도 만들어야 되고 자율주행 시스템도 만들어야 되고 신경 쓸 게 한두 개가 아니란 말이에요.
그리고 대량 생산을 통해서 트윗도 내야 되고 그래서 이전에 일론 머스크가 모델 쓰리까지는 완벽하게 만들었는데, 이게 대량 생산을 하는 과정에서 너무 큰 고생을 해서 생산 지옥에 한번 걸려서 2019년에 위기까지 간 적이 있었잖아요. 우리는 자동차를 만드는 기계를 만드는 기계를 만든다. 뭐 이런 식으로 인제 트윗을 했던 적이 있었었는데, 온트로지 시스템이 완벽해지는 과정도 저는 되게 비슷하다고 생각을 해요. 앞에서 슬라이드에서 보여드린 온톨로지의 완벽해지는 그 조건들 그리고 온톨로지가 완벽해진 것만으로 부족한 거죠. 이것을 고객들에게 배포를 해야 되는데 이전에는 일일이 파견 개발자들이 다 가서 인력을 다 낭비를 했다라고 한다면, 이제는 온톨로지를 만드는 도구가 훨씬 더 수월해졌고 거기다가 AI까지 둠으로 인해서 6개월이 걸리던 게 이틀 만에 끝나게 된 상황인 거죠. 그러니까 커스터마이징 해야만 하는 이 시스템이 대량 생산으로 가능해지는 그런 가능성이 생기게 된 거죠. 그리고 더 중요한 거는 그러면서 인제 수익을 내기 시작을 한 거예요. 팔란티아가 이 관점으로 보니까 알렉스 카프가 얘기했던 이 얘기가 확 와닿는 거죠.
그런 완벽한 온톨로지 시스템이라는 걸 생각을 안 했었다라고 한다면은 그냥 빅데이터 기업이다. 그러면 어떻게든 우리랑 거래처 기업을 많이 따내서 빨리 시장을 선점해 가야 되잖아요. 근데 그런 개념이 아닌 건 거예요. 왜냐하면은 팔란티어와 같은 온트로지 시스템을 구축하는 것 자체가 너무나 어려운 일이고 보호라는 것도 되게 어려운 일이고 고객 스스로가 구축할 수 있어야 되고 그러면서 수익까지 내야 되니까. 그래서 경쟁업체가 결코 따라올 수 없는 표준을 만들었다. 제로 투 원이 완벽하게 돼 가고 있다라고 선언을 한 거죠.
이젠 이 말이 아마 조금은 이해가 되셨을 것 같아요. 정말 난해했던 그런 철학적인 개념이었었는데, 이것보다 적합한 단어가 없는 겁니다. 제가 아까 처음에 데이터의 의미가 부여되면 어떤 일이 벌어질까? 이거에 대해서 우리가 질문을 꼭 해봐야 된다라고 말씀드렸잖아요. 이거는 오늘의 방송이 끝나고 나서도 여러분께서 계속 질문해야 되는 영역이라고 저는 생각을 해요. 지금부터는 저의 뇌피셜입니다. 제 개인적인 해석이라는 걸 감안하고 들어주세요. 올해 초에 GPT가 나왔잖아요. 이 언어 인공지능이 데이터의 의미를 읽을 수 있게 된 거예요.
저는 여기서부터 약간 저 자신은 인제 소름이라고 느꼈는데 그리고 팔란티어의 시티오(CTO)가 이런 얘기를 합니다. "언어 인공지능이 자기들의 언톨로지를 20년간 기다려왔던 것 같다"라는 거예요. 왜 이런 얘기를 했을까? 개인적으로 추측을 해봤어요. 이거는 제 개인의 생각입니다. 언어 인공지능이 작동되는 시스템이 뭐냐 하면은 그냥 인간의 언어 텍스트를 그냥 그 인공 신경망에 삽입한 게 아니라 이 언어 데이터를 한번 추상화하는 과정을 거쳐요. 이렇게 로우 데이터(Raw data)를 백터 데이터(Vector data)로 한번 변환을 시킵니다. 그러니까 벡터로서 정의를 내리는 거예요. 개념을 규정을 하는 거죠. AI에서는 임베딩이라는 표현을 쓰는데 기존에 있는 원래 데이터를 좀 더 추상화된 개념으로 다시 한번 정의한다. 그래서 언어 인공지능 이 데이터들을 읽을 때 이 텍스트를 읽는 게 아니라 이 추상화된 개념의 데이터를 읽게 되는 거죠. 근데 저는 이 과정이 너무 온톨로지 같이 보이는 거예요.
그러니까 언어 인공지능은 로우 데이터를 읽는 게 아니라 추상화된 데이터를 읽는 거고, 이걸 약간 팔란티어의 관점으로 생각하니까 로우 데이터를 읽는 것보다 온톨로지화 된 데이터를 좀 더 잘 읽게 설계됐다. 기존에 있는 로우 데이터가 수학적으로 변형되는 관점이라고 보시면 될 것 같아요. 백터라는 게 결국엔 수학이거든요. 기존의 복잡한 데이터가 수학적인 언어로 바뀌게 되고, 그 수학적인 언어를 훨씬 더 언어 인공지능이 잘 읽을 수 있다는 거죠. 데이터를 읽는 것보다 데이터의 의미를 읽는 거가 더 뛰어나도록 설계가 됐다. 이걸 기업의 관점 본다면은 의미가 없는 데이터들 그러니까 산발적으로 존재하는 그런 데이터들이 있고 어떤 기업은 이 데이터들이 온톨로지화가 돼있는 거예요. 의미들이 다 부여가 돼 있습니다. 이 상태에서 언어 인공지능이 붙게 되면 당연히 의미가 부여된 기업에 더 생산성이 있는 대답이 당연히 도출될 수밖에 없겠죠. 이게 실제 후기 사례에서도 그렇게 나오더라고요. 패브릭(Fabric)은 마이크로소프트 AI 데이터 플랫폼인데 패브릭도 써보고 파운드리(Foundry)도 같이 써본 사람이 느끼기에는 패브릭이 파운드리를 따라가려면 몇 년 더 걸릴 것 같다라고 인제 이렇게 표현을 한 겁니다.
데이터의 의미가 부여되면 어떤 일이 벌어질까? 목표가 설정이 됐고 그 기업의 데이터들의 의미가 다 부여가 된 상태인데 언어 인공지능도 그 데이터의 의미를 읽고 사람도 읽겠죠. 근데 여기서 문제가 한가지 있는 게 사람은 개인의 목표도 있어요. 그러니까 기업에서 부여된 그 데이터의 의미랑 개인 입장에서의 그 의미가 상충될 가능성이 존재하는 거죠. 나한테는 그냥 이 프로젝트만 마치는 게 나한테는 주된 의미야. 나는 기업의 절대적인 목표하고는 큰 상관이 없어. 난 당장 이번 달 월급을 받는 게 목표예요. 이렇게 돼버리게 되면 처음 설계됐을 당시에 부여됐던 그 의미가 퇴색돼 버리잖아요. 그러면은 이 기업이 나중에 인제 최적화가 되는 관점으로 본다라고 하면, 사람이 존재하는 것 자체부터 굉장히 비효율적이라고 느껴질 수밖에 없게 되는 거예요. 그러면 결과적으로는 사람의 영역을 줄여가는 방향으로 갈 수 밖에 없겠죠.
지난 AIP 첫 오리엔테이션 때 이런 슬라이드가 발표됐었는데 이런 장면이 보이는 거예요. 오토너머스 오퍼레이션(Autonomous Operations)이라고 해서 자율경영이에요. 그러니까 사람이 없는 상태에서 경영이 되는 상태를 뜻하겠죠. 그리고 여기서 좀 더 구체적으로 표현을 해놨는데 모델에 의한 개별적인 사람들로부터 어떤 데이터를 얻어서 트레이닝하는 개념에서 에이전트 비헤이비어 모델, 행위자 기반 모델이라는 이런 개념이 있어요. 여러 개체가 상호작용을 함으로 인해서 하나의 전체 그룹을 이루는 시스템을 얘기를 하는 겁니다. 기업으로 치면 이 기업 전체 집단이 하나의 모델이 되는 거예요. 이 단위의 모델로 트레이닝을 한다라는 그런 개념인 거죠. 그래서 이 행위자 기반 모델의 대표적인 예가 자율주행이라고 소개가 돼 있어요. 우리가 테슬라를 떠올리게 되면은 단순히 영상을 트레이닝을 해서 자율주행을 해 나간다 라고 생각하실 수가 있는데, 실질적으로는 차가 자율주행을 하려면 자동차 안에 있는 모든 부품들이 유기적으로 서로 상호작용을 하면서 이게 동시 다발적으로 움직이는 과정인 거잖아요.
뭐 바퀴도 움직이고 핸들도 움직이고 백미러도 움직이고 카메라도 작동하고, 그니까 어떻게 보면 자동차를 하나의 기업이라고 볼 수 있는 거죠. 그래서 궁극적으로는 이 팔란티어가 가고자 하는 길이 기업의 자율주행이라고 할 수 있는 건 거죠. 저는 개인적으로 그렇게 생각을 하고 있었었는데 AIP 오리엔테이션에서 슬라이드로 이런 것을 보여줄 거라고 저도 정말 이걸 보고 깜짝 놀랐습니다. 그래서 제가 인제 지금까지 말씀드린 내용을 토대로 본다면, 팔란티어는 빅데이터 마켓 시장에서 가치를 보이는 기업이 아닌 건 거죠. 본질을 좀 다르게 보기 시작하니까 시장도 완전하게 달라지는 거죠. 그래서 데이터의 의미가 부여되면 어떤 일이 벌어질까? 이 질문을 계속해야 되는 거예요. 왜냐면, 저의 개인 개인적인 뇌피셜 의견도 많이 들어가 있기 때문에 여러분들께서도 이거에 대해서 계속 고민을 하시고 질문을 던지시고 커뮤니티상에 많이 남겨주셔서 우리가 서로 이런 아이디어들을 공유해야만 더 뛰어난 미래를 그려 나갈 수 있을 것 같아요.
데이터가 온톨로지화되면 어떤 일이 벌어질까? 다 같은 말이죠. 기업이 디지털 트윈이 되면 어떤 일이 벌어질까? 그리고 한발 더 나아가서 AI가 디지털 트윈을 읽을 수 있다면 어떤 일이 벌어질까? AI가 디지털 트윈만 읽을 수 있다면 어떤 일이 벌어질까? 왜 언어 인공지능이 자신들의 온톨로지를 20년간 기다려왔다고 얘기를 할까? 임승우 회장님께서 로켓맨 님 채널에 들어가서 이제 이런 언급을 하셔서 팔란티아 투자 투자자들 사이에서 약간 명언처럼 퍼져나가고 있는데, 제가 말씀드린 내용을 토대로 보면은 이거는 뭐 어머니가 되는 수준이 아닌 거예요. 이거는요 살아있는 생명체 같다고 그런데 AI가 붙음으로 인해서 굉장히 지능이 높아진 생명체가 돼 가는 저는 그런 느낌을 받았습니다. 이 사업의 세계라는 게 강한 놈만 살아남잖아요. 완전 약육강식의 세계잖아요. 결국 똑똑해져야만 강해지는 거기 때문에 이 팔란티어의 시스템을 갖춘다라는 게 저 개인적으로는 이게 필수 생존 전략이지 않을까라고 저는 그렇게 생각을 합니다.
근데 이제 인지하게 되는 순간 판도가 완전히 뒤바뀔 거라고 저는 생각을 해요. 뒤바뀌게 되면 이런 환경이 펼쳐질 이 사진은 혹시 뭔지 아세요. 평일 밤 10시에 찍은 대치동 학원가의 사진인데 저는 이 사진이 문득 떠오르더라고요. 왜냐하면은 대치동 학원가의 붐이 그 경쟁이 엄청나게 치열해지고, 있고 갈수록 더 심해지고, 있어요. 이상하게 학생 수는 줄어든다고 하는데 이제는 거의 전국구가 됐거든요. 그 이유가 내 아이를 대치동 학원가에서 트레이닝 시키는 게 필수 생존전략이라고 인지했기 때문이에요. 그러니까 이런 일이 펼쳐지는 겁니다.
*디지털 트윈(Digital twin): 컴퓨터에 현실 속 사물의 쌍둥이를 만들고, 현실에서 발생할 수 있는 상황을 컴퓨터로 시뮬레이션함으로써 결과를 미리 예측하는 기술이다.
*온톨로지(Ontology): 원래 '존재론'이라하여 사물의 존재 의미를 논의하는 철학적인 연구 영역을 뜻하는 말이다. 그런데 정보학에서 사람들이 세상에 대하여 보고 듣고 느끼고 생각하는 것에 대하여 서로 간의 토론을 통하여 합의를 이룬 바를, 개념적이고 컴퓨터에서 다룰 수 있는 형태로 표현한 모델로, 개념의 타입이나 사용상의 제약조건들을 명시적으로 정의한 기술적 용어로 사용된다.