하둡과 NoSQL의 시장은 어떻게 될까!

하둡(Hadoop)과 NoSQL이 상당한 각광을 받고 있는 시대입니다. 하둡이나 NoSQL이 현재 주종을 이루는 시스템을 대체할 수는 없지만 새롭게 등장하는 비즈니스 …

하둡(Hadoop)과 NoSQL이 상당한 각광을 받고 있는 시대입니다. 하둡이나 NoSQL이 현재 주종을 이루는 시스템을 대체할 수는 없지만 새롭게 등장하는 비즈니스 분야에서는 그 역할을 충분히 하고 있습니다. 유닉스로 대표되는 오픈 시스템은 메인프레임을 대체하면서 다운사이징을 주도했고 이제 그러한 오픈 시스템의 부족한 부분은 하둡이나 NoSQL에 의해 대체 또는/그리고 보완되고 있는 상황일 것입니다. 물론 완전히 새로운 분야도 있지요.

그렇다면 이러한 하둡과 NoSQL의 시장은 어떨까요? 작년(2014년) 말에 위키본 프리미엄(Wikibon Premium)이 내놓은 보고서(Hadoop-NoSQL Software and Services Market Forecast, 2014-2017)가 상당히 흥미롭습니다. 위키본에 따르면 현재의 IT는 비용(Cost)과 성능(Performance), 그리고 비즈니스 민첩성(Agility) 등에 문제가 있다고 진단하면서 이러한 것들에 대한 대안으로서 하둡과 NoSQL이 등장하였다는 것입니다. 현재 빅 데이터를 실행에 옮기고 있는 기업들 상당수는 하둡에서 실행하고 있고 이러한 하둡은 클라우드에 기반하여 운영이 되고 있다는 조사 결과를 내놓고 있습니다.

위키본에 따르면 2014년 6억 2천 1백만 달러의 시장이 하둡에서 만들어졌다고 합니다. 이 수치는 소프트웨어 비용(대부분이 구독료 기반; subscription)과 전문 서비스(professional service) 등을 포함한 것이라고 하는군요. 그리고 이 시장은 2017년이면 17억 달러가 되면서 거의 3배 성장하게 될 것이라는 전망을 내놓고 있습니다. 한편 NoSQL과 관련해서는 소프트웨어 비용과 전문 서비스 등을 포함하여 2014년에 4억 1천 1백만 달러에 이르는 시장을 형성할 것이고 2017년에는 15억 달러 이상에 이르는 시장을 만들게 될 것이라고 주장합니다. 재미있는 것은 하둡과 NoSQL이 2014년의 경우 2억 달러 이상의 차이가 있지만 2017년이면 큰 차이가 없게 될 것이라는 것인데요, 그만큼 NoSQL의 시장 성장세가 가파르다는 것인데, 왜 그런지에 대한 분석이 아쉽습니다.

현재 하둡 시장은 7개의 벤더들이 전체 시장의 64%를 점유하고 있다고 하는데, 클라우데라(Cloudera), IBM, 액센추어, 아마존, MapR, 피보탈(Pivotal), 호튼웍스(Hortonworks) 등이 그 회사들입니다(순서 없음). 그 중 클라우데라와 호튼웍스, 피보탈, MapR 등이 하둡과 관련 순수한 플레이어들이라고 할 수 있고 그 외의 기업들은 이들 기업과는 성격이 다소 다르다고 할 수 있습니다. 구체적인 수치를 여기 블로그를 통해 공개할 수 없어 아쉽지만 여러 인터넷 매체들을 둘러 보면 전반적인 경향은 확인해 볼 수 있을 것 같습니다.

하둡 시장의 흐름에서 중요하게 살펴야 할 것 중 하나는 투자가 어디서 누구에 의해 일어나는가 하는 점일 것입니다. 전략적 가치와 판단에 따라 투자가 이뤄지는 것을 생각해 본다면 누가 누구에게 얼마나 주느냐가 의미가 있습니다. 이런 맥락에서 살펴본다면 클라우데라는 2014년 인텔이 무려 7억 4천만 달러 달러나 투자를 하였습니다. 당시 인텔은 이러한 투자를 발표하면서 인텔이 가지고 있는 각종 IP를 포기하면서 이를 클라우데라에게 넘겼습니다. 또 다른 투자도 있었습니다. 구글 캐피탈(Google Capital)은 MapR에 1억 1천만 달러를 투자하였고 HP는 호튼웍스에 5천만 달러를 투자하였습니다. 게다가 피보탈은 EMC에서 스핀오프(Spinoff)하였고 EMC와 VM웨어에서 투자를 한 기업입니다. 잘 생각해 보면 순수하게 하둡을 하는 기업이라고 할 수 있는 클라우데라나 호튼웍스, 피보탈 그리고 MapR 등에 돈이 몰리고 있고 이는 달리 말해서 이들 기업들이 향후 하둡 시장에서 그 역할이 커질 것이라는 또 다른 추측, 추정 등을 가능하게 합니다.

위키본의 리포트에서 가장 시선이 많이 잡는 것이 하둡 시장 성장세 부문이었는데요, 2014년 6억 2천 1백만 달러에서 2015년이면 9억 달러가 넘는 시장을 형성하게 될 것이고 2017년이면 16억 달러에 이르는 시장을 형성하면서 40%가 넘는 폭풍 성장세를 전망하고 있습니다. 이러한 시장 전망과 그에 따른 주요 기업들의 막대한 투자 등은 우리가 하둡에 대해 더 많이 알아야 하는 이유가 되기도 하는군요.

하지만 더 놀라운 것은 NoSQL의 시장 성장세입니다. 리포트를 통해 위키본은 2011년 4억 1,100만 달러 시장이었던 것이 2017년 15억 달러가 넘는 시장을 형성하게 될 것이라는 것인데요, CAGR로 따져보면 50%에 달하는 기록적인 수치입니다. 그럼 누가 NoSQL에서 가장 잘 나가는 주자일까요? NoSQL을 어떻게 정의하고 어떤 기업들을 NoSQL 범주에 넣을 것이냐에 따라 달라질 것 같은데요, 우선 매출 기준으로 시장 점유율을 보면 마크로직(MarkLogic), 아마존(DynamoDB), MongoDB, 데이터스택스(DataStax) 등의 순입니다. 마크로직은 2013년 8,500만 달러의 매출을 올렸고 2014년 예측치는 1억 2백만 달러라고 하는군요. 아마존의 다이나모DB는 2013년 6,800만 달러, 2014년 예측치는 8,700만 달러입니다. 사실 2개 업체가 2014년 (예측치 기준) 1억 8,900만 달러로 전체의 45%가량을 차지합니다. 그런데, NoSQL을 이렇게 분류해 버려도 되는 건지 약간은 의구심이 듭니다.

예를 들어 마크로직의 경우 가트너(Gartner)에서는 Operational DBMS라는 이름으로 데이터베이스를 분류하고 있습니다. 거의 모든 DB를 다 포함시키기 때문에 이것만 봐서는 분류(segmentation)하기가 어렵습니다. 한편 포레스터(Forrester)는 Document-Oriented NoSQL로 구분합니다. NoSQL이 아니라고 말하는 것이 아니라 NoSQL이 너무 커지니까 조금은 분류를 해 보는 것이 어떻겠는가 하는 생각이 듭니다. 위키본은 NoSQL 데이터베이스에 Key-Value Store, Document database, Column store, graph database 등을 포함시키고 있습니다. 위키본이 포함시킨 NoSQL을 조금만 분류했더라면 어땠을까 하는 생각이 듭니다. 아래 가트너나 포레스터 리서치의 평가를 잠시 보겠습니다.

(출처, 가트너 2014.10. Magic Quadrant for Operational Database Management Systems)

(출처, 포레스터리서치 2014. Forrester Wave for document-oriented NoSQL databases)

(출처, 포레스터리서치 2014. Forrester Wave for key-value store NoSQL databases)

MongoDB의 2014년 예상 매출은 4,600만 달러이고 카우치베이스(Couchbase)의 2014년 예상 매출은 1,800만 달러입니다. 상위 2개 업체가 워낙 이 분야의 시장을 점하고 있는 것처럼 보이지만 조금은 생각해 봐야 할 부분인 것 같습니다. 이 부분은 좀 더 시간이 필요하지 않나 하는 생각이 드는군요.

NoSQL 분야는 기업 내외부의 다양한 유형의 데이터를 처리하는데 있어 유용한 툴이면서 동시에 일반적인 하드웨어(commodity hardware) 상에서 동작하고 대개는 오픈소스를 기반으로 하고 있어 그 적용 속도가 매우 빠르다는 것이 특징일 것입니다. 게다가 2015년 상당히 많은 기관과 전문가들이 IoT의 해가 될 것이라고 하는데, 그 중심에서 NoSQL이 상당 역할을 하게 될 것입니다. 머신(machine)에서 나오는 데이터를 처리할 수 있는 것은 물론 RDBMS에서도 할 수 있겠지만 보다 경제적이고 빠른 처리를 위해서는 NoSQL이 대안이 될 수 있을 겁니다. 위키본은 NoSQL이 결국에는 극적인 성장을 할 것이고 하둡 시장을 넘게 될 것이라고 전망합니다.

하둡과 NoSQL은 기존 데이터웨어하우스나 RDBMS 등에 염증이나 불만을 가지고 있는 사람들에게 가장 비용 효과적이고 확장성과 유연함, 그리고 비즈니스에서의 민첩성을 높일 수 있는 방법으로서 선택을 받게 될 것이라는 전망입니다. IT 업계에 몸 담고 있는 사람들이라면 상당히 많은 사람들이 이러한 생각을 하고 있을 텐데요, 위키본의 리포트는 그것을 비교적 자세하게 풀어내었습니다. 다만 아쉬운 것이 있다면 왜 그렇게 폭발적으로 성장을 할 것인가에 대한 스토리가 부족하다는 것입니다. 13페이지에 달하는 리포트에서 시장 전망과 예측치에 대한 근거, 그러한 동력(driver)에 대한 내용이 아쉬웠지만, 그럼에도 불구하고 하둡이나 NoSQL에 관한 예측이 별로 없는 가운데 나온 터라 무척이나 반가운 리포트였습니다.

– fin –

 

저작자 표시 비영리 동일 조건 변경 허락
이 저작물은 크리에이티브 커먼즈 저작자표시-비영리-동일조건변경허락 2.0 대한민국 라이선스에 따라 이용할 수 있습니다.