DT(Digital Transformation)의 핵심은 무엇일까요? 최신 기술의 적용일까요? 새로운 기술을 적용할 수 있는 비즈니스 아이템의 발굴일까요? 김윤권 AWS Business Development Manager는 숨어 있는 데이터의 가치를 발견하는 것이 그 시작이라고 말합니다.

 

Rich Data

선형 회귀 모형 (Linear Regression Model)에서 각각의 값은 오차항을 갖습니다. 오차항 내에 있는 무언가를 찾아내는 것은 매우 중요합니다. 이런 측면에서 Rich Data를 확보하는 것이 관건이며, 그 안에서 성공 가능성을 찾아낼 수 있습니다. 혁신은 새로운 아이디어가 있어야만 시작되는 것은 아닙니다. 오히려 숨은 데이터에서 숨은 가치를 찾아낼 때 혁신이 시작될 수 있습니다. 데이터를 분석할 때 여러 측면에서 살펴 보아야 합니다. 커머스 비즈니스라면 고객의 Demographic 정보 외에 구매 데이터는 물론 광고, 할인 등 다양한 관점의 데이터를 분석해 봐야 제대로 고객을 알 수 있습니다.

 

Data Analytics Pipeline

Equinox는 미국의 유명 피트니스 센터 체인입니다. 초저가와 럭셔리로 양분된 시장 가운데 어느 방향으로 가야할지가 Equinox가 당면한 선택이었습니다. Equinox가 시작한 것은 데이터 수집과 분석이었습니다. 고객과 코치를 위한 Application을 개발해 운동량과 강도를 공유합니다. 고객 간의 경쟁을 유도함으로써 동기부여를 합니다. 이 때 Apple Health에서 데이터를 수집합니다. 운동 기기마다 Beacon을 설치해 고객의 운동 습관을 체크하고, 고객에게 필요한 운동 방법을 추천합니다. 이렇게 구성된 데이터는 Equinox의 전략적 선택에 큰 역할을 하고 있습니다. 한 편으로는 AWS Red Shift를 활용해 DW를 구축해 의사결정에 활용하고, 다른 한 편으로는 ML분석을 통해 고객 서비스에 활용합니다.

미국 핀테크 기업인 Robinhood는 데이터 통합, Hadoop Cluster, Governance 측면에서 어려움을 겪고 있습니다. 먼저 즉시 Batch 수행이 필요한 영역(HOT)과 중장기 보관이 필요한 영역(Cold)을 구분했습니다. 전자는 HDFS, 후자는 AWS Storage S3 (장기 보관 대상은 S3 Glacier활용) 구분해 관리함으로써 Computing Storage의 분리를 가능하게 했습니다. 이를 통해 비즈니스 성장할 때 Computing Storage의 규모를 분리해 산정할 수 있게 되었습니다. 선택적 관리는 유연한 관리를 가능하게 했습니다.

 

ML

호주의 온라인 중고차 판매 기업인 Carsales.com은 고객이 올린 자동차 이미지를 분석하는데 ML을 이용했습니다. AWSML 서비스인 SageMaker를 활용했습니다. End to End로 서비스를 제공할 뿐 아니라, 최소한의 Setup으로 사용 가능하다는 장점이 있습니다.

미국 패션 기업인 Tapestry Equinox와 마찬가지로 DW ML 영역을 구분했습니다. Traning-Validation-Testing의 프로세스를 자동으로 수행하도록, AWS Lamda가 새로운 데이터가 유입되면 SageMaker Trigger해 새로운 ML을 수행하도록 했습니다.

 

데이터 + ML

혁신의 실마리는 역시 데이터 입니다. 데이터가 서 말이라도 꿰어야 합니다. 이를 위해서 Data Pipeline ML을 효과적으로 활용하는 것이 혁신의 구슬을 잇는 역할을 할 것입니다.