비주얼 인식(Visual Recognition) 서비스는 최근 미래 유망한 인공지능 기술입니다. 최근 N사 웹툰의 만우절 광고로 “Freedom to Thumb” 이라는 영상을 제작 했습니다. 영상 내용은 엄지 손가락에 자유를 주자라는 내용으로 사람들이 웹툰을 볼 때 엄지손가락으로 페이지를 컨트롤 하는데, 이를 손가락이 아닌 홍채 혹은 특정 표정을 지으면 웹툰 페이지가 컨트롤 되는 영상입니다. 예를 들어 홍채를 위로 올리면 페이지 맨 위로 올라가고, 입맞춤을 하면 좋아요가 클릭되는 기능입니다. 해당 동작들은 기본적으로 비주얼 인식 서비스가 적용된 것입니다. 만우절 광고로 아직 출시 되지는 않았지만 언젠가는 서비스 런칭이 될 수도 있을 것 같습니다
이처럼 비주얼 인식 서비스는 다양한 산업 및 사용자에게 많은 편의성과 가치를 제공 하는데요, 지금부터 하나씩 알아 보도록 하겠습니다.


모든 이미지와 비디오를 분석한다. 아마존 레코그니션(Amazon Rekognition)

공항이나 백화점 같은 사람이 많은 혼잡한 곳에서 얼굴인식 시스템을 통해 범인을 찾아내는 장면을 영화에서 많이 봐왔을 것입니다. 아마존 레코그니션은 단순히 얼굴 일치율 분석을 넘어 고도화 된 기술을 선보이고 있습니다. 이미지 또는 비디오를 Rekognition API에 제공하기만 하면, 서비스에서 이미지 및 비디오 속 인물, 물체 등을 탐지하고 부적절한 콘텐츠, 유명인사 인식 등을 탐지할 수 있습니다. 주요기능으로는 물체인식, 얼굴인식, 얼굴분석, 사람 추적, 부적절한 콘텐츠 탐지, 유명인사 인식, 이미지 내 텍스트 추출 등이 있습니다.
물체 인식 기능은 심층 신경망 모델을 활용해 이미지 속 수많은 물체와 장면을 탐지하고 분류합니다. 그리고 사진들을 자동으로 구분, 분류, 태깅해 관심분야의 서비스로 연결해줍니다. 예를 들어 산, 바다, 도시 등의 사진을 올리는 사람을 여행 관련 정보 서비스로 연결시켜주거나, 결혼과 관련된 이미지를 올리는 사람을 출산, 집들이 등에 연관된 광고로 연결시켜줄 수 있습니다. 얼굴분석 기능은 이미지 내 얼굴 위치를 식별해 속성을 분석합니다. 이미지 내에 사람이 남자인지 여자인지, 웃고 있는지 울고 있는지 등에 대해서 식별하고 분석합니다. 뿐만 아니라 인식 후에 각각의 특징에 대해서 퍼센트로 신뢰도까지 계산하고 상업용으로도 활용 가능합니다. 예를 들어 대형 마트 매장에서 쇼핑 중인 사용자의 얼굴분석을 통해 사용자의 만족도를 예측해 볼 수 있습니다.
또한 아마존 레코그니션은 비디오 분석도 가능하므로, 공공 안전과 보안을 위한 즉각적 대응이 가능합니다. 예를 들어 실종자 데이터베이스와 대조하여 얼굴을 인식함으로써 법 집행 기관에서는 일치하는 얼굴을 정확하게 표시하여 수사 속도를 높일 수 있습니다.


왓슨 비주얼 인식 서비스의 새로운 시도

왓슨 비주얼 인식(Watson Visual Recognition) 서비스는 이미지의 내용을 이해하는 서비스 입니다. 장면, 사물, 얼굴, 색상, 음식, 기타 이미지를 분석 하여 시각적 콘텐츠에 대한 인사이트를 제공 합니다. 예를 들어 나이와 성별을 추측하고, 또는 여러 이미지에서 비슷한 이미지를 찾을 수도 있습니다. 또한 나에게 필요한 분석을 위해 커스텀한 Concept을 생성하여 서비스를 트레이닝 할 수 있습니다. Retail 분야에서 재고를 관리 할 때 유용하게 쓰이고 인벤토리에서 과일 종류 및 손상된 과일을 식별하는데 비주얼 인식(Visual Recognition)을 활용할 수 있습니다.
그럼 아래 옷 매장 이미지를 왓슨 비주얼 인식 서비스에 적용하여 어떤 결과값을 보여주는지 확인 해보겠습니다

출처 l IBM


결과값을 보시면 각 항목별 일치 하는 점수가 나와 있으며, 높은 확률로 각각의 특성을 구분해 놓은 것을 확인 할 수 있습니다.
이러한 기본적인 분석 서비스를 바탕으로 왓슨 비주얼 인식 서비스는 새로운 산업 영역에 발을 들였습니다. 그 중 하나가 모조폼 혹은 분실 신고된 다이아몬드를 알아 낼 수 있는 것입니다. 사전에 각각의 다이아몬드 진품 인증서, 일련번호, , 투명도, , 캐럿, 크리 모양과 같은 제품 세부사항에 대한 정보를 학습 시킨 후 사진과 등록된 데이터 분석을 진행함으로써 그 다이아몬드가 분실 신고 혹은 모조품인지 확인이 가능합니다.
뿐만 아니라 인공지능 우주비행사 CIMON (Crew Interactive Mobile Companion)은 왓슨 비주얼 인식 서비스 API를 활용해 여러 개의 실험실로 이뤄진 콜럼버스 모듈의 건설 계획과 실험실에서 이뤄질 각종 모든 절차를 학습했습니다. 이러한 학습 덕에 CIMON은 독일인 우주 비행사 알렉산더 거스트를 보조 할 뿐만 아니라 기술적인 문제가 발생하기 전에 조기 경보, 문제에 대한 해결책을 제시 할 수 있습니다



많은 사업분야에서 활용 되는 AIBRIL 이미지 인식 서비스 

AIBRIL 이미지 인식 서비스는 딥러닝 기반 알고리즘을 이용해 디지털 이미지를 분석하고 내재된 의미를 파악합니다이미지에 유의미한 태그를 지정하고 자동차얼굴음식 등 오브젝트를 식별할 수 있으며 유사 이미지를 분류해낼 수 있습니다최근에는 SK C&C-한국암웨이의 AI로봇서비스인 드리미에 이미지 인식 서비스를 적용했습니다. 더 나아가 해당 서비스는 다양한 응용 프로그램 및 산업분야에서 사용될 수 있습니다.


  • 제조 : 제조공정에 실제 사용하는 이미지를 통해 제품이 조립 라인에 올바르게 배치되었는지 확인

  • 육안 검사 : 현장에서 트럭비행기풍차의 시각적 적합성 또는 열화 상태를 파악하고 훈련시켜 결함을 파악

  • 보험 : 이미지를 사용해 클레임을 여러 범주로 분류하고신속하게 처리

  • 소셜 리스닝 : 제품 라인과 로고 이미지를 사용해 소셜 미디어에서 회사에 대한 버즈를 추적

  • 소셜 커머스 : 음식 이미지 기반의 레스토랑 검색, 여행 사진 기반의 유사 여행지 추천 정보 검색

  • 교육 : 분류 체계에 대해 교육하고 비슷한 교육자료를 찾을 수 있으며비슷한 주제들에 대한 교육자료를 찾을 수 있음

  • 유통 : 이미지 기반의 선호 제품과 관련 정보 검색


또한 AIBRIL이미지 인식 서비스는 사물의 인식률을 높이는 훈련도 가능합니다. 훈련 방법 중 하나인 포지티브, 네거티브 이미지 세트를 지정합니다. 포지티브 이미지 세트는 식별해내고자 하는 결과물을 보여줄 것이며, 네거티브 이미지 세트는 반대로 식별하지 못하도록 훈련 하는 것 입니다. 그 외에도 다양한 훈련 방법이 있으며, 이렇게 함으로써 신뢰도 점수(인식률)를 높이고 사용자에게 가치를 제공합니다





티스토리 툴바