멀티미디어 - Computer Vision 4 컴퓨터 비전 (recognition, skin detection classifier, bayes rule estimation, visual recognition, generative discriminative model, bag of word)

반응형

Recognition

Skin detection

피부 픽셀은 RGB혹은 HSV로 표현하는 색상 영역에 해당한다 

픽셀 x가 해당 영역에 속하면 피부로 분류한다 

 

example로 피부영역을 학습하고 training image에서 수동으로 피부/비피부 픽셀을 라벨링한다 

RGB 공간에 훈련 데이터를 띄운다 

피부 픽셀은 주황색 비피부는 회색으로 표시한다 

일부 피부 픽셀이 영역 밖에 있을수도, 비피부 픽셀이 영역 안에 있을 수도 있다 

Skin classifier

새로운 값 x가 주어지면 피부인지 결정하는 방법

 

x와 가장 가까운 라벨링된 픽셀을 찾는 nearest neighbor 기법이 있다 

SVM을 이용해서 두 클래스를 구분하는 평면/곡선을 찾는다 

각 클래스에 확률 밀도/분포 모델을 맞추는 데이터 모델링을 한다 

Probabilistic skin classification

확률 분포를 histograming해서 확률밀도함수 PDF와 불확실성 함수를 모델링한다 

 

skin classifier

새로운 pixel x가 주어지면 skin인지를 확률로 해석한다 

Bayes rule

skin 확률분포를 구하기 위해서 bayes rule을 사용한다 

 

확률 P(skin)는 domain knowledge로 train set에서 피부 픽셀의 비율이다 

 

posterior 확률을 최대화하여서 라벨을 선택하여 잘못 분류할 확률을 최소화하기 위해 

Maximum A Posteriori(MAP) 추정을 사용한다 

Visual Recognition

★ Generative vs. Discriminative Models

generative method

클래스 조건부 확률 밀도함수(PDF)와 prior 확률을 모델링한다 

generative한 이유는 샘플링을 통해 합성 데이터를 생성할 수 있기 때문이다 

 

gaussian, bayes, mixture of gaussian, HMM 모델 등이 해당한다 

 

discriminative method

posterior 확률을 직접 추정한다 

기본 확률 분포를 모델링할 필요가 없다 

주어진 작업에 계산 자원을 집중해서 성능을 향상시킨다 

 

SVM, Nearest neighbor, CRF 모델 등이 해당한다 

 

 

만약 음성의 언어를 판단하는 상황이라고 가정하면

genrative method는 각 언어를 학습하고 말이 어떤 언어에 속하는지 결정한다 

discriminative method는 언어를 학습하지 않고 언어적인 차이를 결정하여 더 쉽다 

Bag‐of‐words models

Weakness of BoW

- 객체를 구성하는 요소의 기하학적 정보가 부족하다 

- view point invariance와 scale invariance에 대해서 광범위한 테스트가 없다 

- segmentation과 localization이 불분명하다 

 

이러한 단점 때문에 

기하학적 제약 하에 N개 부분 집합으로 객체 클래스를 표현하는 constellation model(별자리 모델)이 나왔다 

반응형
  • 네이버 블로그 공유
  • 네이버 밴드 공유
  • 페이스북 공유
  • 카카오스토리 공유