[ 교수님 : 경북대학교 정희철 교수님 ]
컴퓨터 비전 ?
- Computer Vision is an interdisciplinary scientific field that deals with how computers can gain high-level understanding from digital images or videos.
- 컴퓨터 비전 : 컴퓨터가 보는 시각
- The goal of computer vision : To extract "meaning" from pixels.
- 픽셀로부터 의미를 추출 및 반응 → 컴퓨터 비전의 연구
- 디지털화된 세상, 숫자로 된 이미지로부터 어떠한 정보를 얻으려 하기 때문에 컴퓨터 비전이 어려운 것이다.
주된 이슈 IN Computer Vision
- Image Classification / Localization ( 이미지 분류 : X → f(X), X는 이미지 f(X)는 분류화된(맵핑된) 그룹 )
- Object Detection
- → 이미지에 사물이 있을 때 바운딩을 하는데, 바운딩을 하는 점은 몇 개가 있어야 할까? 2개(시작점, 끝점) 만 있으면 된다.
- Segmentation
※ 가장 유용한 것은 Segmentation, 가장 사용하기에 편리한 것은 Image Classification
활용되고 있는 분야
- Medical Applications
- 예를 들어, X-ray 사진을 가지고 암인지 아닌지 판별 및 분류
- Manufacturing Technology
- Galaxy Categorization/Remote Sensing
- Scene Categorization
- Face Recognition (아이폰의 Face ID)
- Colorization of Black and White Images (이미지 및 영상 복원)
- Pixel Restoration (Super Resolution
딥러닝 기반 이미지 분류
- 손실함수, y = w0 * x + w1 식 → 오차 및 손실을 최소화하는 w0 와 w1을 찾는다.
- → 오차를 최소화시키면서 맵핑하는 것이 딥러닝 기반의 이미지 분류이다.
딥러닝 기반의 이미지 분류, 어떤 것이 있을까?
- linear classification
- Deep Neural Network (DNN) : More than one hidden layer
- Effectiveness of Deep Neural Network : 비선형성으로 계산이 되고 왜곡을 만들어 분류를 한다.
결론
- 최근 딥러닝 기법이 분류, 검출, 분할 문제 등 컴퓨터 비전의 전통적인 이슈들을 해결하고 있다.
- 자연어 처리에서 사용되던 Transformer 모델이 컴퓨터 비전에도 적용되어 높은 성능을 달성하고 있다.
- 이미지에만 활용하는 것이 아닌 텍스트 등 다른 모달리티에도 연구가 활발히 진행되고 있음.
- 하지만, 개인 정보 (보호) 이슈 등 생성 모델에서는 해결해야 하는 과제가 아직 남아있다.