1. 컴퓨터비전(CV)

1. 컴퓨터 비전이란

인공지능(AI)의 한 분야로, 컴퓨터와 시스템을 통해 디지털 이미지, 비디오 및 기타 시각적 입력에서 의미 있는 정보를 추출한 다음 이러한 정보를 바탕으로 작업을 실행하고 추천할 수 있게 함
- AI -> 생각
- 컴퓨터 비전 -> 보기, 관찰, 이해

2. 데이터셋

컴퓨터 비전 모델은 데이터 모음(일반적으로 이미지, 비디오 또는 기타 시각적 정보)을 학습
데이터셋은 모델의 성능을 결정하는데 중요(양과 품질)
데이터셋의 크기는 모델이 학습 중에 본 예제의 수를 나타내기 때문에 중요
데이터셋의 품질은 주석이 잘못 지정되거나 레이블 잘못 저장된 경우 모델의 성능에 많은 부정적 영향을 줄 수 있음
다양한 개체 변형의 존재, 조명 조건, 배경 등을 포함한 데이터셋의 다양성도 모델의 견고성을 보장하는 데 중요

2-1. 어노테이션(주석)

주석은 데이터 집합의 데이터에 정보 또는 레이블을 추가하는 프로세스
예) 이미지에서 특정 개체의 존재, 이미지 내 개체의 위치 또는 속성(색상, 크기, 모양 등)을 나타내는 레이블이 포함
어노테이션은 데이터셋에 수동으로 추가하거나 컴퓨터 알고리즘을 사용하여 자동으로 생성할 수 있음

2-2.어노테이션 종류

Bounding Box: 이미지 내에서 개체의 위치 및 크기를 정의하는 작업. 개체 주위에 box를 그리고 클래스로 label을 지정
Keypoint: 개체 내의 특정 관심 지점을 표시하는 작업.예) 이미지 내 사람의 관절의 위치를 예측이 목표인 작업
Segmentation: 이미지 내에서 개체의 경계를 정의. 컴퓨터 비전 모델은 이러한 경계를 인식하고 이미지 내의 객체를 분류하도록 훈련

2-3. 어노테이션의 방법

수동 주석:
- 마우스 또는 스타일러스와 같은 도구를 사용해서 이미지 내의 각 개체에 수동으로 레이블을 지정하는 작업.
- 가장 시간이 많이 걸리지만 최고 수준의 제어와 정확성을 제공함.
반자동 주석
- 컴퓨터 지원 도구를 사용하여 주석 프로세스의 속도를 높이는 작업.
- 어노테이터는 도구를 사용하여 개체 주위에 경계 상자를 그릴 수 있으며 컴퓨터는 자동으로 개체에 해당 클래스로 레이블을 지정함.
- 수동 주석보다 빠르지만 정확성을 보장하려면 어느정도 사람의 인력이 필요함.
자동 주석
- 컴퓨터 알고리즘을 사용하여 이미지 내의 객체에 자동으로 레이블을 지정하는 작업.
- 가장 빠르지만 정확도는 낮음.
- 수작업 비용이 많이 드는 대규모 데이터셋에 사용됨.

2-4. 유명 데이터셋

Pascal VOC(Visual Object Classes)
- Pascal VOC
- 컴퓨터 비전에서 객체 인식 및 분류를 위한 데이터셋
- 디지털 카메라, 웹 페이지 및 스캔 이미지를 포함한 다양한 소스에서 가져온 이미지로 구성
- 사람, 동물, 차량, 일상적인 개체를 비롯한 20개의 다양한 개체를 포함
COCO(Common Objects in Context)
- COCO
- 컴퓨터 비전을 위한 대규모 이미지 인식 데이터셋
- Microsoft Research에서 만듦
- 이미지 및 비디오의 객체를 인식하기 위한 알고리즘을 개발하고 평가할 수 있도록 설계
- 디지털 카메라, 웹 페이지 및 스캔 이미지를 포함한 다양한 소스에서 수집 된 330,000개 이상의 이미지
- 사람, 동물, 차량, 일상적인 개체를 비롯한 80개의 다양한 객체를 포함
ImageNet
- ImageNet
- 스탠포드 비전 랩과 프린스턴 대학에서 만듦
- 디지털 카메라, 웹 페이지 및 스캔 이미지를 포함한 다양한 소스에서 수집 된 1,400만 개 이상의 이미지
- 이미지에서는 사람, 동물, 차량, 일상적인 개체를 비롯한 1,000개의 다양한 객체를 포함
- 1,000개의 개체 범주 집합에서 하나 이상의 클래스 레이블이 주석으로 지정
KITTI(Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago)
- KITTI
- 컴퓨터 비전 및 로봇 공학을 위한 데이터셋
- 움직이는 차량에서 캡쳐 한 이미지 및 비디오에서 객체 인식 및 감지를 위한 알고리즘의 개발 및 평가를 위한 실제 데이터를 제공
- 움직이는 차량에서 캡쳐한 7,000개 이상의 이미지와 비디오로 구성
- 도시 및 농촌 환경, 도로, 건물, 차량, 보행자를 포함한 다양한 객체와 장면
- 주석에는 3D 공간에서 객체의 위치와 방향에 대한 정보를 포함

'컴퓨터비전(CV)' 카테고리의 다른 글

6. Open CV5 (0)	2024.07.14
5. OpenCV4 (1)	2024.07.08
4. Open CV3 (0)	2024.07.08
3. Open CV2 (0)	2024.07.08
2. Open CV1 (0)	2024.07.08

AI개발자가 되기 위한 과정들

1. 컴퓨터비전(CV)

1. 컴퓨터 비전이란

2. 데이터셋

'컴퓨터비전(CV)' 카테고리의 다른 글

티스토리툴바

1. 컴퓨터비전(CV)

1. 컴퓨터 비전이란

2. 데이터셋

'컴퓨터비전(CV)' 카테고리의 다른 글

관련글

티스토리툴바