목록AI/ML (6)
Priceless

Image Classification정의이미지를 입력 받았을 때이미지의 클래스를 예측하는 모델Cat(0.95), Dog(0.05) 와 같이 확률로 나타나며그 중 확률이 가장 높은 클래스가 해당한다 CNN(Convolutional Neural Network)Image classification 중 가장 많이 쓰이는 딥러닝 모델 중 하나이미지 처리에 특화되어 있다 Convolution이라는 패치를 통해weight를 갱신하고 연산하며, pooling, fully connected layer 등의 연산 방법을 사용할 수 있다 History of Image Classification대표적인 CNN의 역사 다양한 Image classification을 위한 DatasetsImageNet, CIFAR-10, C..
Ch.6 비지도 학습6-1. 군집 알고리즘비지도 학습비지도 학습: 타킷을 모르는 데이터를 예측하는 알고리즘흑백 샘플이미지의 경우 높은 값을 낮은 값으로 만들고 낮은 값을 높은 값으로 만든다 비지도 학습을 통한 이미지 분류이미지outline으로 나누어진 이미지의 픽셀만 남게 한다평균을 내어 데이터 개수 별로 구간을 나누어 확인하는 방법이 방법의 경우 평균이 비슷한 데이터끼리 솎아낼 수 없다 대신 각 픽셀 별로 평균을 내는 경우 그만큼 특징이 많아져서 구별하기 수월하다 평균값을 각 이미지에서 뺀 후 차이가 적은 순으로 해당 이미지 인것을 확인할 수 있다 군집: 비슷한 샘플끼리 그룹을 모으는 작업클러스터: 군집을 통해 생성된 그룹 비슷한 샘플끼리 모으기 6-2. k-평균k-평균 알고리즘k-평균 알고리즘: 평균..

Ch.5 트리 알고리즘 5-1. 결정 트리 결정 트리 결정 트리: 데이터를 잘 나눌 수 있는 질문을 통해 분류 정확도를 높인 자료 구조 각 질문은 특성을 이분할 수 있는 질문이다 불순도: 지니 불순도: 결정 트리 모델은 부모 노드와 자식 노드의 불순도 차이가 가능한 크도록 트리를 성장시킨다 정보 이득: 부모 노드와 자식 노드의 불순도 차이 클래스의 표준을 criterion = 'entropy'를 지정하여 엔트로피 불순도를 사용할 수 있다 가지치기를 통해 최대 깊이를 지정하여 루트 노드 아래로 성장할 수 있는 노드를 제한한다 max_depth = 매개 변수를 설정하여 제한할 수 있다 특성 중요도: 어떤 특성이 가장 유용한지 나타내는 정도 결정 트리에 사용된 특성이 불순도를 감소하는데 기여한 정도를 나타내..

Ch.4 다양한 분류 알고리즘 4-1. 로지스틱 회귀 로지스틱 회귀 로지스틱 회귀: 선형 방정식을 학습하는 분류 모델 시그모이드 함수(로지스틱 함수)를 통해 클래스 확률을 출력 로지스틱 회귀는 계수의 제곱을 규제(L2 규제) 소프트맥스: 지수 함수를 모두 계산해 더한 후 그 합을 각 지수 함수에 나눈 것 출력 결과의 합이 1이다 4-2. 확률적 경사 하강법 점진적인 학습 경사 하강법: 목적 함수를 낮추기 위해 조금씩 내려오는 방식 조금씩 내려와야 가장 낮은 목적 함수를 찾을 수 있다 크게 내려오면 목적 함수가 오히려 올라갈 수 있다 확률적 경사 하강법: 경사 하강법에서 전체 샘플을 사용하지 않고 하나의 샘플을 훈련 세트에서 랜덤하게 골라 가장 확률이 높은 답을 구하는 방법 점진적 학습 또는 온라인 학습이..

Ch.3 회귀 알고리즘과 모델 규제 3-1. k-최근접 이웃 회귀 k-최근접 이웃 회귀 회귀: 임의의 어떤 숫자를 예측하는 문제 내년 경제 성장률 예측, 배달 도착 시간 예측 등 분류: 샘플을 몇 개의 클래스 중 하나로 분류하는 문제 데이터 준비 길이로 무게를 예측하기 위해서는 길이가 특성이고 무게가 타깃이 된다 사이킷런에 사용할 훈련 세트는 2차원 배열이여야 하므로 reshape() 함수를 통해 1차원 배열을 2차원 배열로 바꾼다 결정계수(R^2) NNeighborRegressor 클래스를 사용하여 회귀 모델 훈련 회귀에서는 정확한 숫자를 맞힌다는 것은 거의 불가능하다. 예측하는 값이나 타깃 모두 임의의 수치이다. 결정계수: 회귀의 값을 평가하는 계수로, R의 제곱으로 나타낸다 R이 1에 가까울 수록 ..

Ch.1 나의 첫 인공지능 1-1. 인공지능과 머신러닝 딥러닝 인공지능: 사람처럼 학습하고 추론할 수 있는 지능을 가진 컴퓨터 기술 머신러닝: 자동으로 데이터에서 규칙을 학습하는 알고리즘 대표적인 머신러닝 라이브러리로 파이썬을 사용하는 사이킷런(scikit learn)이 있다. 딥러닝: 인공 신경망 기법을 사용한 머신러닝 유명한 머신 러닝 오픈소스: 텐서플로, 파이토치 등 1-2. 코랩과 주피터 노트북 구글 코랩(colab): 브라우저에서 파이썬을 통해 머신러닝 프로그램을 만들 수 있는 서비스 노트북(Notebook): 파이썬을 대화형으로 사용하기 위한 확장자 jupyter 와 colab 등에서 지원한다. 1-3. 마켓과 머신러닝 분류 문제 특정 데이터들을 여러 종류 중 하나로 정하는 것을 분류라고 한다..