본문 바로가기

분류 전체보기16

NLP의 기본 자연어 처리 1.NLP 사람의 생각(의도, 정보)을 컴퓨터에게 전달하는 방법 Naive interface 사람이 이해할수 있지만, 엄격한 문법과 모호성이 없는 형태의 전달 방식 인공언어 Better interface - 사람이 실제 사용하는 형태에 가까운 전달 방식 - 자연어 처리 자연어(Natural Language)란? - 사람들이 일상적으로 쓰는 언어 - 인공적으로 만들어진 언어인 인공 언어와 구분하여 부르는 개념 NLP(Natural Language Processing) - 사람이 이해하는 자연어를 컴퓨터가 이해할 수 있는 값으로 바꾸는 과정(NLU) - 더 나아가 컴퓨터가 이해할 수 있는 값을 사람이 이해하도록 바꾸는 과정(NLG) 2. Traditional NLP vs NLP with Deep Learin.. 2021. 8. 2.
파이토치 오토인코더 이론에 대해 알아보자 1. 오토인코더란 정보가 차원 축소되는 병목 구간(z)을 통과하면서 자동적으로 특징을 추출하는 방식으로 학습 딥러닝의 특성을 잘 반영한 학습 알고리즘 인코더(encoder)와 디코더(decoder)를 통해 압축과 해제를 반복하며 특징 추출을 자동으로 학습한다. 인코더는 입력(x)의 정보를 최대한 보존하도록 손실 압축을 수행(필요 없는 정보는 버린다.) 디코더는 중간 결과물(z)의 정보를 입력(x)과 같아지도록 압축 해제(복원)를 수행 복원을 성공적으로 하기위해, 오토인코더(autoencoder)는 특징(feature)을 추출하는 방법으로 자동학습 2. Encoder 복원에 필요한 정보를 중심으로 손실 압축 수행 필요 없는 정보 (뻔한 특징)는 버릴 수도 있다 ex) 일반적인 사람의 얼굴을 학습할 때: 사.. 2021. 7. 30.
원 핫 인코딩의 한계와 Vector Embeding의 필요성 차이점 Categorical Value - 보통은 discrete value - 단어, 클래스 비슷한 값일지라도 상관 없는 의미를 지닌다. Continuous Value -키, 몸무게 비슷한 값은 비슷한 의미를 지닌다. 1.원핫 벡터의 문제점 서로 다른 두 벡터는 항상 직교(orthogonal) 한다. -Cosine similarity가 0.(element wise 곱이 0) 따라서 우리는 두 샘플 사이의 유사도(거리)를 구할 수 없다. 공책 1 0 1 0 0 0 0 0 0 0 노트 3 0 0 0 1 0 0 0 0 0 지우개 11 0 0 0 0 0 0 0 1 0 2. Embedding Vectors의 필요성 NLP에서 단어는 categorical and discrete value의 속성을 가진다. - 따.. 2021. 7. 30.
딥러닝 입문( DNN 이진분류) 1. 전체 학습 : epoch X #epochs : 미니배치 만들어 학습 및 검증을 진행하고 best_model weights를 구한다. Training ---------> Validation --------------->Epoch 종료 ----------------->Epoch 시작 ---->train ( 매 training epoch이 끝날 때마다 validation을 해준다) 2. Logistic Regression n차원 입력 벡터를 넣으면 m차원 출력 벡터가 나오는 로지스틱 회귀 3. 시그모이드 함수를 사용하는 이유 이 사람은 COVID-19 바이러스에 걸렸는가? 입력 : 키, 몸무게, 혈압, 혈중 산소농도, 염증수치 출력 : True/False = 로지스틱 회귀는 sigmoid를 사용하므로 결.. 2021. 7. 22.