파이썬Vector Embedingd1 원 핫 인코딩의 한계와 Vector Embeding의 필요성 차이점 Categorical Value - 보통은 discrete value - 단어, 클래스 비슷한 값일지라도 상관 없는 의미를 지닌다. Continuous Value -키, 몸무게 비슷한 값은 비슷한 의미를 지닌다. 1.원핫 벡터의 문제점 서로 다른 두 벡터는 항상 직교(orthogonal) 한다. -Cosine similarity가 0.(element wise 곱이 0) 따라서 우리는 두 샘플 사이의 유사도(거리)를 구할 수 없다. 공책 1 0 1 0 0 0 0 0 0 0 노트 3 0 0 0 1 0 0 0 0 0 지우개 11 0 0 0 0 0 0 0 1 0 2. Embedding Vectors의 필요성 NLP에서 단어는 categorical and discrete value의 속성을 가진다. - 따.. 2021. 7. 30. 이전 1 다음