wordenbedding1 병렬 코퍼스(Corpus) 정렬 시키기(for NMT) 1.Parallel Corpus? English Korea I love to go to school 나는 학교에 가는 것을 좋아한다. i am d doctor 나는 의사 입니다. 주요 수집 대상 : 뉴스, 기사, 드라마/영화 자막 문서 단위의 matching은 어느정도 되어 있지만, 문장 단위는 되어 있지 않음 : 의역,생략 등으로 인해 문장 단위 매칭은 쉽지 않다. NMT(기계 번역)에서 필요 2. Champllion(샴폴레옹) 프로그램 - 단어번역사전에 기반하여, 사전을 최대한 만족하는 문장 매칭을 찾아서 알려줌 Word Translation Dictionary(WTD)필요 (Facebook - MUSE Library) ratio parameter의 역할 : source 언어의 character 당 .. 2021. 8. 9. 이전 1 다음