본문 바로가기

나만의 파이썬4

[파이썬] 유용하게 쓰이는 정규식 표현 1. 하나의 character라도 매칭되는지 [2345cde] : 2,3,4,5,c,d,e 중 하나라도 매칭되는지 조건 (2|3|4|5|c|d|e)과 같다. ex) "1 2 6" -> "1 2 6" 2.범위(range) [2-5c-e] : 2,3,4,5,c,d,e 중 하나라도 매칭되는지 ex) "1 2 9" -> "1 2 9" "2 3 7 9 " -> "2 3 7 9 " 3.[^] : not character [^2-5c-e] : 2,3,4,5,c,d,e가 아닌 charater인지 ex) "1 2 9" -> "1 2 9" "2 3 7 9 " -> "2 3 7 9 " 4. 그룹화 및 변수로 지정 ‘abcd’ -> ‘ad’ 문제 abcd에서 bc제거하기 [(a-z)]bc([a-z]) - > \1\2 = 'a.. 2021. 8. 2.
python 머신러닝 이론 정리. 1. 데이터 불러오기 2. 상황에 따라 데이터프레임으로 변형 데이터 전처리. 레이블 인코딩, 원-핫 인코딩, standardScaler(피처 스케일링과 정규화) 3. x_train, x_text, y_train, y_test 분리 4. 모델 선정 5. 모델 학습 cross_val_score(), 6. 예측 cross_val_score(), 7. 예측 정확도 평가 KFold 교차검증, stratified K 폴드 , cross_val_score(), GridSearchCV 데이터 전처리 설명 standardScaler (피처 스케일링) -표준화는 데이터의 피처 각각이 평균이 '0' 이고 분산이 1인 가우시안 정규 분포를 가진 값으로 변환하는 것을 의미. -평균을 제거하고 데이터를 단위 분산으로 조정한다. .. 2021. 6. 11.
배열 데이터 Numpy 정리. 파이썬에서 Numpy, pandas는 정말 중요하다고 많이 들어서 이번 기회에 이렇게 정리를 해봤다 한번 봤던 내용이지만 사용을 안 하다 보면 기억이.. 다시 한번 기록을 해본다. import numpy as np #패키지를 불러올때 먼저 1. 리스트로 부터 Numpy의 1차원 배열을 생성하는 예 data1 = [0, 1, 2, 3, 4, 5] a1 = np.array(data1) a1 array([0, 1, 2, 3, 4, 5]) data2 = [0.1, 5, 4, 12, 0.5] a2 = np.array(data2) a2 array([ 0.1, 5. , 4. , 12. , 0.5]) #리스트 안에 실수가 포함돼 있으면 실수로 변환됨. a2.dtype dtype('float64') 2. 리스트 데이터를.. 2021. 6. 6.
[네이버] 금융 코스닥 파이썬 크롤링 연습. 유튜브에서 개발자와 데이터 분석에 대한 영상을 보다. 배달의 민족 개발자 분 중 기억하기보단 기록하자 라는 말이 이제 한달 좀 안 되게 파이썬을 배운 나 자신도 인상 깊을 정도로 이거다!라는 생각이 들게 해 줬다. 코딩을 처음 배우고 공부하는 사람들에게도 정말 어떠한 팁 보다 좋은 공부 방향성과 길을 잃지 않는 법을 배우는게 돌아가지 않는 방법이지 않을까 싶었다. 그래서 오늘 처음으로 기억하고 싶은 코드들을 남겨보려고 한다. 네이버 코스닥 일별시세 중 날짜와 체결가를 가져와 라인 그래프로 적용시키는 연습을 했다. 1. HTML형식의 네이버. import requests from bs4 import BeautifulSoup import pandas as pd from matplotlib import pyp.. 2021. 6. 4.