전체 글 63

Python Data 분석 : yfinance와 네이버금융 데이터로 시세조회하기(실패)

코드를 작동시켰을때 yfinance를 사용하여 그래프를 나타낸 결과는 올바르게 나왔지만 네이버 금융 데이터로 시세조회하기에는 실패하였다. 원인은 아래 사진과 같으며 해결하기 위해 idle로 실행하였지만 이 또한 실패하였다. from pandas_datareader import data as pdr import yfinance as yf yf.pdr_override() import matplotlib.pyplot as plt from Investar import Analyzer df = pdr.get_data_yahoo('005930.KS', '2017-01-01') #야후파이낸스 사용하여 삼성전자 주가 추출 plt.figure(figsize=(9,6)) #그래프사이즈 plt.subplot(2,1,1) #..

Linear Regression with Multiple variables

Multiple Linear Regression Multiple features(Variables) = x1, x2, x3, x4 , .. features of i th training example : i th Row vector 여러개의 x를 f_wb에 대입해주면 아래와 같다. Vectorization(벡터화) 아래는 각 내적을 나타내는 방법이며, numpy의 dot함수를 나타냈을때 가장 simple한 것을 확인할 수 있음. makes efficient ; scale to large datasheets Gradient descent 에서의 Vectorization 활용 여러개의 feature로 바뀜에 따라 W_n을 각각 맞춰 해결해야함. 해당사항은 아래 참고 Feature Scaling(데이터 전처리..

Deep Learning 2022.07.18

Python Data 분석 : 웹 스크레이핑

1. read_html()로 파일읽기 import pandas as pd krx_list = pd.read_html('C:/Users/hards/Downloads/상장법인목록.xls') krx_list[0].종목코드 = krx_list[0].종목코드.map('{:06d}'.format) #종목코드 0생략들을 커버함 {:06d]는 여섯자리 숫자형식으로 표현 print(krx_list[0]) #리스트의 첫번째 원소 출력 print('\n') df = pd.read_html('https://kind.krx.co.kr/corpgeneral/corpList.do?method=download&SearchType=13')[0] #URL을 이요해 인터넷 상 파일 읽기 뒤의 [0]은 결과를 데이터프레임으로 받음 df['..

Python Data 분석 : 미국국채와 코스피의 회귀분석

앞서 공부한 내용을 바탕으로 yfinance를 통해 미국국채의 Data와 코스피 Data를 추출하여 코스피 기대치 함수를 선형회귀분석을 통해 구하고, 각 그래프를 맷플롯립을 통해 구현. import pandas as pd import yfinance as yf from scipy import stats import matplotlib.pylab as plt from pandas_datareader import data as pdr yf.pdr_override() kospi = pdr.get_data_yahoo('^KS11', '2000-01-04') #코스피 지수 추출 tlt = pdr.get_data_yahoo('TLT', '2002-07-30') #미국국채 데이터 추출 df = pd.DataFrame..

Python Data 분석 : 상관계수에 따른 리스크 완화

상관계수의 정의와 상관계수를 직접 구해보고 결정계수까지 구함. 다우존스 지수와 코스피의 회귀분석을 진행하여 그래프형태로 코스피의 기대치 직선과 같이 나타냄 import pandas as pd from pandas_datareader import data as pdr import yfinance as yf from scipy import stats import matplotlib.pylab as plt yf.pdr_override() dow = pdr.get_data_yahoo('^DJI', '2000-01-04') #다우존스 데이터 추출 kospi = pdr.get_data_yahoo('^KS11', '2000-01-04') #코스피 데이터 추출 df = pd.DataFrame({'X': dow['Clo..

Python Data 분석 : 선형 회귀분석과 상관관계

회귀분석을 통해 연속적인 데이터 Y와 해당 Y의 원인이 되는 X간의 관계를 찾아 선형회귀모델 식을 구해 임의의 X값이 주어질 경우 Y를 예측하는 과정을 Scipy와 Pandas를 사용하여 분석 import pandas as pd from pandas_datareader import data as pdr import yfinance as yf yf.pdr_override() dow = pdr.get_data_yahoo('^DJI', '2000-01-04') #다우존스 데이터 추출 kospi = pdr.get_data_yahoo('^KS11', '2000-01-04') #코스피 데이터 추출 import matplotlib.pyplot as plt plt.figure(figsize=(9, 5)) #그래프 크기..

Python Data 분석 : Kospi MDD

MDD : 특정기간에 발생한 최고점에서 최저점까지의 가장 큰 손실 from pandas_datareader import data as pdr import yfinance as yf yf.pdr_override() import matplotlib.pyplot as plt kospi = pdr.get_data_yahoo('^KS11', '2004-01-04') #코스피지수 데이터 다운로드 window = 252 #윈도우 크기 : 1년동안의 개장일을 252일로 어림 peak = kospi['Adj Close'].rolling(window, min_periods=1).max() #종가칼럼에서 1년 기간단위로 최고치 peak구함 drawdown = kospi['Adj Close']/peak - 1.0 #peak대..