-
Finance - 2finance 2020. 12. 16. 15:40
저번에 말했듯이 결측치에 대해서 처리를 했다.
일단 아래 사진에서 보면, 주당배당금, 시가배당률, 배당성향은 값이 비어있는 경우가 많아 아예 제외했고 연간실적의 2020.12 그리고 분기실적의 2020.12 값들도 많이 비어있어 제외했다.
그 후 연간실적과 분기실적에서 한 row가 통째로 비어있는 항목들도 제외시켰다. 그 결과 761개의 종목들 중 690개가 남았다.
그 뒤로는 저번과 동일하게 lasso, ridge regression을 진행했다.
그 결과는 아래와 같다.
ridge regression은 뭐 거의.. 따로 놀고 있다. lasso regression도 성능이 좋다! 라고는 말할 수 없겠지만 어느정도 추세는 따라가고 있는것 같다. alpha값은 ridge는 0.1 lasso는 1로 설정해준 값이다.
아직 제대로 되고있지 않다.. 아마 점수 지표로 쓰는 값들이 단순 재무재표로 완성되는게 아니고 현재가치, 업종모멘텀 두 항목까지 고려해 나오고 있는것 이여서 그런것 같다.
현재가치의 경우 주가를 분석하면 어떻게든 추출해 낼 수 있을 것 같은데 업종 모멘텀 같은경우는... 일단 드는 생각으론 종목을 검색해서 나오는 최근 뉴스들을 nlp 감정분석? 같은걸로 긍정신호인지.. 부정신호인지.. 구별하는 방식을 생각하고 있다.
'finance' 카테고리의 다른 글
Finance - 1 (0) 2020.12.15