본문 바로가기
코딩월드/🕹️토이프로젝트

캐글에 데이터업로드 해보기 (레알마드리드 승부예측 데이터)

by khalidpark 2021. 2. 6.

혼자 유튜브를 보면서 머신러닝, 딥러닝을 공부하면서

직접 모델을 만들어보면 좋겠다고 생각했다

 

관심을 갖고 있는 분야 중 하나가 해외축구라서

무작정 노가다로 데이터를 긁어모아서 진행해본 적이 있다.

(지금 다시 보면 얼마나 무식했던가?)

 

그래도 열심히 모은 데이터이니, 누군가는 요긴하게 사용해주지 않을까 해서

(물론 나도 잘 다듬어서 다시 써보려고 한다)

캐글에 한번 시험삼아 올려보려고 한다.

 

 


데이터 이름 : 레알마드리드 데이터 셋

목적 : 레알마드리드의 데이터 분석을 기반으로 승부예측

기간 : 2005년 ~ 2020년

출처 : 

  1) 레알마드리드 공식사이트 : www.realmadrid.com/en

  2) 트랜스퍼마켓 : www.transfermarkt.com/sergio-ramos/leistungsdatendetails/spieler/25557/saison/2005/verein/0/liga/0/wettbewerb//pos/0/trainer_id/0/plus/1

 

Sergio Ramos - Detailed stats (Detailed view)

 

www.transfermarkt.com

데이터 선택 이유 (레알마드리드와 라모스 선수를 선택한 이유)

  1) 경기 결과에 영향을 주는 선수가 있는 팀 (핵심선수)(가급적 공격라인)

  2) 그 선수가 가급적 유리몸이 아니여야 함

  3) 그 선수가 최소 10년이상 한 팀에서 오래 뛰어야 함 (메시 , 라모스)

  4) 데이터 수급을 위해 빅클럽

 

바르셀로나와 메시를 선택해서 데이터 크롤링을 진행하였으나,

원하는 정보를 얻기 쉽지 않아 상대적으로 공식사이트의 데이터가 잘 정리되어있는 레알마드리드로 변경

 

데이터 특성

1) Match Gap : 치뤄지는 경기가 전날 경기로부터 몇일 후 진행되는 지 _ 짧은 연속된 경기는 피로도에 영향

2) Month : 몇월에 경기 진행되는지 _ 날씨의 영향 파악위해

3) MatchType : 리그경기인지 챔피언스리그 경기인지 (컵경기 등은 제외)

5) HomeAway : 홈인지 어웨이인지

6) Team : 상대방팀

7) TeamRanking : 상대방팀의 현재 순위 (챔피언스리그인 경우는 동일숫자로 적용)
8) PreScoreGoal : 전경기 득점수

9) PrePreScoreGoal : 전전경기 득점수

10) PreGetGoal : 전경기 실점수

11) PrePreGetGoal : 전전경기 실점수

12) RamosTime : 전경기 라모스 출장시간

13) RamosGoal : 전경기 라모스 득점수

14) RamosAss : 전경기 라모스 어시수

15) Results : 경기결과

Match Gap Month MatchType HomeAway Team TeamRanking PreScoreGoal PrePreScoreGoal PreGetGoal PrePreGetGoal RamosTime RamosGoal RamosAss Results

 


캐글에 업로드 완료 

www.kaggle.com/khalidpark/realmadrid-football-results-data-set

 

Realmadrid football results (2005~2020) data set

Realmadrid and sergio Ramos football results

www.kaggle.com

해당 데이터로 만들어본 머신러닝 모델

 

github.com/khalidpark/Projects/tree/main/%EB%A0%88%EC%95%8C%EB%A7%88%EB%93%9C%EB%A6%AC%EB%93%9C%20%EC%8A%B9%EB%A6%AC%EC%98%88%EC%B8%A1

 

khalidpark/Projects

toy projects. Contribute to khalidpark/Projects development by creating an account on GitHub.

github.com

 

728x90

댓글