SlideShare ist ein Scribd-Unternehmen logo
1 von 19
Downloaden Sie, um offline zu lesen
기간별 주차장 이용 데이터 분석을
통한 주차 가능 시간 예측 서비스
데만쥬
유희열, 이보민, 김기림, 송혜정
어린이 대공원 방문객의 편의를 증진시키기 위하여
2020년 1월 어린이 대공원 주차장 시간별 주차대수 예측
프로젝트 개요
1. 탐색적 데이터 분석
2. 데이터 전처리
3. 시행착오
4. 가설 설정
5. 결론
탐색적 데이터 분석
2017년(1월 1일 ~ 12월 31일) : 635,142건
2018년(1월 1일 ~ 1월 31일) : 33,828건
2019년(1월 1일 ~ 10월 25일) : 509,461건
년도별 데이터 개수 확인
5
탐색적 데이터 분석
정문 : 429,926건
후문 : 441,842건
구의문 : 304,794건
서버실 : 1,732건
사전무인 : 137건
입출구별 데이터 개수 확인
데이터 전처리
주차시간 분포 그래프를 참고하여 실 이용객 정의
- 주차시간 : 15분 초과, 780 미만
- 진입 시간 : 9시 이후
- 진출시간 : 22시 이전
위 조건의 차량들을 실 이용객으로 간주하여 아웃라이어 데이터 제거 (1307896건, 약 1.1%)
주차시간 이상치 데이터 제거
시설공단측 데이터 내용 확인
- 수동 출차 데이터(6130건) : 진입시각 + 주차시간(분) 으로 변환
- 주차중, 중복입차 데이터 제거 (1686건, 약 0.001%)
진출시각 이상치 데이터 변환, 제거
데이터 전처리
차량별 데이터를 시간대별 주차대수로 변환
시계열 분석
시계열 데이터라고 생각하고 시계열 분석을 시도했으나 의미 있는 모델링이 나오지 않음
Rolling Mean
이전 시점의 데이터가 이후 시점의 데이터에 영향을 직접적으로 주지 않음
시간에 따른 패턴은 있지만 시간에 따른 상호작용이 존재하지 않음
날씨 등의 외생변수에 의해 주차장 상황이 결정됨
2017년 데이터만 1월 ~ 12월 데이터가 모두 존재하기 때문에 1년 단위 계절성이 뚜렸한 데이터를 분석하기에는 부족함
EX) 저번주에 어린이대공원을 이용한 사람은 이번주에 이용하지 않는다는 등의 가설을 증명하기 어려움
시계열 분석이 어려운 이유
10
회귀분석 중심으로 계획 변경
외생변수가 되는 데이터들을 가져옴
날씨(기상청)
공휴일(공공데이터 포털)
미세먼지
모델링
선형회귀
Random Forest
XGBoost
datetime : 년-월-일-시각
year : 연도
month : 월
date : 날짜
weekday : 요일
count : 해당 시간에 주차되어 있던 차량 수
entrance : 입출구명
• 주차장 데이터
temp : 기온
rain_snow : 강수량 + 적설량
snowfall : 적설량
rainfall : 강수량
windspeed : 풍량
humidity : 습도
sun : 일사량
• 날씨 데이터
dateName : 공휴일 이름
locdate : 공휴일 날짜
weekend : 주말
free_day : 주말 + 공휴일
season : 계절
• 휴일 데이터
데이터셋
sun, humidity, windspeed, temp, hour,
free_day, weekend, weekday
예외
free_day와 weekday, weekend는 0.76, 0.91로
다중공선성이 확인됨
free_day만 피쳐로 사용
상관관계가 큰 컬럼
칼럼별 상관관계
2017년 10월 데이터 이상치 확인
2017년 10월에는 약 10일 간의 추석 연휴
2018년 2월 ~ 12월 데이터 존재하지 않음
2017년 10월 이상치 확인
월별 평균 차량 대수 분포(주말 / 평일)
2017년 데이터만 유일하게 1년치 데이터가 모두 존재하므로,
2017년 데이터를 기준으로 training 셋을 만들어
2018년 1월과 2019년 데이터를 예측하는 모델 개발 시도
2018년, 2019년 데이터 예측모델 개발
선형 회귀 모델링
그 외 시도들
유동인구 데이터를 사용하여 해당 문제가 주변 공간에 미치는 영향 분석 시도
-> 광진구 전체의 유동인구 데이터만 존재하기에 구역별 혼잡도 등을 분석할 수 없음
어린이 대공원 이벤트별 입장객 수를 분석해 어린이 대공원의 방문 목적 분석을 시도
-> 상상나라 측 입장객 수 자료를 요청했으나 관할이 달라 제공받지 못함
다이나믹 프라이스를 통해 주차난 해결 아이디어 제안
-> 국가 시설이기때문에 가격을 동적으로 변동할 수 없었음
데이터에서 발견한 것
2019년 9월 8일 12시에 나간 185대의 차량
16
17
어린이 대공원 주차장과 관련한 네이버 블로그 글들 분석
1. 주변 공용주차장들에 대한 정보
(광진광장 공영주차장, 세종대학교 주차장, 능동 공영주차장)
2. 입장료나 주차비를 받았으면 좋겠다는 의견 다수
주변 공용주차장을 도는 셔틀 버스 시행
후문 주차장과 구의문 주차장 이름 변경
'놀이공원 주차장', '동물원 주차장'으로 변경(혹은 병기)
감사합니다.

Weitere ähnliche Inhalte

Was ist angesagt?

서비스 기획자를 위한 데이터분석 시작하기
서비스 기획자를 위한 데이터분석 시작하기서비스 기획자를 위한 데이터분석 시작하기
서비스 기획자를 위한 데이터분석 시작하기승화 양
 
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)Dylan Ko
 
활성 사용자(Active user) 개념잡기
활성 사용자(Active user) 개념잡기활성 사용자(Active user) 개념잡기
활성 사용자(Active user) 개념잡기와이즈트래커
 
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [코끼리책방 팀] : 사용자 스크랩 내용 기반 도서 추천
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [코끼리책방 팀] : 사용자 스크랩 내용 기반 도서 추천 제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [코끼리책방 팀] : 사용자 스크랩 내용 기반 도서 추천
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [코끼리책방 팀] : 사용자 스크랩 내용 기반 도서 추천 BOAZ Bigdata
 
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표Dylan Ko
 
데이터가 흐르는 조직 만들기 - 마이리얼트립
데이터가 흐르는 조직 만들기 - 마이리얼트립데이터가 흐르는 조직 만들기 - 마이리얼트립
데이터가 흐르는 조직 만들기 - 마이리얼트립승화 양
 
여행가이드 트리플 - UXUI 개선
여행가이드 트리플 - UXUI 개선여행가이드 트리플 - UXUI 개선
여행가이드 트리플 - UXUI 개선RightBrain inc.
 
UX Academy 17th 마이리얼트립 UX/UI 개선 프로젝트
UX Academy 17th 마이리얼트립 UX/UI 개선 프로젝트UX Academy 17th 마이리얼트립 UX/UI 개선 프로젝트
UX Academy 17th 마이리얼트립 UX/UI 개선 프로젝트RightBrain inc.
 
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스Minwoo Kim
 
[데이터야놀자 2023] 비즈니스 분석가 vs 프로덕트 분석가_ 데이터 분석ᄀ...
[데이터야놀자 2023]  비즈니스 분석가 vs 프로덕트 분석가_ 데이터 분석ᄀ...[데이터야놀자 2023]  비즈니스 분석가 vs 프로덕트 분석가_ 데이터 분석ᄀ...
[데이터야놀자 2023] 비즈니스 분석가 vs 프로덕트 분석가_ 데이터 분석ᄀ...Jeongmin Ju
 
UX Academy 19th 뱅크샐러드 UX/UI 개선 프로젝트
UX Academy 19th 뱅크샐러드 UX/UI 개선 프로젝트UX Academy 19th 뱅크샐러드 UX/UI 개선 프로젝트
UX Academy 19th 뱅크샐러드 UX/UI 개선 프로젝트RightBrain inc.
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축BOAZ Bigdata
 
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다승화 양
 
라이트브레인 UX 아카데미 8기 오픈프로젝트 [Airbnb 어플리케이션 UX/UI개선 Design]
라이트브레인 UX 아카데미 8기 오픈프로젝트 [Airbnb 어플리케이션 UX/UI개선 Design]라이트브레인 UX 아카데미 8기 오픈프로젝트 [Airbnb 어플리케이션 UX/UI개선 Design]
라이트브레인 UX 아카데미 8기 오픈프로젝트 [Airbnb 어플리케이션 UX/UI개선 Design]RightBrain inc.
 
[에이스카운터 웹로그분석]에이스카운터 ASP 서비스 소개서
[에이스카운터 웹로그분석]에이스카운터 ASP 서비스 소개서[에이스카운터 웹로그분석]에이스카운터 ASP 서비스 소개서
[에이스카운터 웹로그분석]에이스카운터 ASP 서비스 소개서엔에이치엔디엔티(NHN D&T)
 
Deview2020 유저가 좋은 작품(웹툰)을 만났을때
Deview2020 유저가 좋은 작품(웹툰)을 만났을때 Deview2020 유저가 좋은 작품(웹툰)을 만났을때
Deview2020 유저가 좋은 작품(웹툰)을 만났을때 choi kyumin
 
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )정혁 권
 
UX 아카데미 오픈프로젝트 [ 이마트몰 - UX/UI 개선]
UX 아카데미 오픈프로젝트 [ 이마트몰 - UX/UI 개선]UX 아카데미 오픈프로젝트 [ 이마트몰 - UX/UI 개선]
UX 아카데미 오픈프로젝트 [ 이마트몰 - UX/UI 개선]RightBrain inc.
 
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [YouPlace 팀] : 카프카와 스파크를 활용한 유튜브 영상 속 제주 명소 검색
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [YouPlace 팀] : 카프카와 스파크를 활용한 유튜브 영상 속 제주 명소 검색 제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [YouPlace 팀] : 카프카와 스파크를 활용한 유튜브 영상 속 제주 명소 검색
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [YouPlace 팀] : 카프카와 스파크를 활용한 유튜브 영상 속 제주 명소 검색 BOAZ Bigdata
 
2021 한양대_로컬브랜드_SQUARE4_FFF_최종제출.pdf
2021 한양대_로컬브랜드_SQUARE4_FFF_최종제출.pdf2021 한양대_로컬브랜드_SQUARE4_FFF_최종제출.pdf
2021 한양대_로컬브랜드_SQUARE4_FFF_최종제출.pdfArtcoon
 

Was ist angesagt? (20)

서비스 기획자를 위한 데이터분석 시작하기
서비스 기획자를 위한 데이터분석 시작하기서비스 기획자를 위한 데이터분석 시작하기
서비스 기획자를 위한 데이터분석 시작하기
 
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)
 
활성 사용자(Active user) 개념잡기
활성 사용자(Active user) 개념잡기활성 사용자(Active user) 개념잡기
활성 사용자(Active user) 개념잡기
 
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [코끼리책방 팀] : 사용자 스크랩 내용 기반 도서 추천
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [코끼리책방 팀] : 사용자 스크랩 내용 기반 도서 추천 제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [코끼리책방 팀] : 사용자 스크랩 내용 기반 도서 추천
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [코끼리책방 팀] : 사용자 스크랩 내용 기반 도서 추천
 
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
 
데이터가 흐르는 조직 만들기 - 마이리얼트립
데이터가 흐르는 조직 만들기 - 마이리얼트립데이터가 흐르는 조직 만들기 - 마이리얼트립
데이터가 흐르는 조직 만들기 - 마이리얼트립
 
여행가이드 트리플 - UXUI 개선
여행가이드 트리플 - UXUI 개선여행가이드 트리플 - UXUI 개선
여행가이드 트리플 - UXUI 개선
 
UX Academy 17th 마이리얼트립 UX/UI 개선 프로젝트
UX Academy 17th 마이리얼트립 UX/UI 개선 프로젝트UX Academy 17th 마이리얼트립 UX/UI 개선 프로젝트
UX Academy 17th 마이리얼트립 UX/UI 개선 프로젝트
 
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
 
[데이터야놀자 2023] 비즈니스 분석가 vs 프로덕트 분석가_ 데이터 분석ᄀ...
[데이터야놀자 2023]  비즈니스 분석가 vs 프로덕트 분석가_ 데이터 분석ᄀ...[데이터야놀자 2023]  비즈니스 분석가 vs 프로덕트 분석가_ 데이터 분석ᄀ...
[데이터야놀자 2023] 비즈니스 분석가 vs 프로덕트 분석가_ 데이터 분석ᄀ...
 
UX Academy 19th 뱅크샐러드 UX/UI 개선 프로젝트
UX Academy 19th 뱅크샐러드 UX/UI 개선 프로젝트UX Academy 19th 뱅크샐러드 UX/UI 개선 프로젝트
UX Academy 19th 뱅크샐러드 UX/UI 개선 프로젝트
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축
 
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
 
라이트브레인 UX 아카데미 8기 오픈프로젝트 [Airbnb 어플리케이션 UX/UI개선 Design]
라이트브레인 UX 아카데미 8기 오픈프로젝트 [Airbnb 어플리케이션 UX/UI개선 Design]라이트브레인 UX 아카데미 8기 오픈프로젝트 [Airbnb 어플리케이션 UX/UI개선 Design]
라이트브레인 UX 아카데미 8기 오픈프로젝트 [Airbnb 어플리케이션 UX/UI개선 Design]
 
[에이스카운터 웹로그분석]에이스카운터 ASP 서비스 소개서
[에이스카운터 웹로그분석]에이스카운터 ASP 서비스 소개서[에이스카운터 웹로그분석]에이스카운터 ASP 서비스 소개서
[에이스카운터 웹로그분석]에이스카운터 ASP 서비스 소개서
 
Deview2020 유저가 좋은 작품(웹툰)을 만났을때
Deview2020 유저가 좋은 작품(웹툰)을 만났을때 Deview2020 유저가 좋은 작품(웹툰)을 만났을때
Deview2020 유저가 좋은 작품(웹툰)을 만났을때
 
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )
 
UX 아카데미 오픈프로젝트 [ 이마트몰 - UX/UI 개선]
UX 아카데미 오픈프로젝트 [ 이마트몰 - UX/UI 개선]UX 아카데미 오픈프로젝트 [ 이마트몰 - UX/UI 개선]
UX 아카데미 오픈프로젝트 [ 이마트몰 - UX/UI 개선]
 
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [YouPlace 팀] : 카프카와 스파크를 활용한 유튜브 영상 속 제주 명소 검색
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [YouPlace 팀] : 카프카와 스파크를 활용한 유튜브 영상 속 제주 명소 검색 제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [YouPlace 팀] : 카프카와 스파크를 활용한 유튜브 영상 속 제주 명소 검색
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [YouPlace 팀] : 카프카와 스파크를 활용한 유튜브 영상 속 제주 명소 검색
 
2021 한양대_로컬브랜드_SQUARE4_FFF_최종제출.pdf
2021 한양대_로컬브랜드_SQUARE4_FFF_최종제출.pdf2021 한양대_로컬브랜드_SQUARE4_FFF_최종제출.pdf
2021 한양대_로컬브랜드_SQUARE4_FFF_최종제출.pdf
 

Ähnlich wie ‘서울 어린이 대공원’의 기간별 주차장 이용 현황 분석

[분석] ITS와 유동인구 데이터를 활용한 교통 예측 모델
[분석] ITS와 유동인구 데이터를 활용한 교통 예측 모델[분석] ITS와 유동인구 데이터를 활용한 교통 예측 모델
[분석] ITS와 유동인구 데이터를 활용한 교통 예측 모델BOAZ Bigdata
 
서울시 장애인콜택시 개선을 위한 대기시간 분석사례
서울시 장애인콜택시 개선을 위한 대기시간 분석사례서울시 장애인콜택시 개선을 위한 대기시간 분석사례
서울시 장애인콜택시 개선을 위한 대기시간 분석사례수보 김
 
[COMPAS] 고양시 공공자전거 분석과제(장려상)
[COMPAS] 고양시 공공자전거 분석과제(장려상)[COMPAS] 고양시 공공자전거 분석과제(장려상)
[COMPAS] 고양시 공공자전거 분석과제(장려상)Joonho Lee
 
LH Smartcity for osgeo
LH Smartcity for osgeoLH Smartcity for osgeo
LH Smartcity for osgeossuser3b2776
 
빅데이터 캠퍼스 컨퍼런스 자료집(2016.7.14)
빅데이터 캠퍼스 컨퍼런스 자료집(2016.7.14)빅데이터 캠퍼스 컨퍼런스 자료집(2016.7.14)
빅데이터 캠퍼스 컨퍼런스 자료집(2016.7.14)bigdatacampus
 
Big Data Analytics and Data Mining
Big Data Analytics and Data MiningBig Data Analytics and Data Mining
Big Data Analytics and Data MiningSuHyun Jeon
 
공공자전거의 단기 이용자 수 변화 요인 분석 및 수요 예측
공공자전거의 단기 이용자 수 변화 요인 분석 및 수요 예측공공자전거의 단기 이용자 수 변화 요인 분석 및 수요 예측
공공자전거의 단기 이용자 수 변화 요인 분석 및 수요 예측vanillahub12
 
머신러닝 프로세스와 산업별 애플리케이션 - 위세아이텍 김종현 대표
머신러닝 프로세스와 산업별 애플리케이션 - 위세아이텍 김종현 대표머신러닝 프로세스와 산업별 애플리케이션 - 위세아이텍 김종현 대표
머신러닝 프로세스와 산업별 애플리케이션 - 위세아이텍 김종현 대표eungjin cho
 
Lh smartcity for_osgeo
Lh smartcity for_osgeoLh smartcity for_osgeo
Lh smartcity for_osgeossuser3b2776
 
권기훈_개인포트폴리오
권기훈_개인포트폴리오권기훈_개인포트폴리오
권기훈_개인포트폴리오Kihoon4
 
인공지능-빅데이터연구센터[ABRC] 산학협력사례집
인공지능-빅데이터연구센터[ABRC] 산학협력사례집인공지능-빅데이터연구센터[ABRC] 산학협력사례집
인공지능-빅데이터연구센터[ABRC] 산학협력사례집ABRC_DATA
 
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기Amazon Web Services Korea
 
빅데이터 솔루션 소개서(2013년 05월)
빅데이터 솔루션 소개서(2013년 05월)빅데이터 솔루션 소개서(2013년 05월)
빅데이터 솔루션 소개서(2013년 05월)동학 노
 
[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례
[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례
[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례Amazon Web Services Korea
 
발표평가 앱·웹 김봉준
발표평가 앱·웹 김봉준발표평가 앱·웹 김봉준
발표평가 앱·웹 김봉준bongjun kim
 
Prediction of bus riders at the time of departure
Prediction of bus riders at the time of departurePrediction of bus riders at the time of departure
Prediction of bus riders at the time of departureHWANGTAEYONG
 
데이터드리븐 DX 추진방안_202306.pdf
데이터드리븐 DX 추진방안_202306.pdf데이터드리븐 DX 추진방안_202306.pdf
데이터드리븐 DX 추진방안_202306.pdfYunjeong Susan Hong
 
[패스트캠퍼스] Outbrain Click Prediction
[패스트캠퍼스] Outbrain Click Prediction[패스트캠퍼스] Outbrain Click Prediction
[패스트캠퍼스] Outbrain Click Prediction완식 윤
 
AWS Partner Techshift - (SaaS) 사업을 위한 데이터 기반 세일즈/마케팅 전략과 노하우 (트레져데이터 고영혁 수석)
AWS Partner Techshift - (SaaS) 사업을 위한 데이터 기반 세일즈/마케팅 전략과 노하우 (트레져데이터 고영혁 수석)AWS Partner Techshift - (SaaS) 사업을 위한 데이터 기반 세일즈/마케팅 전략과 노하우 (트레져데이터 고영혁 수석)
AWS Partner Techshift - (SaaS) 사업을 위한 데이터 기반 세일즈/마케팅 전략과 노하우 (트레져데이터 고영혁 수석)Amazon Web Services Korea
 
공공데이터 개방현황 및 포털 발전방향
공공데이터 개방현황 및 포털 발전방향공공데이터 개방현황 및 포털 발전방향
공공데이터 개방현황 및 포털 발전방향Haklae Kim
 

Ähnlich wie ‘서울 어린이 대공원’의 기간별 주차장 이용 현황 분석 (20)

[분석] ITS와 유동인구 데이터를 활용한 교통 예측 모델
[분석] ITS와 유동인구 데이터를 활용한 교통 예측 모델[분석] ITS와 유동인구 데이터를 활용한 교통 예측 모델
[분석] ITS와 유동인구 데이터를 활용한 교통 예측 모델
 
서울시 장애인콜택시 개선을 위한 대기시간 분석사례
서울시 장애인콜택시 개선을 위한 대기시간 분석사례서울시 장애인콜택시 개선을 위한 대기시간 분석사례
서울시 장애인콜택시 개선을 위한 대기시간 분석사례
 
[COMPAS] 고양시 공공자전거 분석과제(장려상)
[COMPAS] 고양시 공공자전거 분석과제(장려상)[COMPAS] 고양시 공공자전거 분석과제(장려상)
[COMPAS] 고양시 공공자전거 분석과제(장려상)
 
LH Smartcity for osgeo
LH Smartcity for osgeoLH Smartcity for osgeo
LH Smartcity for osgeo
 
빅데이터 캠퍼스 컨퍼런스 자료집(2016.7.14)
빅데이터 캠퍼스 컨퍼런스 자료집(2016.7.14)빅데이터 캠퍼스 컨퍼런스 자료집(2016.7.14)
빅데이터 캠퍼스 컨퍼런스 자료집(2016.7.14)
 
Big Data Analytics and Data Mining
Big Data Analytics and Data MiningBig Data Analytics and Data Mining
Big Data Analytics and Data Mining
 
공공자전거의 단기 이용자 수 변화 요인 분석 및 수요 예측
공공자전거의 단기 이용자 수 변화 요인 분석 및 수요 예측공공자전거의 단기 이용자 수 변화 요인 분석 및 수요 예측
공공자전거의 단기 이용자 수 변화 요인 분석 및 수요 예측
 
머신러닝 프로세스와 산업별 애플리케이션 - 위세아이텍 김종현 대표
머신러닝 프로세스와 산업별 애플리케이션 - 위세아이텍 김종현 대표머신러닝 프로세스와 산업별 애플리케이션 - 위세아이텍 김종현 대표
머신러닝 프로세스와 산업별 애플리케이션 - 위세아이텍 김종현 대표
 
Lh smartcity for_osgeo
Lh smartcity for_osgeoLh smartcity for_osgeo
Lh smartcity for_osgeo
 
권기훈_개인포트폴리오
권기훈_개인포트폴리오권기훈_개인포트폴리오
권기훈_개인포트폴리오
 
인공지능-빅데이터연구센터[ABRC] 산학협력사례집
인공지능-빅데이터연구센터[ABRC] 산학협력사례집인공지능-빅데이터연구센터[ABRC] 산학협력사례집
인공지능-빅데이터연구센터[ABRC] 산학협력사례집
 
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기
 
빅데이터 솔루션 소개서(2013년 05월)
빅데이터 솔루션 소개서(2013년 05월)빅데이터 솔루션 소개서(2013년 05월)
빅데이터 솔루션 소개서(2013년 05월)
 
[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례
[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례
[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례
 
발표평가 앱·웹 김봉준
발표평가 앱·웹 김봉준발표평가 앱·웹 김봉준
발표평가 앱·웹 김봉준
 
Prediction of bus riders at the time of departure
Prediction of bus riders at the time of departurePrediction of bus riders at the time of departure
Prediction of bus riders at the time of departure
 
데이터드리븐 DX 추진방안_202306.pdf
데이터드리븐 DX 추진방안_202306.pdf데이터드리븐 DX 추진방안_202306.pdf
데이터드리븐 DX 추진방안_202306.pdf
 
[패스트캠퍼스] Outbrain Click Prediction
[패스트캠퍼스] Outbrain Click Prediction[패스트캠퍼스] Outbrain Click Prediction
[패스트캠퍼스] Outbrain Click Prediction
 
AWS Partner Techshift - (SaaS) 사업을 위한 데이터 기반 세일즈/마케팅 전략과 노하우 (트레져데이터 고영혁 수석)
AWS Partner Techshift - (SaaS) 사업을 위한 데이터 기반 세일즈/마케팅 전략과 노하우 (트레져데이터 고영혁 수석)AWS Partner Techshift - (SaaS) 사업을 위한 데이터 기반 세일즈/마케팅 전략과 노하우 (트레져데이터 고영혁 수석)
AWS Partner Techshift - (SaaS) 사업을 위한 데이터 기반 세일즈/마케팅 전략과 노하우 (트레져데이터 고영혁 수석)
 
공공데이터 개방현황 및 포털 발전방향
공공데이터 개방현황 및 포털 발전방향공공데이터 개방현황 및 포털 발전방향
공공데이터 개방현황 및 포털 발전방향
 

‘서울 어린이 대공원’의 기간별 주차장 이용 현황 분석

  • 1. 기간별 주차장 이용 데이터 분석을 통한 주차 가능 시간 예측 서비스 데만쥬 유희열, 이보민, 김기림, 송혜정
  • 2. 어린이 대공원 방문객의 편의를 증진시키기 위하여 2020년 1월 어린이 대공원 주차장 시간별 주차대수 예측 프로젝트 개요
  • 3. 1. 탐색적 데이터 분석 2. 데이터 전처리 3. 시행착오 4. 가설 설정 5. 결론
  • 4. 탐색적 데이터 분석 2017년(1월 1일 ~ 12월 31일) : 635,142건 2018년(1월 1일 ~ 1월 31일) : 33,828건 2019년(1월 1일 ~ 10월 25일) : 509,461건 년도별 데이터 개수 확인
  • 5. 5 탐색적 데이터 분석 정문 : 429,926건 후문 : 441,842건 구의문 : 304,794건 서버실 : 1,732건 사전무인 : 137건 입출구별 데이터 개수 확인
  • 6. 데이터 전처리 주차시간 분포 그래프를 참고하여 실 이용객 정의 - 주차시간 : 15분 초과, 780 미만 - 진입 시간 : 9시 이후 - 진출시간 : 22시 이전 위 조건의 차량들을 실 이용객으로 간주하여 아웃라이어 데이터 제거 (1307896건, 약 1.1%) 주차시간 이상치 데이터 제거 시설공단측 데이터 내용 확인 - 수동 출차 데이터(6130건) : 진입시각 + 주차시간(분) 으로 변환 - 주차중, 중복입차 데이터 제거 (1686건, 약 0.001%) 진출시각 이상치 데이터 변환, 제거
  • 7. 데이터 전처리 차량별 데이터를 시간대별 주차대수로 변환
  • 8. 시계열 분석 시계열 데이터라고 생각하고 시계열 분석을 시도했으나 의미 있는 모델링이 나오지 않음 Rolling Mean
  • 9. 이전 시점의 데이터가 이후 시점의 데이터에 영향을 직접적으로 주지 않음 시간에 따른 패턴은 있지만 시간에 따른 상호작용이 존재하지 않음 날씨 등의 외생변수에 의해 주차장 상황이 결정됨 2017년 데이터만 1월 ~ 12월 데이터가 모두 존재하기 때문에 1년 단위 계절성이 뚜렸한 데이터를 분석하기에는 부족함 EX) 저번주에 어린이대공원을 이용한 사람은 이번주에 이용하지 않는다는 등의 가설을 증명하기 어려움 시계열 분석이 어려운 이유
  • 10. 10 회귀분석 중심으로 계획 변경 외생변수가 되는 데이터들을 가져옴 날씨(기상청) 공휴일(공공데이터 포털) 미세먼지 모델링 선형회귀 Random Forest XGBoost
  • 11. datetime : 년-월-일-시각 year : 연도 month : 월 date : 날짜 weekday : 요일 count : 해당 시간에 주차되어 있던 차량 수 entrance : 입출구명 • 주차장 데이터 temp : 기온 rain_snow : 강수량 + 적설량 snowfall : 적설량 rainfall : 강수량 windspeed : 풍량 humidity : 습도 sun : 일사량 • 날씨 데이터 dateName : 공휴일 이름 locdate : 공휴일 날짜 weekend : 주말 free_day : 주말 + 공휴일 season : 계절 • 휴일 데이터 데이터셋
  • 12. sun, humidity, windspeed, temp, hour, free_day, weekend, weekday 예외 free_day와 weekday, weekend는 0.76, 0.91로 다중공선성이 확인됨 free_day만 피쳐로 사용 상관관계가 큰 컬럼 칼럼별 상관관계
  • 13. 2017년 10월 데이터 이상치 확인 2017년 10월에는 약 10일 간의 추석 연휴 2018년 2월 ~ 12월 데이터 존재하지 않음 2017년 10월 이상치 확인 월별 평균 차량 대수 분포(주말 / 평일)
  • 14. 2017년 데이터만 유일하게 1년치 데이터가 모두 존재하므로, 2017년 데이터를 기준으로 training 셋을 만들어 2018년 1월과 2019년 데이터를 예측하는 모델 개발 시도 2018년, 2019년 데이터 예측모델 개발 선형 회귀 모델링
  • 15. 그 외 시도들 유동인구 데이터를 사용하여 해당 문제가 주변 공간에 미치는 영향 분석 시도 -> 광진구 전체의 유동인구 데이터만 존재하기에 구역별 혼잡도 등을 분석할 수 없음 어린이 대공원 이벤트별 입장객 수를 분석해 어린이 대공원의 방문 목적 분석을 시도 -> 상상나라 측 입장객 수 자료를 요청했으나 관할이 달라 제공받지 못함 다이나믹 프라이스를 통해 주차난 해결 아이디어 제안 -> 국가 시설이기때문에 가격을 동적으로 변동할 수 없었음
  • 16. 데이터에서 발견한 것 2019년 9월 8일 12시에 나간 185대의 차량 16
  • 17. 17 어린이 대공원 주차장과 관련한 네이버 블로그 글들 분석 1. 주변 공용주차장들에 대한 정보 (광진광장 공영주차장, 세종대학교 주차장, 능동 공영주차장) 2. 입장료나 주차비를 받았으면 좋겠다는 의견 다수
  • 18. 주변 공용주차장을 도는 셔틀 버스 시행 후문 주차장과 구의문 주차장 이름 변경 '놀이공원 주차장', '동물원 주차장'으로 변경(혹은 병기)