[부스트캠프 Tech Talk] 구건모_모델링 자동화와 실험 검증 전략

CONNECT FOUNDATION
CONNECT FOUNDATIONCONNECT FOUNDATION
모델링 자동화와 실험 검증 전략
구건모
# RAY[TUNE] #WANDB #SLACK-BOT #JSON
부스트캠프 AI Tech <Tech Talk>
목차
• 모델링 자동화
• 모델링 자동화란?
• 모델링 자동화의 장점
• 실험 검증 전략
• 하이퍼 파라미터 검증 전략
• 학습 검증 전략 (1) - 학습 곡선
• 학습 검증 전략 (2) - 시각화
• 실험 공유를 통한 검증 전략 부스트캠프 AI Tech <Tech Talk>
2/
모델링 자동화란?
• Key 를 사용하여
부스트캠프 AI Tech <Tech Talk>
3/
모델링 자동화란?
• Key 를 사용하여
• Value 에 해당하는
부스트캠프 AI Tech <Tech Talk>
4/
모델링 자동화란?
• Key 를 사용하여
• Value 에 해당하는
• Modeling 을 수행
• train
• evaluate
부스트캠프 AI Tech <Tech Talk>
5/
모델링 자동화란?
• Key 를 사용하여
• Value 에 해당하는
• Modeling 을 수행
• Config 파일로 통제되는 환경
부스트캠프 AI Tech <Tech Talk>
6/
모델링 자동화란?
• Key 를 사용하여
• Value 에 해당하는
• Modeling 을 수행
• Config 파일로 통제되는 환경
• 한 개 Config이 모델 한 개를 모델링
부스트캠프 AI Tech <Tech Talk>
7/
모델링 자동화의 장점
• 다양한 실험 을 간편하게 할 수 있다.
• retriver_name : "TFIDF"
• retriver_name : "BM25"
• retriver_name : "DPRKOBERT"
• ST00.json, ST01.json, ST02.json
부스트캠프 AI Tech <Tech Talk>
8/
모델링 자동화의 장점
• 다양한 실험 을 간편하게 할 수 있다.
• 코드의 가독성 이 좋아진다.
• 추상화를 필연적으로 해야한다.
부스트캠프 AI Tech <Tech Talk>
9/
모델링 자동화의 장점
• 다양한 실험 을 간편하게 할 수 있다.
• 코드의 가독성 이 좋아진다.
• 추상화를 필연적으로 해야한다.
• 코드 효율이 좋아진다.
부스트캠프 AI Tech <Tech Talk>
10/
모델링 자동화의 장점
• 다양한 실험 을 간편하게 할 수 있다.
• 코드의 가독성 이 좋아진다.
• 안전한 기능 추가 가 가능하다.
• Key로 판단
• Key Default값 존재
• args.path
부스트캠프 AI Tech <Tech Talk>
11/
실험 검증 전략
• 모델링을 잘 했다고 성능이 좋지는 않다.
• 다만 다양한 실험을 쉽게 할 수 있을 뿐..
• 다양한 실험을 진행하면서 검증을 해야 된다.
• 이 실험이 정말 유의미한지
부스트캠프 AI Tech <Tech Talk>
12/
실험 검증 전략
• 실험을 진행하면서 들었던 의문점들
• 좋은 하이퍼파라미터 는 어떻게 찾아야 될까?
• 모델이 내가 원하는 대로 동작 을 하는 건가?
• A Seed와 B Seed에서 결과가 다른데 어떻게 판단을 해야 할까?
부스트캠프 AI Tech <Tech Talk>
13/
하이퍼파라미터 검증 전략
• 좋은 하이퍼파라미터 찾기는 굉장히 어렵습니다.
• 학습이 잘 안 될 경우
• 코드 문제인가?
• 눈에 보이는 오류가 아니라서 더 어렵습니다.
• 학습이 잘 될 경우
• 더 좋은 하이퍼파라미터가 있지 않을까?
부스트캠프 AI Tech <Tech Talk>
14/
하이퍼파라미터 검증 전략
• 제가 원하는 것은 최고의 하이퍼파라미터
• 첫 번째 스테이지에서 LB Score를 높이기 위해서
• 큰 변화 없는데 하이퍼 파라미터만 만지작.. 만지작..
• 그렇게 2주가 지나고
부스트캠프 AI Tech <Tech Talk>
15/
하이퍼파라미터 검증 전략
• 제가 원하는 것은 최고의 하이퍼파라미터
• 첫 번째 스테이지에서 LB Score를 높이기 위해서
• 큰 변화 없는데 하이퍼 파라미터만 만지작.. 만지작..
• 그렇게 2주가 지나고
• 이렇게 하면 안되겠다
부스트캠프 AI Tech <Tech Talk>
16/
하이퍼파라미터 검증 전략
• 필요한 것은 탄탄한 지식과 최적화 알고리즘
• Search Space를 잘~ 설정하는데 탄탄한 지식이 필요합니다.
부스트캠프 AI Tech <Tech Talk>
17/
하이퍼파라미터 검증 전략
• MSE Loss : 3.78
• 산술 계산해서 나오는 값?
• Likelihood를 최적화 하는 통계량
• 모수와의 거리
부스트캠프 AI Tech <Tech Talk>
18/
하이퍼파라미터 검증 전략
• Focal과 Cross Entropy
• Focal : [0.7 0.3]의 Confidence로 Acc 100%
• CE : [0.7 0.3]의 Confidence로 Acc 100%
부스트캠프 AI Tech <Tech Talk>
19/
하이퍼파라미터 검증 전략
• Learning Rate, Batch Size
• Gradient 벡터의 크기와 방향
부스트캠프 AI Tech <Tech Talk>
20/
하이퍼파라미터 검증 전략
• 지식과 경험이 부족하면 발생하는 일
• 4일 내내 BERT 하이퍼파라미터 이슈로 고생한다.
• 3일 동안 코드만 고쳤다.
부스트캠프 AI Tech <Tech Talk>
21/
하이퍼파라미터 검증 전략
• 최적화 알고리즘의 하이퍼파라미터
• Search Space 정의
• 하이퍼파라미터 최적화
• RAY[TUNE]
부스트캠프 AI Tech <Tech Talk>
22/
하이퍼파라미터 검증 전략
• 알고리즘은 뭐를 사용해야 할까?
• Sequential Optimisation
• Parallel Random Search
• Parallel Grid Search
• Population Based Training
부스트캠프 AI Tech <Tech Talk>
23/
하이퍼파라미터 검증 전략
Sequential Optimisation
• 학습하고 체크하고.. 학습하고..
• 저비용, 많은 시간 소요
부스트캠프 AI Tech <Tech Talk>
24/
하이퍼파라미터 검증 전략
Parallel Random/Grid Search
• 경우의 수가 굉장히 많다.
• 고 비용, 적은 시간 소요
부스트캠프 AI Tech <Tech Talk>
25/
하이퍼파라미터 검증 전략
Population Based Training
• 두 방법을 결합한 새로운 방법
• 저비용, 적은 시간 소요
• Exploit ­ 성능이 안 좋은 모델 대체
• Explore ­ perturbations 이후 학습
부스트캠프 AI Tech <Tech Talk>
26/
하이퍼파라미터 검증 전략
Population Based Training
• 단점은 많은 디스크 용량을 필요로 한다.
• Exploit 과정을 하기 위해서
• N개의 모델을 Checkpoint에 저장
• Gpu와 디스크 용량만 많다면
좋은 알고리즘
부스트캠프 AI Tech <Tech Talk>
27/
학습 검증 전략 (1) - 학습 곡선
• 과대 적합, 과소 적합을 판단하기에 가장 좋다.
부스트캠프 AI Tech <Tech Talk>
28/
학습 검증 전략 (1) - 학습 곡선
• WANDB
부스트캠프 AI Tech <Tech Talk>
29/
학습 검증 전략 (1) - 학습 곡선
• A Seed와 B Seed에서 결과가 다른데 어떻게 판단을 해야 할까?
• N번 돌린다음 모델의 성능 지표의 평균 값으로 판단을 하자.
부스트캠프 AI Tech <Tech Talk>
30/
학습 검증 전략 (2) - 시각화
• 학습 곡선만으로는 부족하다.
• 시각화
• 모델을 분석하는데 도움이 된다.
• 잘 만들어 놓으면 재사용이 용이하다.
부스트캠프 AI Tech <Tech Talk>
31/
학습 검증 전략 (2) - 시각화
• 시각화의 좋은 예
• 분석 할 때 좋은 시각화
• 결과 분석이 가능한 시각화
• 전체를 대상 으로 하는 시각화
부스트캠프 AI Tech <Tech Talk>
32/
학습 검증 전략 (2) - 시각화
• 시각화의 좋은 예
• 분석 할 때 좋은 시각화
• 결과 분석이 가능한 시각화
• 전체를 대상 으로 하는 시각화
• 모델들 간의 우위를 볼 수 있는 시각화
• Competition에 큰 도움이 됐다.
부스트캠프 AI Tech <Tech Talk>
33/
학습 검증 전략 (2) - 시각화
• 시각화의 나쁜 예
• 분석 할 때 나쁜 시각화
• 어딜 보고 예측하는 거니..?
• 하나를 대상 으로 하는 시각화
부스트캠프 AI Tech <Tech Talk>
34/
학습 검증 전략 (2) - 시각화
• 시각화의 나쁜 예
• 분석 할 때 나쁜 시각화
• 어딜 보고 예측하는 거니..?
• 하나를 대상 으로 하는 시각화
부스트캠프 AI Tech <Tech Talk>
35/
실험 공유를 통한 검증 전략
• 공유를 하면 자동으로 검증 이 되는 전략
• 모델링에 공유 기능을 추가 하면 효율이 좋다
부스트캠프 AI Tech <Tech Talk>
36/
실험 공유를 통한 검증 전략
부스트캠프 AI Tech <Tech Talk>
37/
Q&A
부스트캠프 AI Tech <Tech Talk>
38/
감사합니다
부스트캠프 AI Tech <Tech Talk>
39/
1 von 39

Recomendados

프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트 von
프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트
프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트Minho Lee
3K views22 Folien
[부스트캠프 Tech Talk] 김제우_짝코딩(Pair Programming) von
[부스트캠프 Tech Talk] 김제우_짝코딩(Pair Programming)[부스트캠프 Tech Talk] 김제우_짝코딩(Pair Programming)
[부스트캠프 Tech Talk] 김제우_짝코딩(Pair Programming)CONNECT FOUNDATION
185 views26 Folien
테스트 기발 개발, TBD(Test based developement) von
테스트 기발 개발, TBD(Test based developement)테스트 기발 개발, TBD(Test based developement)
테스트 기발 개발, TBD(Test based developement)도형 임
1.1K views109 Folien
애자일 도입과 사례 공유 von
애자일 도입과 사례 공유애자일 도입과 사례 공유
애자일 도입과 사례 공유agilekorea
7.4K views55 Folien
TDD - 테스트 주도로 개발하기 von
TDD - 테스트 주도로 개발하기TDD - 테스트 주도로 개발하기
TDD - 테스트 주도로 개발하기현승 배
86 views26 Folien
Java 그쪽 동네는 von
Java 그쪽 동네는Java 그쪽 동네는
Java 그쪽 동네는도형 임
1.5K views24 Folien

Más contenido relacionado

Similar a [부스트캠프 Tech Talk] 구건모_모델링 자동화와 실험 검증 전략

KGC 2014, 'Software Enginner in Test' in Game Development (Bluehole Studio) von
KGC 2014, 'Software Enginner in Test' in Game Development (Bluehole Studio)KGC 2014, 'Software Enginner in Test' in Game Development (Bluehole Studio)
KGC 2014, 'Software Enginner in Test' in Game Development (Bluehole Studio)Sungmin Kim
4.5K views73 Folien
분석과 설계 von
분석과 설계분석과 설계
분석과 설계Haeil Yi
6.2K views89 Folien
T ka kr_4th von
T ka kr_4thT ka kr_4th
T ka kr_4thSubin An
468 views65 Folien
발표자료 1인qa로살아남는6가지방법 von
발표자료 1인qa로살아남는6가지방법발표자료 1인qa로살아남는6가지방법
발표자료 1인qa로살아남는6가지방법SangIn Choung
5.9K views41 Folien
모바일 앱 개발을 위한 Agile 적용 von
모바일 앱 개발을 위한 Agile 적용모바일 앱 개발을 위한 Agile 적용
모바일 앱 개발을 위한 Agile 적용Kevin Kim
8.3K views75 Folien
Chapter 11 Practical Methodology von
Chapter 11 Practical MethodologyChapter 11 Practical Methodology
Chapter 11 Practical MethodologyKyeongUkJang
61 views38 Folien

Similar a [부스트캠프 Tech Talk] 구건모_모델링 자동화와 실험 검증 전략(20)

KGC 2014, 'Software Enginner in Test' in Game Development (Bluehole Studio) von Sungmin Kim
KGC 2014, 'Software Enginner in Test' in Game Development (Bluehole Studio)KGC 2014, 'Software Enginner in Test' in Game Development (Bluehole Studio)
KGC 2014, 'Software Enginner in Test' in Game Development (Bluehole Studio)
Sungmin Kim4.5K views
분석과 설계 von Haeil Yi
분석과 설계분석과 설계
분석과 설계
Haeil Yi6.2K views
T ka kr_4th von Subin An
T ka kr_4thT ka kr_4th
T ka kr_4th
Subin An468 views
발표자료 1인qa로살아남는6가지방법 von SangIn Choung
발표자료 1인qa로살아남는6가지방법발표자료 1인qa로살아남는6가지방법
발표자료 1인qa로살아남는6가지방법
SangIn Choung5.9K views
모바일 앱 개발을 위한 Agile 적용 von Kevin Kim
모바일 앱 개발을 위한 Agile 적용모바일 앱 개발을 위한 Agile 적용
모바일 앱 개발을 위한 Agile 적용
Kevin Kim8.3K views
Chapter 11 Practical Methodology von KyeongUkJang
Chapter 11 Practical MethodologyChapter 11 Practical Methodology
Chapter 11 Practical Methodology
KyeongUkJang61 views
개발이 테스트를 만났을 때(Shift left testing) von SangIn Choung
개발이 테스트를 만났을 때(Shift left testing)개발이 테스트를 만났을 때(Shift left testing)
개발이 테스트를 만났을 때(Shift left testing)
SangIn Choung3.7K views
Clova Tech Summit 2: 대화모델 엔진 구조와 Chatbot 개발 최적화 방안 von Clova Platform
Clova Tech Summit 2: 대화모델 엔진 구조와 Chatbot 개발 최적화 방안Clova Tech Summit 2: 대화모델 엔진 구조와 Chatbot 개발 최적화 방안
Clova Tech Summit 2: 대화모델 엔진 구조와 Chatbot 개발 최적화 방안
Clova Platform2.2K views
Diquest 김경선 엔터프라이즈 검색에 적합한 von s song
Diquest 김경선 엔터프라이즈 검색에 적합한 Diquest 김경선 엔터프라이즈 검색에 적합한
Diquest 김경선 엔터프라이즈 검색에 적합한
s song65 views
애자일과 애자일 테스트 소개 (테스트기본교육 3장 2절) von SangIn Choung
애자일과 애자일 테스트 소개 (테스트기본교육 3장 2절)애자일과 애자일 테스트 소개 (테스트기본교육 3장 2절)
애자일과 애자일 테스트 소개 (테스트기본교육 3장 2절)
SangIn Choung3.6K views
SAYAHAE - 상품평 분석 및 추천 서비스 (자연어 처리) von Eunchan Lee
SAYAHAE - 상품평 분석 및 추천 서비스 (자연어 처리)SAYAHAE - 상품평 분석 및 추천 서비스 (자연어 처리)
SAYAHAE - 상품평 분석 및 추천 서비스 (자연어 처리)
Eunchan Lee1.2K views
Designing Effective Interview Chatbots: Automatic Chatbot Profiling and Desig... von 박 상아
Designing Effective Interview Chatbots: Automatic Chatbot Profiling and Desig...Designing Effective Interview Chatbots: Automatic Chatbot Profiling and Desig...
Designing Effective Interview Chatbots: Automatic Chatbot Profiling and Desig...
박 상아149 views
Bert3q KorQuAD Finetuning NLP Challenge von OverDeep
Bert3q KorQuAD Finetuning NLP ChallengeBert3q KorQuAD Finetuning NLP Challenge
Bert3q KorQuAD Finetuning NLP Challenge
OverDeep71 views
애자일 스크럼과 JIRA von Terry Cho
애자일 스크럼과 JIRA 애자일 스크럼과 JIRA
애자일 스크럼과 JIRA
Terry Cho45.7K views
애자일 개발 프로세스를 이용한 고품질 소프트웨어 개발 von Jaehoon Oh
애자일 개발 프로세스를 이용한 고품질 소프트웨어 개발애자일 개발 프로세스를 이용한 고품질 소프트웨어 개발
애자일 개발 프로세스를 이용한 고품질 소프트웨어 개발
Jaehoon Oh6.5K views
(독서광) 인공지능 소프트웨어 품질 보증을 위한 테스트 기법 von Jay Park
(독서광) 인공지능 소프트웨어  품질 보증을 위한 테스트 기법(독서광) 인공지능 소프트웨어  품질 보증을 위한 테스트 기법
(독서광) 인공지능 소프트웨어 품질 보증을 위한 테스트 기법
Jay Park1.1K views
역삼역, 이마트 AI_v최종.pdf von DeukJin Jeon
역삼역, 이마트 AI_v최종.pdf역삼역, 이마트 AI_v최종.pdf
역삼역, 이마트 AI_v최종.pdf
DeukJin Jeon941 views
기계독해를 위한 BERT 언어처리 모델 활용 von Kenneth Jung
기계독해를 위한 BERT 언어처리 모델 활용기계독해를 위한 BERT 언어처리 모델 활용
기계독해를 위한 BERT 언어처리 모델 활용
Kenneth Jung2.5K views
Coding interview von Soohan Ahn
Coding interviewCoding interview
Coding interview
Soohan Ahn409 views

Más de CONNECT FOUNDATION

부스트캠프 웹・모바일 8기 설명회 (2023년) von
부스트캠프 웹・모바일 8기 설명회 (2023년)부스트캠프 웹・모바일 8기 설명회 (2023년)
부스트캠프 웹・모바일 8기 설명회 (2023년)CONNECT FOUNDATION
2.5K views41 Folien
[부스트캠프 웹・모바일 7기 Tech Talk]임현택_OS 그냥 재미로 von
[부스트캠프 웹・모바일 7기 Tech Talk]임현택_OS 그냥 재미로[부스트캠프 웹・모바일 7기 Tech Talk]임현택_OS 그냥 재미로
[부스트캠프 웹・모바일 7기 Tech Talk]임현택_OS 그냥 재미로CONNECT FOUNDATION
73 views28 Folien
[부스트캠프 웹・모바일 7기 Tech Talk]이지훈_뉴비의 시점에서 바라본 Kotlin_suspend von
[부스트캠프 웹・모바일 7기 Tech Talk]이지훈_뉴비의 시점에서 바라본 Kotlin_suspend[부스트캠프 웹・모바일 7기 Tech Talk]이지훈_뉴비의 시점에서 바라본 Kotlin_suspend
[부스트캠프 웹・모바일 7기 Tech Talk]이지훈_뉴비의 시점에서 바라본 Kotlin_suspendCONNECT FOUNDATION
85 views30 Folien
[부스트캠프 웹・모바일 7기 Tech Talk]오승민_Swift의 Protocol에는 감동이 있다 von
[부스트캠프 웹・모바일 7기 Tech Talk]오승민_Swift의 Protocol에는 감동이 있다[부스트캠프 웹・모바일 7기 Tech Talk]오승민_Swift의 Protocol에는 감동이 있다
[부스트캠프 웹・모바일 7기 Tech Talk]오승민_Swift의 Protocol에는 감동이 있다CONNECT FOUNDATION
40 views48 Folien
[부스트캠프 웹・모바일 7기 Tech Talk]안병준_프론트엔드,어쩌다 여기까지 von
[부스트캠프 웹・모바일 7기 Tech Talk]안병준_프론트엔드,어쩌다 여기까지[부스트캠프 웹・모바일 7기 Tech Talk]안병준_프론트엔드,어쩌다 여기까지
[부스트캠프 웹・모바일 7기 Tech Talk]안병준_프론트엔드,어쩌다 여기까지CONNECT FOUNDATION
52 views21 Folien
[부스트캠프 웹・모바일 7기 Tech Talk]이휘찬-의존성 관리 어디까지 알고있니 von
[부스트캠프 웹・모바일 7기 Tech Talk]이휘찬-의존성 관리 어디까지 알고있니[부스트캠프 웹・모바일 7기 Tech Talk]이휘찬-의존성 관리 어디까지 알고있니
[부스트캠프 웹・모바일 7기 Tech Talk]이휘찬-의존성 관리 어디까지 알고있니CONNECT FOUNDATION
53 views40 Folien

Más de CONNECT FOUNDATION(20)

부스트캠프 웹・모바일 8기 설명회 (2023년) von CONNECT FOUNDATION
부스트캠프 웹・모바일 8기 설명회 (2023년)부스트캠프 웹・모바일 8기 설명회 (2023년)
부스트캠프 웹・모바일 8기 설명회 (2023년)
CONNECT FOUNDATION2.5K views
[부스트캠프 웹・모바일 7기 Tech Talk]임현택_OS 그냥 재미로 von CONNECT FOUNDATION
[부스트캠프 웹・모바일 7기 Tech Talk]임현택_OS 그냥 재미로[부스트캠프 웹・모바일 7기 Tech Talk]임현택_OS 그냥 재미로
[부스트캠프 웹・모바일 7기 Tech Talk]임현택_OS 그냥 재미로
[부스트캠프 웹・모바일 7기 Tech Talk]이지훈_뉴비의 시점에서 바라본 Kotlin_suspend von CONNECT FOUNDATION
[부스트캠프 웹・모바일 7기 Tech Talk]이지훈_뉴비의 시점에서 바라본 Kotlin_suspend[부스트캠프 웹・모바일 7기 Tech Talk]이지훈_뉴비의 시점에서 바라본 Kotlin_suspend
[부스트캠프 웹・모바일 7기 Tech Talk]이지훈_뉴비의 시점에서 바라본 Kotlin_suspend
[부스트캠프 웹・모바일 7기 Tech Talk]오승민_Swift의 Protocol에는 감동이 있다 von CONNECT FOUNDATION
[부스트캠프 웹・모바일 7기 Tech Talk]오승민_Swift의 Protocol에는 감동이 있다[부스트캠프 웹・모바일 7기 Tech Talk]오승민_Swift의 Protocol에는 감동이 있다
[부스트캠프 웹・모바일 7기 Tech Talk]오승민_Swift의 Protocol에는 감동이 있다
[부스트캠프 웹・모바일 7기 Tech Talk]안병준_프론트엔드,어쩌다 여기까지 von CONNECT FOUNDATION
[부스트캠프 웹・모바일 7기 Tech Talk]안병준_프론트엔드,어쩌다 여기까지[부스트캠프 웹・모바일 7기 Tech Talk]안병준_프론트엔드,어쩌다 여기까지
[부스트캠프 웹・모바일 7기 Tech Talk]안병준_프론트엔드,어쩌다 여기까지
[부스트캠프 웹・모바일 7기 Tech Talk]이휘찬-의존성 관리 어디까지 알고있니 von CONNECT FOUNDATION
[부스트캠프 웹・모바일 7기 Tech Talk]이휘찬-의존성 관리 어디까지 알고있니[부스트캠프 웹・모바일 7기 Tech Talk]이휘찬-의존성 관리 어디까지 알고있니
[부스트캠프 웹・모바일 7기 Tech Talk]이휘찬-의존성 관리 어디까지 알고있니
[부스트캠프 웹・모바일 7기 Tech Talk]박명범_RecyclerView는 어떻게 재활용하는가 von CONNECT FOUNDATION
[부스트캠프 웹・모바일 7기 Tech Talk]박명범_RecyclerView는  어떻게  재활용하는가[부스트캠프 웹・모바일 7기 Tech Talk]박명범_RecyclerView는  어떻게  재활용하는가
[부스트캠프 웹・모바일 7기 Tech Talk]박명범_RecyclerView는 어떻게 재활용하는가
CONNECT FOUNDATION152 views
[부스트캠프 웹・모바일 7기 Tech Talk]김지원_너와 나의 함수형 프로그래밍 von CONNECT FOUNDATION
[부스트캠프 웹・모바일 7기 Tech Talk]김지원_너와 나의 함수형 프로그래밍[부스트캠프 웹・모바일 7기 Tech Talk]김지원_너와 나의 함수형 프로그래밍
[부스트캠프 웹・모바일 7기 Tech Talk]김지원_너와 나의 함수형 프로그래밍
[부스트캠프 웹・모바일 7기 Tech Talk]김성은_Recoil von CONNECT FOUNDATION
[부스트캠프 웹・모바일 7기 Tech Talk]김성은_Recoil[부스트캠프 웹・모바일 7기 Tech Talk]김성은_Recoil
[부스트캠프 웹・모바일 7기 Tech Talk]김성은_Recoil
[부스트캠프 웹・모바일 7기 Tech Talk]고병학_WWDC 뭘 볼까 von CONNECT FOUNDATION
[부스트캠프 웹・모바일 7기 Tech Talk]고병학_WWDC 뭘 볼까[부스트캠프 웹・모바일 7기 Tech Talk]고병학_WWDC 뭘 볼까
[부스트캠프 웹・모바일 7기 Tech Talk]고병학_WWDC 뭘 볼까
[특강] 개발자의 학습과 성장 / 이선협 (Cobalt, Inc.) von CONNECT FOUNDATION
[특강] 개발자의 학습과 성장 / 이선협 (Cobalt, Inc.)[특강] 개발자의 학습과 성장 / 이선협 (Cobalt, Inc.)
[특강] 개발자의 학습과 성장 / 이선협 (Cobalt, Inc.)
[특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노수진(Momenti) von CONNECT FOUNDATION
 [특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노수진(Momenti) [특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노수진(Momenti)
[특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노수진(Momenti)
CONNECT FOUNDATION227 views
[특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노현석(카카오뱅크) von CONNECT FOUNDATION
[특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노현석(카카오뱅크)[특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노현석(카카오뱅크)
[특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노현석(카카오뱅크)
CONNECT FOUNDATION152 views
부스트캠프 웹∙모바일 7기 설명회 von CONNECT FOUNDATION
부스트캠프 웹∙모바일 7기 설명회부스트캠프 웹∙모바일 7기 설명회
부스트캠프 웹∙모바일 7기 설명회
CONNECT FOUNDATION393 views
[부스트캠프 Tech Talk] 배지연_Structure of Model and Task von CONNECT FOUNDATION
[부스트캠프 Tech Talk] 배지연_Structure of Model and Task[부스트캠프 Tech Talk] 배지연_Structure of Model and Task
[부스트캠프 Tech Talk] 배지연_Structure of Model and Task
CONNECT FOUNDATION257 views
[부스트캠프 Tech Talk] 신원지_Wandb Visualization von CONNECT FOUNDATION
[부스트캠프 Tech Talk] 신원지_Wandb Visualization[부스트캠프 Tech Talk] 신원지_Wandb Visualization
[부스트캠프 Tech Talk] 신원지_Wandb Visualization
CONNECT FOUNDATION352 views
[부스트캠프 Tech Talk] 김동현_리팩터링을 통한 내실 다지기 von CONNECT FOUNDATION
[부스트캠프 Tech Talk] 김동현_리팩터링을 통한 내실 다지기[부스트캠프 Tech Talk] 김동현_리팩터링을 통한 내실 다지기
[부스트캠프 Tech Talk] 김동현_리팩터링을 통한 내실 다지기
CONNECT FOUNDATION100 views
[부스트캠프 Tech Talk] 진명훈_datasets로 협업하기 von CONNECT FOUNDATION
[부스트캠프 Tech Talk] 진명훈_datasets로 협업하기[부스트캠프 Tech Talk] 진명훈_datasets로 협업하기
[부스트캠프 Tech Talk] 진명훈_datasets로 협업하기
CONNECT FOUNDATION1.5K views
[부스트캠프 Tech Talk] 안영진_Tackling Complexity with Easy Stuff von CONNECT FOUNDATION
[부스트캠프 Tech Talk] 안영진_Tackling Complexity with Easy Stuff[부스트캠프 Tech Talk] 안영진_Tackling Complexity with Easy Stuff
[부스트캠프 Tech Talk] 안영진_Tackling Complexity with Easy Stuff
[부스트캠프 Tech talk] 황우진 딥러닝 가볍게 구현해보기 von CONNECT FOUNDATION
[부스트캠프 Tech talk] 황우진  딥러닝 가볍게 구현해보기[부스트캠프 Tech talk] 황우진  딥러닝 가볍게 구현해보기
[부스트캠프 Tech talk] 황우진 딥러닝 가볍게 구현해보기
CONNECT FOUNDATION136 views

[부스트캠프 Tech Talk] 구건모_모델링 자동화와 실험 검증 전략

  • 1. 모델링 자동화와 실험 검증 전략 구건모 # RAY[TUNE] #WANDB #SLACK-BOT #JSON 부스트캠프 AI Tech <Tech Talk>
  • 2. 목차 • 모델링 자동화 • 모델링 자동화란? • 모델링 자동화의 장점 • 실험 검증 전략 • 하이퍼 파라미터 검증 전략 • 학습 검증 전략 (1) - 학습 곡선 • 학습 검증 전략 (2) - 시각화 • 실험 공유를 통한 검증 전략 부스트캠프 AI Tech <Tech Talk> 2/
  • 3. 모델링 자동화란? • Key 를 사용하여 부스트캠프 AI Tech <Tech Talk> 3/
  • 4. 모델링 자동화란? • Key 를 사용하여 • Value 에 해당하는 부스트캠프 AI Tech <Tech Talk> 4/
  • 5. 모델링 자동화란? • Key 를 사용하여 • Value 에 해당하는 • Modeling 을 수행 • train • evaluate 부스트캠프 AI Tech <Tech Talk> 5/
  • 6. 모델링 자동화란? • Key 를 사용하여 • Value 에 해당하는 • Modeling 을 수행 • Config 파일로 통제되는 환경 부스트캠프 AI Tech <Tech Talk> 6/
  • 7. 모델링 자동화란? • Key 를 사용하여 • Value 에 해당하는 • Modeling 을 수행 • Config 파일로 통제되는 환경 • 한 개 Config이 모델 한 개를 모델링 부스트캠프 AI Tech <Tech Talk> 7/
  • 8. 모델링 자동화의 장점 • 다양한 실험 을 간편하게 할 수 있다. • retriver_name : "TFIDF" • retriver_name : "BM25" • retriver_name : "DPRKOBERT" • ST00.json, ST01.json, ST02.json 부스트캠프 AI Tech <Tech Talk> 8/
  • 9. 모델링 자동화의 장점 • 다양한 실험 을 간편하게 할 수 있다. • 코드의 가독성 이 좋아진다. • 추상화를 필연적으로 해야한다. 부스트캠프 AI Tech <Tech Talk> 9/
  • 10. 모델링 자동화의 장점 • 다양한 실험 을 간편하게 할 수 있다. • 코드의 가독성 이 좋아진다. • 추상화를 필연적으로 해야한다. • 코드 효율이 좋아진다. 부스트캠프 AI Tech <Tech Talk> 10/
  • 11. 모델링 자동화의 장점 • 다양한 실험 을 간편하게 할 수 있다. • 코드의 가독성 이 좋아진다. • 안전한 기능 추가 가 가능하다. • Key로 판단 • Key Default값 존재 • args.path 부스트캠프 AI Tech <Tech Talk> 11/
  • 12. 실험 검증 전략 • 모델링을 잘 했다고 성능이 좋지는 않다. • 다만 다양한 실험을 쉽게 할 수 있을 뿐.. • 다양한 실험을 진행하면서 검증을 해야 된다. • 이 실험이 정말 유의미한지 부스트캠프 AI Tech <Tech Talk> 12/
  • 13. 실험 검증 전략 • 실험을 진행하면서 들었던 의문점들 • 좋은 하이퍼파라미터 는 어떻게 찾아야 될까? • 모델이 내가 원하는 대로 동작 을 하는 건가? • A Seed와 B Seed에서 결과가 다른데 어떻게 판단을 해야 할까? 부스트캠프 AI Tech <Tech Talk> 13/
  • 14. 하이퍼파라미터 검증 전략 • 좋은 하이퍼파라미터 찾기는 굉장히 어렵습니다. • 학습이 잘 안 될 경우 • 코드 문제인가? • 눈에 보이는 오류가 아니라서 더 어렵습니다. • 학습이 잘 될 경우 • 더 좋은 하이퍼파라미터가 있지 않을까? 부스트캠프 AI Tech <Tech Talk> 14/
  • 15. 하이퍼파라미터 검증 전략 • 제가 원하는 것은 최고의 하이퍼파라미터 • 첫 번째 스테이지에서 LB Score를 높이기 위해서 • 큰 변화 없는데 하이퍼 파라미터만 만지작.. 만지작.. • 그렇게 2주가 지나고 부스트캠프 AI Tech <Tech Talk> 15/
  • 16. 하이퍼파라미터 검증 전략 • 제가 원하는 것은 최고의 하이퍼파라미터 • 첫 번째 스테이지에서 LB Score를 높이기 위해서 • 큰 변화 없는데 하이퍼 파라미터만 만지작.. 만지작.. • 그렇게 2주가 지나고 • 이렇게 하면 안되겠다 부스트캠프 AI Tech <Tech Talk> 16/
  • 17. 하이퍼파라미터 검증 전략 • 필요한 것은 탄탄한 지식과 최적화 알고리즘 • Search Space를 잘~ 설정하는데 탄탄한 지식이 필요합니다. 부스트캠프 AI Tech <Tech Talk> 17/
  • 18. 하이퍼파라미터 검증 전략 • MSE Loss : 3.78 • 산술 계산해서 나오는 값? • Likelihood를 최적화 하는 통계량 • 모수와의 거리 부스트캠프 AI Tech <Tech Talk> 18/
  • 19. 하이퍼파라미터 검증 전략 • Focal과 Cross Entropy • Focal : [0.7 0.3]의 Confidence로 Acc 100% • CE : [0.7 0.3]의 Confidence로 Acc 100% 부스트캠프 AI Tech <Tech Talk> 19/
  • 20. 하이퍼파라미터 검증 전략 • Learning Rate, Batch Size • Gradient 벡터의 크기와 방향 부스트캠프 AI Tech <Tech Talk> 20/
  • 21. 하이퍼파라미터 검증 전략 • 지식과 경험이 부족하면 발생하는 일 • 4일 내내 BERT 하이퍼파라미터 이슈로 고생한다. • 3일 동안 코드만 고쳤다. 부스트캠프 AI Tech <Tech Talk> 21/
  • 22. 하이퍼파라미터 검증 전략 • 최적화 알고리즘의 하이퍼파라미터 • Search Space 정의 • 하이퍼파라미터 최적화 • RAY[TUNE] 부스트캠프 AI Tech <Tech Talk> 22/
  • 23. 하이퍼파라미터 검증 전략 • 알고리즘은 뭐를 사용해야 할까? • Sequential Optimisation • Parallel Random Search • Parallel Grid Search • Population Based Training 부스트캠프 AI Tech <Tech Talk> 23/
  • 24. 하이퍼파라미터 검증 전략 Sequential Optimisation • 학습하고 체크하고.. 학습하고.. • 저비용, 많은 시간 소요 부스트캠프 AI Tech <Tech Talk> 24/
  • 25. 하이퍼파라미터 검증 전략 Parallel Random/Grid Search • 경우의 수가 굉장히 많다. • 고 비용, 적은 시간 소요 부스트캠프 AI Tech <Tech Talk> 25/
  • 26. 하이퍼파라미터 검증 전략 Population Based Training • 두 방법을 결합한 새로운 방법 • 저비용, 적은 시간 소요 • Exploit ­ 성능이 안 좋은 모델 대체 • Explore ­ perturbations 이후 학습 부스트캠프 AI Tech <Tech Talk> 26/
  • 27. 하이퍼파라미터 검증 전략 Population Based Training • 단점은 많은 디스크 용량을 필요로 한다. • Exploit 과정을 하기 위해서 • N개의 모델을 Checkpoint에 저장 • Gpu와 디스크 용량만 많다면 좋은 알고리즘 부스트캠프 AI Tech <Tech Talk> 27/
  • 28. 학습 검증 전략 (1) - 학습 곡선 • 과대 적합, 과소 적합을 판단하기에 가장 좋다. 부스트캠프 AI Tech <Tech Talk> 28/
  • 29. 학습 검증 전략 (1) - 학습 곡선 • WANDB 부스트캠프 AI Tech <Tech Talk> 29/
  • 30. 학습 검증 전략 (1) - 학습 곡선 • A Seed와 B Seed에서 결과가 다른데 어떻게 판단을 해야 할까? • N번 돌린다음 모델의 성능 지표의 평균 값으로 판단을 하자. 부스트캠프 AI Tech <Tech Talk> 30/
  • 31. 학습 검증 전략 (2) - 시각화 • 학습 곡선만으로는 부족하다. • 시각화 • 모델을 분석하는데 도움이 된다. • 잘 만들어 놓으면 재사용이 용이하다. 부스트캠프 AI Tech <Tech Talk> 31/
  • 32. 학습 검증 전략 (2) - 시각화 • 시각화의 좋은 예 • 분석 할 때 좋은 시각화 • 결과 분석이 가능한 시각화 • 전체를 대상 으로 하는 시각화 부스트캠프 AI Tech <Tech Talk> 32/
  • 33. 학습 검증 전략 (2) - 시각화 • 시각화의 좋은 예 • 분석 할 때 좋은 시각화 • 결과 분석이 가능한 시각화 • 전체를 대상 으로 하는 시각화 • 모델들 간의 우위를 볼 수 있는 시각화 • Competition에 큰 도움이 됐다. 부스트캠프 AI Tech <Tech Talk> 33/
  • 34. 학습 검증 전략 (2) - 시각화 • 시각화의 나쁜 예 • 분석 할 때 나쁜 시각화 • 어딜 보고 예측하는 거니..? • 하나를 대상 으로 하는 시각화 부스트캠프 AI Tech <Tech Talk> 34/
  • 35. 학습 검증 전략 (2) - 시각화 • 시각화의 나쁜 예 • 분석 할 때 나쁜 시각화 • 어딜 보고 예측하는 거니..? • 하나를 대상 으로 하는 시각화 부스트캠프 AI Tech <Tech Talk> 35/
  • 36. 실험 공유를 통한 검증 전략 • 공유를 하면 자동으로 검증 이 되는 전략 • 모델링에 공유 기능을 추가 하면 효율이 좋다 부스트캠프 AI Tech <Tech Talk> 36/
  • 37. 실험 공유를 통한 검증 전략 부스트캠프 AI Tech <Tech Talk> 37/
  • 38. Q&A 부스트캠프 AI Tech <Tech Talk> 38/