Anzeige

Minerva - Solving Quantitative Reasoning Problems with Language Models

23. Feb 2023
Anzeige

Más contenido relacionado

Más de taeseon ryu(20)

Último(20)

Anzeige

Minerva - Solving Quantitative Reasoning Problems with Language Models

  1. Minerva: Solving Quantitative Reasoning Problems with Language Models MINERVA 1 Google Research 조해창(발표자), 박희수, 허정원
  2. CONTENTS Quantitative Reasoning Problems Minerva - Overview Prompt Majority voting Conclusions MINERVA 2
  3. Quantitative Reasoning Problems 3 • 정량적 추론문제 • 수학문제, 과학문제 • 수치적인 연산이 포함되고, 정답이 정해져있는 문제 • Datasets: • Math Word Problem (MWP) • Grade School Math (GSM8k) • Massive Multitask Language Understanding (MMLU)
  4. Modern model 4
  5. Quantitative Reasoning Problems 5
  6. Quantitative Reasoning Problems 6 • GPT, BERT로 접근. • 언어모델이 양적 정보(숫자 등)를 잘 학습하지 못함. • 외부 도구에 의존해야 할 수 있음.
  7. Quantitative Reasoning Problems 7
  8. Quantitative Reasoning Problems 8 한 변의 길이가 24cm인 정육각 형과 둘레가 같은 정팔각형이 있 습니다. 이 정팔각형의 한 변의 길이는 몇 cm 인지 구하시오. a = 24 b = 6 c = 8 y = a * b // c print(y) 18 인공지능 모델 <서술형 수학문제> <풀이 과정> <해답> 외부 도구
  9. Minerva • 학습 데이터: • Math Web Pages • arXiv • General Natural Language Data • 학습 방법 • few-shot prompting • chain of thought & scratchpad prompting • majority voting – nucleus sampling • based on the PaLM general language models 9
  10. Minerva 10
  11. Prompt • 다음 대사를 상기시켜주기 위한 힌트 11 user@host:/home$ _
  12. Thought of chain 12
  13. Scratchpad Prompt 13
  14. Minerva Prompt 14
  15. Majority voting • 256개 이상의 output sampling. • 나올 수 있는 정답이 제한되지 않기 때문에 유효함. 15 Nucleus sampling
  16. Majority voting • 256개 이상의 output sampling. • 나올 수 있는 정답이 제한되지 않기 때문에 유효함. 16 Nucleus sampling
  17. 17
  18. Conclusions 18
  19. Conclusions 19 • 고품질 데이터 셋을 확보함으로 외부 도구의 도움 없이 정량적 문제를 효과적으로 해결할 수 있다. • 풀이과정까지 맞았는지 확인할 방법은 없다. • 코드 생성 모델과 결합할 경우 좋은 성능을 낼 여지가 있다.
  20. THANK YOU MINERVA 20
Anzeige