SlideShare ist ein Scribd-Unternehmen logo
1 von 14
Downloaden Sie, um offline zu lesen
Goed of Fout
Jan Odijk & Gertjan van Noord
CLARIAH-middag
Amersfoort, 2016-01-22
1
Constructies
• Nederlandse constructies met een `goede’ en
een `foute’variant
• Zoeken in de treebank van Corpus Gesproken
Nederlands (CGN) en in LASSY-Klein
(geschreven Nederlands)
– Ieder circa 1 miljoen woorden
• Met PaQu (Parse en Query) web applicatie
• Nieuw door CLARIAH: analyse op metadata
– Land, sex, leeftijd, brontype, etc.
2
Constructies
• *Groter dan – groter als
• *Een aantal mensen is – een aantal mensen
zijn
• *Hun als onderwerp i.p.v. zij / ze
• *Hem/’m als onderwerp i.p.v. hij /ie
• U heeft – U hebt ; U bent – U is
• Hij heeft – Hij heb
• Een hele mooie vrouw – een heel mooie
vrouw
3
Constructies
• (Een) aardige meisje
• Het huis dat / wat
• Hen / hun als lijdend / meewerkend voorwerp
4
Groter dan of Groter als
Per miljoen
woorden
Geschreven Gesproken Geschreven
groot
Groter dan 532 245 243
Groter als 1 30 20
5
Een aantal/paar mensen
is/zijn …
Per miljoen woorden Geschreven Gesproken
Een aantal mensen is 27 + 0 5 + 6
Een aantal mensen zijn 4 + 25 0 + 35
Een paar mensen is 1 + 0 1 + 0
Een paar mensen zijn 14 + 0 27 + 0
6
Hun – Zij/Ze als onderwerp
Per miljoen
woorden
Geschreven Gesproken
hun 0 20
zij (mv) 343 360
ze (mv) 1481 4107
7
Hem/’m – Hij/ie als onderwerp
Per miljoen
woorden
Geschreven Gesproken
hem/ ‘m 0 101
hij 2703 2686
ie 55 1919
8
U heeft - U hebt
U is - U bent
Per miljoen
woorden
Geschreven Gesproken
U heeft 107 139
U hebt 52 106
U is 0 8
U bent 126 145
9
Een heel / hele mooie vrouw
Per miljoen
woorden
Geschreven Gesproken
Heel mooie
vrouw
1419 3391
Hele mooie
vrouw
6 342
10
Hij heb / heeft
Per miljoen
woorden
Geschreven Gesproken
Hij heb 0 8 [10]
Hij heeft 1919 2135
11
Ik zag hun / hen
Ik gaf hun / hen een boek
• Object= lijdend voorwerp of object van een
voorzetsel/achterzetsel
Per miljoen
woorden
Functie Geschreven Gesproken
hen object 249 107
hen Meewerkend voorwerp 53 16
hen Lijdend voorwerp 83 40
hun object 4 67
hun Meewerkend voorwerp 10 8
hun Lijdend voorwerp 1 15
12
(Een) aardige meisje
Per miljoen
woorden
Geschreven Gesproken
(Een) aardige
meisje
0 + 1 2 + 2 zonder
det
(Een) aardig
meisje
98 + 12 251 + 46
13
Het huis wat / dat
Per miljoen
woorden
Geschreven Gesproken
Het huis wat … 37 214
Het huis dat … 1126 306
14

Weitere ähnliche Inhalte

Mehr von CLARIAH

2016 05-20-clariah-wp4
2016 05-20-clariah-wp42016 05-20-clariah-wp4
2016 05-20-clariah-wp4CLARIAH
 
2016 05-20-clariah-wp3
2016 05-20-clariah-wp32016 05-20-clariah-wp3
2016 05-20-clariah-wp3CLARIAH
 
2016 05-20-clariah-wp2
2016 05-20-clariah-wp22016 05-20-clariah-wp2
2016 05-20-clariah-wp2CLARIAH
 
2016 05-20-clariah-wp5
2016 05-20-clariah-wp52016 05-20-clariah-wp5
2016 05-20-clariah-wp5CLARIAH
 
MTAS Henny Brugman
MTAS Henny BrugmanMTAS Henny Brugman
MTAS Henny BrugmanCLARIAH
 
LREC Ton vd Wouden
LREC Ton vd WoudenLREC Ton vd Wouden
LREC Ton vd WoudenCLARIAH
 
Open sonar martinreynaert
Open sonar martinreynaertOpen sonar martinreynaert
Open sonar martinreynaertCLARIAH
 
Struc data Auke Rijpma
Struc data Auke RijpmaStruc data Auke Rijpma
Struc data Auke RijpmaCLARIAH
 
Diachronous conceptuallexicons Marieke van Erp / Piek Vossen
Diachronous conceptuallexicons Marieke van Erp / Piek VossenDiachronous conceptuallexicons Marieke van Erp / Piek Vossen
Diachronous conceptuallexicons Marieke van Erp / Piek VossenCLARIAH
 
Corpus studio Erwin Komen
Corpus studio Erwin KomenCorpus studio Erwin Komen
Corpus studio Erwin KomenCLARIAH
 
Athena richard zijdeman
Athena richard zijdemanAthena richard zijdeman
Athena richard zijdemanCLARIAH
 
Struc data aukerijpma
Struc data aukerijpmaStruc data aukerijpma
Struc data aukerijpmaCLARIAH
 
Anansi jauco noordzij
Anansi jauco noordzijAnansi jauco noordzij
Anansi jauco noordzijCLARIAH
 
Clariah dag 2016_wp1_ocw
Clariah dag 2016_wp1_ocwClariah dag 2016_wp1_ocw
Clariah dag 2016_wp1_ocwCLARIAH
 
WP4: overzicht van de voortgang van WP4 op de CLARIAH-dag 22 januari 2016
WP4: overzicht van de voortgang van WP4 op de CLARIAH-dag 22 januari 2016WP4: overzicht van de voortgang van WP4 op de CLARIAH-dag 22 januari 2016
WP4: overzicht van de voortgang van WP4 op de CLARIAH-dag 22 januari 2016CLARIAH
 
WP3: overzicht van de voortgang van WP# op de CLARIAH-dag
WP3: overzicht van de voortgang van WP# op de CLARIAH-dagWP3: overzicht van de voortgang van WP# op de CLARIAH-dag
WP3: overzicht van de voortgang van WP# op de CLARIAH-dagCLARIAH
 
WP 2: overview of the progress of WP2 on the "CLARIAH-day 22-01-2016
WP 2: overview of the progress of WP2 on the "CLARIAH-day 22-01-2016 WP 2: overview of the progress of WP2 on the "CLARIAH-day 22-01-2016
WP 2: overview of the progress of WP2 on the "CLARIAH-day 22-01-2016 CLARIAH
 
WP 5: overview of the progress of WP5 on the "CLARIAH-day 22-01-2016
WP 5: overview of the progress of WP5 on the "CLARIAH-day 22-01-2016 WP 5: overview of the progress of WP5 on the "CLARIAH-day 22-01-2016
WP 5: overview of the progress of WP5 on the "CLARIAH-day 22-01-2016 CLARIAH
 
Keynote: What do ordinary humanity scholars want from CLARIAH?
Keynote: What do ordinary humanity scholars want from CLARIAH?Keynote: What do ordinary humanity scholars want from CLARIAH?
Keynote: What do ordinary humanity scholars want from CLARIAH?CLARIAH
 
Clariah arianna betti_keynote
Clariah arianna betti_keynoteClariah arianna betti_keynote
Clariah arianna betti_keynoteCLARIAH
 

Mehr von CLARIAH (20)

2016 05-20-clariah-wp4
2016 05-20-clariah-wp42016 05-20-clariah-wp4
2016 05-20-clariah-wp4
 
2016 05-20-clariah-wp3
2016 05-20-clariah-wp32016 05-20-clariah-wp3
2016 05-20-clariah-wp3
 
2016 05-20-clariah-wp2
2016 05-20-clariah-wp22016 05-20-clariah-wp2
2016 05-20-clariah-wp2
 
2016 05-20-clariah-wp5
2016 05-20-clariah-wp52016 05-20-clariah-wp5
2016 05-20-clariah-wp5
 
MTAS Henny Brugman
MTAS Henny BrugmanMTAS Henny Brugman
MTAS Henny Brugman
 
LREC Ton vd Wouden
LREC Ton vd WoudenLREC Ton vd Wouden
LREC Ton vd Wouden
 
Open sonar martinreynaert
Open sonar martinreynaertOpen sonar martinreynaert
Open sonar martinreynaert
 
Struc data Auke Rijpma
Struc data Auke RijpmaStruc data Auke Rijpma
Struc data Auke Rijpma
 
Diachronous conceptuallexicons Marieke van Erp / Piek Vossen
Diachronous conceptuallexicons Marieke van Erp / Piek VossenDiachronous conceptuallexicons Marieke van Erp / Piek Vossen
Diachronous conceptuallexicons Marieke van Erp / Piek Vossen
 
Corpus studio Erwin Komen
Corpus studio Erwin KomenCorpus studio Erwin Komen
Corpus studio Erwin Komen
 
Athena richard zijdeman
Athena richard zijdemanAthena richard zijdeman
Athena richard zijdeman
 
Struc data aukerijpma
Struc data aukerijpmaStruc data aukerijpma
Struc data aukerijpma
 
Anansi jauco noordzij
Anansi jauco noordzijAnansi jauco noordzij
Anansi jauco noordzij
 
Clariah dag 2016_wp1_ocw
Clariah dag 2016_wp1_ocwClariah dag 2016_wp1_ocw
Clariah dag 2016_wp1_ocw
 
WP4: overzicht van de voortgang van WP4 op de CLARIAH-dag 22 januari 2016
WP4: overzicht van de voortgang van WP4 op de CLARIAH-dag 22 januari 2016WP4: overzicht van de voortgang van WP4 op de CLARIAH-dag 22 januari 2016
WP4: overzicht van de voortgang van WP4 op de CLARIAH-dag 22 januari 2016
 
WP3: overzicht van de voortgang van WP# op de CLARIAH-dag
WP3: overzicht van de voortgang van WP# op de CLARIAH-dagWP3: overzicht van de voortgang van WP# op de CLARIAH-dag
WP3: overzicht van de voortgang van WP# op de CLARIAH-dag
 
WP 2: overview of the progress of WP2 on the "CLARIAH-day 22-01-2016
WP 2: overview of the progress of WP2 on the "CLARIAH-day 22-01-2016 WP 2: overview of the progress of WP2 on the "CLARIAH-day 22-01-2016
WP 2: overview of the progress of WP2 on the "CLARIAH-day 22-01-2016
 
WP 5: overview of the progress of WP5 on the "CLARIAH-day 22-01-2016
WP 5: overview of the progress of WP5 on the "CLARIAH-day 22-01-2016 WP 5: overview of the progress of WP5 on the "CLARIAH-day 22-01-2016
WP 5: overview of the progress of WP5 on the "CLARIAH-day 22-01-2016
 
Keynote: What do ordinary humanity scholars want from CLARIAH?
Keynote: What do ordinary humanity scholars want from CLARIAH?Keynote: What do ordinary humanity scholars want from CLARIAH?
Keynote: What do ordinary humanity scholars want from CLARIAH?
 
Clariah arianna betti_keynote
Clariah arianna betti_keynoteClariah arianna betti_keynote
Clariah arianna betti_keynote
 

Paqu Gertjan van Noord en Jan Odijk

  • 1. Goed of Fout Jan Odijk & Gertjan van Noord CLARIAH-middag Amersfoort, 2016-01-22 1
  • 2. Constructies • Nederlandse constructies met een `goede’ en een `foute’variant • Zoeken in de treebank van Corpus Gesproken Nederlands (CGN) en in LASSY-Klein (geschreven Nederlands) – Ieder circa 1 miljoen woorden • Met PaQu (Parse en Query) web applicatie • Nieuw door CLARIAH: analyse op metadata – Land, sex, leeftijd, brontype, etc. 2
  • 3. Constructies • *Groter dan – groter als • *Een aantal mensen is – een aantal mensen zijn • *Hun als onderwerp i.p.v. zij / ze • *Hem/’m als onderwerp i.p.v. hij /ie • U heeft – U hebt ; U bent – U is • Hij heeft – Hij heb • Een hele mooie vrouw – een heel mooie vrouw 3
  • 4. Constructies • (Een) aardige meisje • Het huis dat / wat • Hen / hun als lijdend / meewerkend voorwerp 4
  • 5. Groter dan of Groter als Per miljoen woorden Geschreven Gesproken Geschreven groot Groter dan 532 245 243 Groter als 1 30 20 5
  • 6. Een aantal/paar mensen is/zijn … Per miljoen woorden Geschreven Gesproken Een aantal mensen is 27 + 0 5 + 6 Een aantal mensen zijn 4 + 25 0 + 35 Een paar mensen is 1 + 0 1 + 0 Een paar mensen zijn 14 + 0 27 + 0 6
  • 7. Hun – Zij/Ze als onderwerp Per miljoen woorden Geschreven Gesproken hun 0 20 zij (mv) 343 360 ze (mv) 1481 4107 7
  • 8. Hem/’m – Hij/ie als onderwerp Per miljoen woorden Geschreven Gesproken hem/ ‘m 0 101 hij 2703 2686 ie 55 1919 8
  • 9. U heeft - U hebt U is - U bent Per miljoen woorden Geschreven Gesproken U heeft 107 139 U hebt 52 106 U is 0 8 U bent 126 145 9
  • 10. Een heel / hele mooie vrouw Per miljoen woorden Geschreven Gesproken Heel mooie vrouw 1419 3391 Hele mooie vrouw 6 342 10
  • 11. Hij heb / heeft Per miljoen woorden Geschreven Gesproken Hij heb 0 8 [10] Hij heeft 1919 2135 11
  • 12. Ik zag hun / hen Ik gaf hun / hen een boek • Object= lijdend voorwerp of object van een voorzetsel/achterzetsel Per miljoen woorden Functie Geschreven Gesproken hen object 249 107 hen Meewerkend voorwerp 53 16 hen Lijdend voorwerp 83 40 hun object 4 67 hun Meewerkend voorwerp 10 8 hun Lijdend voorwerp 1 15 12
  • 13. (Een) aardige meisje Per miljoen woorden Geschreven Gesproken (Een) aardige meisje 0 + 1 2 + 2 zonder det (Een) aardig meisje 98 + 12 251 + 46 13
  • 14. Het huis wat / dat Per miljoen woorden Geschreven Gesproken Het huis wat … 37 214 Het huis dat … 1126 306 14