SlideShare ist ein Scribd-Unternehmen logo
1 von 13
Downloaden Sie, um offline zu lesen
Choral +
           Spraaktechnologie: ingezet
           voor de ontsluiting van audio-
           visuele archieven




           23-6-2010
De benadering


      Doel van het NWO CATCH project CHoral (2006-2011):
      onderzoek en ontwikkel geautomatiseerde annotatie-
      en zoek technologie voor audio archieven

      Doel van het NWO Catch+ project Choral (2009-2012):
      Ontwikkel een generieke tool op basis van het
      voorgaande project, die breed inzetbaar is voor het
      werkveld

Samenwerking tussen:
1. Spraaktechnologie onderzoekers, University of Twente
2. Archivarissen, Gemeentearchief Rotterdam
3. X-MI



 2         23-6-2010
De Test Case



‘Radio Rijnmond’ (RR) archieven:

      De regionale omroep van Rotterdam Rijnmond
      Eerste uitzending in 1983
      Opnames van uitzendingen omvatten meer dan
       60.000 uur
      Deels gedigitaliseerd, maar grotendeels analoog
      Deels ontsloten, maar voor het grootste deel
       wachtend op ontsluiting
      Typische collectie voor audio archieven in de
       sector cultureel erfgoed




 3          23-6-2010
Doorzoeken van de RR archieven




                                 Minimale metadata set per uur
                                 data




4        23-6-2010
Problemen



De belangrijkste problemen waar de ontsluiting van deze
collectie op stuit:

 1.   een grote hoeveelheid niet ontsloten materiaal
       data niet toegankelijk voor derden

 2.   Tamelijk algemene metadata, als die al aanwezig is
       slechts beperkt mogelijk om aan de vraag naar
      informatie te voldoen

 3.   de audio bevindt zich op analoge dragers en CD’s
       interactieve en online raadpleging is vrijwel niet
      mogelijk


 5         23-6-2010
Ontsluiting met behulp van spraaktechnologie


Ontsluiting: genereer automatisch een tijdgemarkeerde
inhoudsbeschrijving

 Mogelijkheid om online audio fragmenten op te vragen
 met een bepaalde inhoud

Ontsluitingsmethode is afhankelijk van:

      Beschikbare metadata
      Beschikbaarheid van contextuele documenten (o.a.
       transcripties)
      Wanneer de Word Error Rates minder dan 40%
       bedragen, kan automatisch gegenereerde content
       beschrijving worden gebruikt als zoekindex

 6          23-6-2010
AV archiving workflow

                      Content productie




                                      ASR CHoral
                                            IR        UI

                                 End user

                                 Onderzoek thema’s
                                  ASR: Automatic Indexing
                                  IR: Information Retrieval
                                  UI: User Interface Development

    Indexing


7         23-6-2010
Research en ontwikkeling in het huidige project Catch +


 Automatische indexering d.m.v. spraaktechnologie:
     Ontwikkeling van robuuste ASR en classificatie tools

 Information Retrieval:
      Ontsluiting van gesproken documenten gebaseerd op
       ASR output
      Overbrugging van de semantische kloof tussen
       zoekvragen van de gebruiker en de gesproken content

 User Interface ontwikkeling:
     Ondersteuning van zoeken en browsen in audio document
     (Re)presentatie van audio content




 8          23-6-2010
Automatic speech recognition




       Pre-processing      Speech recognition
                                                   50+ hour audio
         Classification      Acoustic model
       speech/non-speech
                                                           Word level
                           Pronunciation dictionary
        Segmentation of                                    index
           speakers          Language model
                                              250-500 M words




                                     2nd recognition with adapted
                                     models



9        23-6-2010
Types of word level indexes

 Meest waarschijnlijke tekst:
  ASR: Er is een bekend beeld voor veel ouders de grote show in onveilige situatie
  voor de school
  TXT: „t is een bekend beeld voor veel ouders. De chaotische en onveilige situatie
  voor de school

 Lattice structures:




                                                   “D‟66 is z‟n ene zetel kwijt”




 10             23-6-2010
Uitgangspunten en dilemma's


Om automatische annotatie succesvol te laten zijn:
    Moet de Audio digitaal beschikbaar zijn, bij voorkeur op
     een centrale server

Om ASR modellen te optimaliseren voor hoge kwaliteit
output:
     Moet een deel van de gesproken tekst getranscribeerd
      worden
     Of moeten er aan de audio gerelateerde documenten
      beschikbaar zijn.

?Hoe valideren wij de geautomatiseerde indexen?




 11         23-6-2010
User interface ontwikkeling



 Begrip voor de wensen en informatiebehoeften van de
  eindgebruiker

 Ondersteuning van selectie en browsen van gesproken
  content
      Bijvoorbeeld door representatie van gesproken tekst via
       andere media, zoals tekstueel, visueel of beide

 Representatie in context met gerelateerde content
  binnen dezelfde of andere collecties

 Auteursrechtelijke perikelen




 12         23-6-2010
Uitdagingen




 De workflow en de dagelijkse praktijk bij audiovisuele
  archieven enerzijds en de state-of-the-art in technologie
  anderzijds vragen om een zorgvuldige afstemming om
  een goed resultaat neer te zetten

 zie: http://hmi.ewi.utwente.nl/project/CHoral




 13         23-6-2010

Weitere ähnliche Inhalte

Ähnlich wie Mies Langelaar - Gemeente Archief Rotterdam - Choral+

Haalbaarheidsstudie MMLAB en MICT
Haalbaarheidsstudie MMLAB en MICTHaalbaarheidsstudie MMLAB en MICT
Haalbaarheidsstudie MMLAB en MICTFARO
 
CHORAL
CHORALCHORAL
CHORALFARO
 
Workshop Digital Radio (03/27/2009)
Workshop Digital Radio (03/27/2009)Workshop Digital Radio (03/27/2009)
Workshop Digital Radio (03/27/2009)Maarten Verwaest
 
Presentatie Roeland Ordelman slotbijeenkomst Verteld Verleden
Presentatie Roeland Ordelman slotbijeenkomst Verteld VerledenPresentatie Roeland Ordelman slotbijeenkomst Verteld Verleden
Presentatie Roeland Ordelman slotbijeenkomst Verteld VerledenVerteldVerleden
 
Seminar HBO en Open Access - HBO Kennisbank Infrastructuur en Architectuur
Seminar HBO en Open Access - HBO Kennisbank Infrastructuur en ArchitectuurSeminar HBO en Open Access - HBO Kennisbank Infrastructuur en Architectuur
Seminar HBO en Open Access - HBO Kennisbank Infrastructuur en ArchitectuurGerard Bierens
 
Herfstschool Tools Voor Onderzoekers Yvd V
Herfstschool Tools Voor Onderzoekers Yvd VHerfstschool Tools Voor Onderzoekers Yvd V
Herfstschool Tools Voor Onderzoekers Yvd VKeith Russell
 
Prepare your metadata - externe bronnen
Prepare your metadata - externe bronnenPrepare your metadata - externe bronnen
Prepare your metadata - externe bronnenPACKED vzw
 
Bib 20
Bib 20Bib 20
Bib 20mgas
 
Presentation at the final meeting of the MuNCH project
Presentation at the final meeting of the MuNCH projectPresentation at the final meeting of the MuNCH project
Presentation at the final meeting of the MuNCH projectLaura Hollink
 
Matthias Vandermaesen: De Datahub
Matthias Vandermaesen: De DatahubMatthias Vandermaesen: De Datahub
Matthias Vandermaesen: De DatahubPACKED vzw
 
Matthias Vandermaesen - De datahub
Matthias Vandermaesen - De datahubMatthias Vandermaesen - De datahub
Matthias Vandermaesen - De datahubPACKED
 
Inlichtingenwerk Limburg Gevorderden Share
Inlichtingenwerk Limburg Gevorderden ShareInlichtingenwerk Limburg Gevorderden Share
Inlichtingenwerk Limburg Gevorderden ShareJan Van Hee
 

Ähnlich wie Mies Langelaar - Gemeente Archief Rotterdam - Choral+ (20)

Haalbaarheidsstudie MMLAB en MICT
Haalbaarheidsstudie MMLAB en MICTHaalbaarheidsstudie MMLAB en MICT
Haalbaarheidsstudie MMLAB en MICT
 
Duurzame ontsluiting in Archipel
Duurzame ontsluiting in ArchipelDuurzame ontsluiting in Archipel
Duurzame ontsluiting in Archipel
 
CHORAL
CHORALCHORAL
CHORAL
 
Workshop Digital Radio (03/27/2009)
Workshop Digital Radio (03/27/2009)Workshop Digital Radio (03/27/2009)
Workshop Digital Radio (03/27/2009)
 
Presentatie Roeland Ordelman slotbijeenkomst Verteld Verleden
Presentatie Roeland Ordelman slotbijeenkomst Verteld VerledenPresentatie Roeland Ordelman slotbijeenkomst Verteld Verleden
Presentatie Roeland Ordelman slotbijeenkomst Verteld Verleden
 
EDepots in het CVAa en het NAi
EDepots in het CVAa en het NAi EDepots in het CVAa en het NAi
EDepots in het CVAa en het NAi
 
Seminar HBO en Open Access - HBO Kennisbank Infrastructuur en Architectuur
Seminar HBO en Open Access - HBO Kennisbank Infrastructuur en ArchitectuurSeminar HBO en Open Access - HBO Kennisbank Infrastructuur en Architectuur
Seminar HBO en Open Access - HBO Kennisbank Infrastructuur en Architectuur
 
Vanstappen De Caigny
Vanstappen De CaignyVanstappen De Caigny
Vanstappen De Caigny
 
Herfstschool Tools Voor Onderzoekers Yvd V
Herfstschool Tools Voor Onderzoekers Yvd VHerfstschool Tools Voor Onderzoekers Yvd V
Herfstschool Tools Voor Onderzoekers Yvd V
 
Prepare your metadata - externe bronnen
Prepare your metadata - externe bronnenPrepare your metadata - externe bronnen
Prepare your metadata - externe bronnen
 
Waisda? | KVAN studiedagen
Waisda? | KVAN studiedagenWaisda? | KVAN studiedagen
Waisda? | KVAN studiedagen
 
Bib20
Bib20Bib20
Bib20
 
Bib 20
Bib 20Bib 20
Bib 20
 
Presentatie Schokkaert
Presentatie SchokkaertPresentatie Schokkaert
Presentatie Schokkaert
 
Presentation at the final meeting of the MuNCH project
Presentation at the final meeting of the MuNCH projectPresentation at the final meeting of the MuNCH project
Presentation at the final meeting of the MuNCH project
 
Matthias Vandermaesen: De Datahub
Matthias Vandermaesen: De DatahubMatthias Vandermaesen: De Datahub
Matthias Vandermaesen: De Datahub
 
Matthias Vandermaesen - De datahub
Matthias Vandermaesen - De datahubMatthias Vandermaesen - De datahub
Matthias Vandermaesen - De datahub
 
De Datahub
De DatahubDe Datahub
De Datahub
 
Inlichtingenwerk Limburg Gevorderden Share
Inlichtingenwerk Limburg Gevorderden ShareInlichtingenwerk Limburg Gevorderden Share
Inlichtingenwerk Limburg Gevorderden Share
 
20081007 Workshop BOM-VL WP3
20081007  Workshop BOM-VL WP320081007  Workshop BOM-VL WP3
20081007 Workshop BOM-VL WP3
 

Mehr von KVANdagen

Erfgoedonderwijs: het archief als bron van beleving en reflectie
Erfgoedonderwijs: het archief als bron van beleving en reflectieErfgoedonderwijs: het archief als bron van beleving en reflectie
Erfgoedonderwijs: het archief als bron van beleving en reflectieKVANdagen
 
Praktische linked data voor archieven
Praktische linked data voor archievenPraktische linked data voor archieven
Praktische linked data voor archievenKVANdagen
 
Werken aan je toekomst
Werken aan je toekomstWerken aan je toekomst
Werken aan je toekomstKVANdagen
 
Big data x big archives = great opportunities
Big data x big archives = great opportunitiesBig data x big archives = great opportunities
Big data x big archives = great opportunitiesKVANdagen
 
Informatie is een conceptueel labyrinth
Informatie is een conceptueel labyrinthInformatie is een conceptueel labyrinth
Informatie is een conceptueel labyrinthKVANdagen
 
Archiefgeschiedenis: wat, waarom, hoe wie?
Archiefgeschiedenis: wat, waarom, hoe wie?Archiefgeschiedenis: wat, waarom, hoe wie?
Archiefgeschiedenis: wat, waarom, hoe wie?KVANdagen
 
The Big Picture
The Big PictureThe Big Picture
The Big PictureKVANdagen
 
Rhc eindhoven&promines
Rhc eindhoven&prominesRhc eindhoven&promines
Rhc eindhoven&prominesKVANdagen
 
Kvan dagen 2014 nha
Kvan dagen 2014 nhaKvan dagen 2014 nha
Kvan dagen 2014 nhaKVANdagen
 
Noord Hollands Archief Architectuur e depot - v2
Noord Hollands Archief Architectuur e depot - v2Noord Hollands Archief Architectuur e depot - v2
Noord Hollands Archief Architectuur e depot - v2KVANdagen
 
Big Archives, Bigger Websites, Biggest Difference
Big Archives, Bigger Websites, Biggest DifferenceBig Archives, Bigger Websites, Biggest Difference
Big Archives, Bigger Websites, Biggest DifferenceKVANdagen
 
20140617 kvan def
20140617 kvan def20140617 kvan def
20140617 kvan defKVANdagen
 
Publiek Geheim
Publiek GeheimPubliek Geheim
Publiek GeheimKVANdagen
 
European Holocaust Research Infrastructure
European Holocaust Research InfrastructureEuropean Holocaust Research Infrastructure
European Holocaust Research InfrastructureKVANdagen
 
VISI, formeel de essentie communiceren
VISI, formeel de essentie communicerenVISI, formeel de essentie communiceren
VISI, formeel de essentie communicerenKVANdagen
 
Bouwen met informatie. Wat u altijd al wilde weten over BIM
Bouwen met informatie. Wat u altijd al wilde weten over BIMBouwen met informatie. Wat u altijd al wilde weten over BIM
Bouwen met informatie. Wat u altijd al wilde weten over BIMKVANdagen
 
Betekenen Big Archives ook Big Risks?
Betekenen Big Archives ook Big Risks?Betekenen Big Archives ook Big Risks?
Betekenen Big Archives ook Big Risks?KVANdagen
 
Toepassingsprofiel Metagegevens: wanhoop niet, het komt goed!
Toepassingsprofiel Metagegevens: wanhoop niet, het komt goed!Toepassingsprofiel Metagegevens: wanhoop niet, het komt goed!
Toepassingsprofiel Metagegevens: wanhoop niet, het komt goed!KVANdagen
 
De ontwikkeling, realisering en lancering van Geschiedenislokaal.nl
De ontwikkeling, realisering en lancering van Geschiedenislokaal.nlDe ontwikkeling, realisering en lancering van Geschiedenislokaal.nl
De ontwikkeling, realisering en lancering van Geschiedenislokaal.nlKVANdagen
 

Mehr von KVANdagen (20)

Erfgoedonderwijs: het archief als bron van beleving en reflectie
Erfgoedonderwijs: het archief als bron van beleving en reflectieErfgoedonderwijs: het archief als bron van beleving en reflectie
Erfgoedonderwijs: het archief als bron van beleving en reflectie
 
Praktische linked data voor archieven
Praktische linked data voor archievenPraktische linked data voor archieven
Praktische linked data voor archieven
 
Werken aan je toekomst
Werken aan je toekomstWerken aan je toekomst
Werken aan je toekomst
 
Big data x big archives = great opportunities
Big data x big archives = great opportunitiesBig data x big archives = great opportunities
Big data x big archives = great opportunities
 
Informatie is een conceptueel labyrinth
Informatie is een conceptueel labyrinthInformatie is een conceptueel labyrinth
Informatie is een conceptueel labyrinth
 
Archiefgeschiedenis: wat, waarom, hoe wie?
Archiefgeschiedenis: wat, waarom, hoe wie?Archiefgeschiedenis: wat, waarom, hoe wie?
Archiefgeschiedenis: wat, waarom, hoe wie?
 
The Big Picture
The Big PictureThe Big Picture
The Big Picture
 
Rhc eindhoven&promines
Rhc eindhoven&prominesRhc eindhoven&promines
Rhc eindhoven&promines
 
Kvan dagen 2014 nha
Kvan dagen 2014 nhaKvan dagen 2014 nha
Kvan dagen 2014 nha
 
Noord Hollands Archief Architectuur e depot - v2
Noord Hollands Archief Architectuur e depot - v2Noord Hollands Archief Architectuur e depot - v2
Noord Hollands Archief Architectuur e depot - v2
 
Big Archives, Bigger Websites, Biggest Difference
Big Archives, Bigger Websites, Biggest DifferenceBig Archives, Bigger Websites, Biggest Difference
Big Archives, Bigger Websites, Biggest Difference
 
APEx
APExAPEx
APEx
 
20140617 kvan def
20140617 kvan def20140617 kvan def
20140617 kvan def
 
Publiek Geheim
Publiek GeheimPubliek Geheim
Publiek Geheim
 
European Holocaust Research Infrastructure
European Holocaust Research InfrastructureEuropean Holocaust Research Infrastructure
European Holocaust Research Infrastructure
 
VISI, formeel de essentie communiceren
VISI, formeel de essentie communicerenVISI, formeel de essentie communiceren
VISI, formeel de essentie communiceren
 
Bouwen met informatie. Wat u altijd al wilde weten over BIM
Bouwen met informatie. Wat u altijd al wilde weten over BIMBouwen met informatie. Wat u altijd al wilde weten over BIM
Bouwen met informatie. Wat u altijd al wilde weten over BIM
 
Betekenen Big Archives ook Big Risks?
Betekenen Big Archives ook Big Risks?Betekenen Big Archives ook Big Risks?
Betekenen Big Archives ook Big Risks?
 
Toepassingsprofiel Metagegevens: wanhoop niet, het komt goed!
Toepassingsprofiel Metagegevens: wanhoop niet, het komt goed!Toepassingsprofiel Metagegevens: wanhoop niet, het komt goed!
Toepassingsprofiel Metagegevens: wanhoop niet, het komt goed!
 
De ontwikkeling, realisering en lancering van Geschiedenislokaal.nl
De ontwikkeling, realisering en lancering van Geschiedenislokaal.nlDe ontwikkeling, realisering en lancering van Geschiedenislokaal.nl
De ontwikkeling, realisering en lancering van Geschiedenislokaal.nl
 

Mies Langelaar - Gemeente Archief Rotterdam - Choral+

  • 1. Choral + Spraaktechnologie: ingezet voor de ontsluiting van audio- visuele archieven 23-6-2010
  • 2. De benadering Doel van het NWO CATCH project CHoral (2006-2011): onderzoek en ontwikkel geautomatiseerde annotatie- en zoek technologie voor audio archieven Doel van het NWO Catch+ project Choral (2009-2012): Ontwikkel een generieke tool op basis van het voorgaande project, die breed inzetbaar is voor het werkveld Samenwerking tussen: 1. Spraaktechnologie onderzoekers, University of Twente 2. Archivarissen, Gemeentearchief Rotterdam 3. X-MI 2 23-6-2010
  • 3. De Test Case ‘Radio Rijnmond’ (RR) archieven:  De regionale omroep van Rotterdam Rijnmond  Eerste uitzending in 1983  Opnames van uitzendingen omvatten meer dan 60.000 uur  Deels gedigitaliseerd, maar grotendeels analoog  Deels ontsloten, maar voor het grootste deel wachtend op ontsluiting  Typische collectie voor audio archieven in de sector cultureel erfgoed 3 23-6-2010
  • 4. Doorzoeken van de RR archieven Minimale metadata set per uur data 4 23-6-2010
  • 5. Problemen De belangrijkste problemen waar de ontsluiting van deze collectie op stuit: 1. een grote hoeveelheid niet ontsloten materiaal  data niet toegankelijk voor derden 2. Tamelijk algemene metadata, als die al aanwezig is  slechts beperkt mogelijk om aan de vraag naar informatie te voldoen 3. de audio bevindt zich op analoge dragers en CD’s  interactieve en online raadpleging is vrijwel niet mogelijk 5 23-6-2010
  • 6. Ontsluiting met behulp van spraaktechnologie Ontsluiting: genereer automatisch een tijdgemarkeerde inhoudsbeschrijving  Mogelijkheid om online audio fragmenten op te vragen met een bepaalde inhoud Ontsluitingsmethode is afhankelijk van:  Beschikbare metadata  Beschikbaarheid van contextuele documenten (o.a. transcripties)  Wanneer de Word Error Rates minder dan 40% bedragen, kan automatisch gegenereerde content beschrijving worden gebruikt als zoekindex 6 23-6-2010
  • 7. AV archiving workflow Content productie ASR CHoral IR UI End user Onderzoek thema’s  ASR: Automatic Indexing  IR: Information Retrieval  UI: User Interface Development Indexing 7 23-6-2010
  • 8. Research en ontwikkeling in het huidige project Catch +  Automatische indexering d.m.v. spraaktechnologie:  Ontwikkeling van robuuste ASR en classificatie tools  Information Retrieval:  Ontsluiting van gesproken documenten gebaseerd op ASR output  Overbrugging van de semantische kloof tussen zoekvragen van de gebruiker en de gesproken content  User Interface ontwikkeling:  Ondersteuning van zoeken en browsen in audio document  (Re)presentatie van audio content 8 23-6-2010
  • 9. Automatic speech recognition Pre-processing Speech recognition 50+ hour audio Classification Acoustic model speech/non-speech Word level Pronunciation dictionary Segmentation of index speakers Language model 250-500 M words 2nd recognition with adapted models 9 23-6-2010
  • 10. Types of word level indexes  Meest waarschijnlijke tekst: ASR: Er is een bekend beeld voor veel ouders de grote show in onveilige situatie voor de school TXT: „t is een bekend beeld voor veel ouders. De chaotische en onveilige situatie voor de school  Lattice structures: “D‟66 is z‟n ene zetel kwijt” 10 23-6-2010
  • 11. Uitgangspunten en dilemma's Om automatische annotatie succesvol te laten zijn:  Moet de Audio digitaal beschikbaar zijn, bij voorkeur op een centrale server Om ASR modellen te optimaliseren voor hoge kwaliteit output:  Moet een deel van de gesproken tekst getranscribeerd worden  Of moeten er aan de audio gerelateerde documenten beschikbaar zijn. ?Hoe valideren wij de geautomatiseerde indexen? 11 23-6-2010
  • 12. User interface ontwikkeling  Begrip voor de wensen en informatiebehoeften van de eindgebruiker  Ondersteuning van selectie en browsen van gesproken content  Bijvoorbeeld door representatie van gesproken tekst via andere media, zoals tekstueel, visueel of beide  Representatie in context met gerelateerde content binnen dezelfde of andere collecties  Auteursrechtelijke perikelen 12 23-6-2010
  • 13. Uitdagingen  De workflow en de dagelijkse praktijk bij audiovisuele archieven enerzijds en de state-of-the-art in technologie anderzijds vragen om een zorgvuldige afstemming om een goed resultaat neer te zetten  zie: http://hmi.ewi.utwente.nl/project/CHoral 13 23-6-2010