SlideShare ist ein Scribd-Unternehmen logo
1 von 28
Grundlagen
          Analyse der Fuhrparkdaten
Erzeugung realistischer Fuhrparkdaten
                    Zusammenfassung




    Analyse hochdimensionaler Daten
     und deren zuf¨llige Erzeugung
                  a
                am Beispiel des BwFuhrpark


                 Stephan Tzschoppe, B. Sc.
                  Marc Uwe Simon, B. Sc

               Institut f¨r Theoretische Informatik,
                         u
               Mathematik und Operations Research
                      Fakult¨t f¨r Informatik
                             a u


                               22.02.2011


                                                       1 / 28
Grundlagen
                        Analyse der Fuhrparkdaten
              Erzeugung realistischer Fuhrparkdaten
                                  Zusammenfassung


Inhaltsverzeichnis
   1   Grundlagen
         Verteilungen
         Zufallszahlen
            Allgemeines zu Zufallszahlen
            Lineare Kongruenzgeneratoren
   2   Analyse der Fuhrparkdaten
         Vorbereitung
         Auswertung
   3   Erzeugung realistischer Fuhrparkdaten
         Datenmodell und Grundannahmen
         Verteilungen der zu erzeugenden Daten
         G¨te der generierten Daten
           u
   4   Zusammenfassung
         Fazit
         Ausblick

                                                      2 / 28
Grundlagen
                      Analyse der Fuhrparkdaten     Verteilungen
            Erzeugung realistischer Fuhrparkdaten   Zufallszahlen
                                Zusammenfassung


Relevante Verteilungen

   Definition (Wahrscheinlichkeitsfunktion nach [Bra92])

   Man betrachte eine Zufallsvariable x1 und eine reelle Zahl x2 , die
   jeden Wert zwischen −∞ und +∞ annehmen kann. Dann ist die
   Wahrscheinlichkeit f¨r das Ereignis x1 < x2 eine Funktion von x
                        u
   und heißt die Verteilungsfunktion von x

                                   F (x) = P(x1 < x2 ).


  diskrete Verteilungen                              stetige Verteilungen
       Gleichverteilung                                   Gleichverteilung
       Geometrische Verteilung                                Exponentialverteilung

                                                                                      3 / 28
Grundlagen
                        Analyse der Fuhrparkdaten     Verteilungen
              Erzeugung realistischer Fuhrparkdaten   Zufallszahlen
                                  Zusammenfassung


Grafiken relevanter Verteilungen


                       p 0.2                                                  Λ 0.25
                                                                              Λ .0.5
                       p 0.4                                                   Λ 1
                       p 0.7                                                   Λ 2
                                                            2.0
                       p 0.9

    0.8                                                     1.5




    0.6                                                     1.0




    0.4
                                                            0.5



    0.2
                                                                      1   2            3   4   5



          2        4           6    8        10
                                                       Abbildung: Dichtefunktion der
  Abbildung: Dichtefunktion der                        Exponentialverteilung
  Geometrischen Verteilung                                      λe−λx x ≥ 0
                                                       fλ (x) =
  f (x) = p(1 − p)x                                             0         x <0

                                                                                                   4 / 28
Grundlagen
                      Analyse der Fuhrparkdaten     Verteilungen
            Erzeugung realistischer Fuhrparkdaten   Zufallszahlen
                                Zusammenfassung


Verwendung der Gleichverteilung



   Definition (Indifferenzprinzip nach [Car59])
   Das Indifferenzprinzip (auch Prinzip vom unzureichenden Grund
   genannt) der Wahrscheinlichkeitstheorie besagt, dass bei n > 1
   unterscheidbaren und sich gegenseitig ausschließenden
   Ereignism¨glichkeiten die Eintrittswahrscheinlichkeit jedes
             o
                                                               1
   Ereignisses ohne Vorliegen weiterer Informationen mit p = n
   anzusetzen ist, d. h. eine diskrete Gleichverteilung angenommen
   wird.




                                                                     5 / 28
Grundlagen
                      Analyse der Fuhrparkdaten     Verteilungen
            Erzeugung realistischer Fuhrparkdaten   Zufallszahlen
                                Zusammenfassung


Allgemeines zu Zufallszahlen

   Echte und Pseudo-Zufallszahlen
       Unterscheidung durch Art der Gewinnung
       Eigenschaften bestimmen Anwendungsgebiete

        Charakteristik              PRNG                      TRNG
             Effizienz                ausgezeichnet             schecht
       Determinismus                deterministisch           nichtdeterministisch
          Periodizit¨t
                    a               periodisch                aperiodisch
   Tabelle: Vergleich der Erzeugung von echten (TRNG) und
   Pseudozufallszahlen (PRNG) [Haa11]



                                                                                     6 / 28
Grundlagen
                      Analyse der Fuhrparkdaten     Verteilungen
            Erzeugung realistischer Fuhrparkdaten   Zufallszahlen
                                Zusammenfassung


Erzeugung von Pseudo-Zufallszahlen

   Arbeitsweise
       Startwert (auch Seed) x0
       M¨glichst einfache Funktion f : Z/mZ → Z/mZ
        o
       x0 , x1 = f (x0 ) , . . . , xn = f (xn−1 )

        Random numbers should not be generated with a
       ”
       method chosen at random.“ Donald E. Knuth ([Knu98])


       Lineare Kongruenzgeneratoren ([Knu98], [Gre61], [Mar03])
       Mersenne-Twister ([MN98])


                                                                    7 / 28
Grundlagen
                      Analyse der Fuhrparkdaten     Verteilungen
            Erzeugung realistischer Fuhrparkdaten   Zufallszahlen
                                Zusammenfassung


Lineare Kongruenzgeneratoren


   Iterationsfunktion f
   F¨r lineare Kongruenzgeneratoren hat die oben eingef¨hrte
     u                                                 u
   Funktion f : Z/mZ → Z/mZ die Form:

                           x → f (x) = (a x + c) mod m


                                      a − Multiplikator
                                      c − Inkrement
                                     m − Modulus



                                                                    8 / 28
Grundlagen
                      Analyse der Fuhrparkdaten     Verteilungen
            Erzeugung realistischer Fuhrparkdaten   Zufallszahlen
                                Zusammenfassung


Lineare Kongruenzgeneratoren


Vorteile                                            Nachteile
    Gutes Laufzeitverhalten                             Zusammenhang der
    Geringe Spreicherkomplexit¨t
                              a                         Folgenglieder ([Mar03])
                                                           Geringe Periode der niedrigen
                                                           Bits bei m = 2n

   Anwendung
      ungeeignet f¨r:
                  u
            Monte Carlo Simulation
            Kryptographie (Schl¨sselerzeugung)
                               u
       m¨gliche Anwendung:
        o
            Einsatz auf Systemen mit beschr¨nkten Ressourcen
                                           a

                                                                                       9 / 28
Analyse hochdimensionaler Daten und deren zufällige Erzeugung
Analyse hochdimensionaler Daten und deren zufällige Erzeugung
Analyse hochdimensionaler Daten und deren zufällige Erzeugung
Analyse hochdimensionaler Daten und deren zufällige Erzeugung
Analyse hochdimensionaler Daten und deren zufällige Erzeugung
Analyse hochdimensionaler Daten und deren zufällige Erzeugung
Analyse hochdimensionaler Daten und deren zufällige Erzeugung
Analyse hochdimensionaler Daten und deren zufällige Erzeugung
Analyse hochdimensionaler Daten und deren zufällige Erzeugung
Analyse hochdimensionaler Daten und deren zufällige Erzeugung
Analyse hochdimensionaler Daten und deren zufällige Erzeugung
Analyse hochdimensionaler Daten und deren zufällige Erzeugung
Analyse hochdimensionaler Daten und deren zufällige Erzeugung
Analyse hochdimensionaler Daten und deren zufällige Erzeugung
Analyse hochdimensionaler Daten und deren zufällige Erzeugung
Analyse hochdimensionaler Daten und deren zufällige Erzeugung
Analyse hochdimensionaler Daten und deren zufällige Erzeugung
Analyse hochdimensionaler Daten und deren zufällige Erzeugung
Analyse hochdimensionaler Daten und deren zufällige Erzeugung

Weitere ähnliche Inhalte

Andere mochten auch

Peças Gráficas para divulgação do espetáculo "Quando Efe"
Peças Gráficas para divulgação do espetáculo "Quando Efe"Peças Gráficas para divulgação do espetáculo "Quando Efe"
Peças Gráficas para divulgação do espetáculo "Quando Efe"Alegria Design
 
Apresentação Eventos
Apresentação EventosApresentação Eventos
Apresentação EventosGraça Cardona
 
Plano de Compensação
Plano de CompensaçãoPlano de Compensação
Plano de CompensaçãoTalk Fusion
 
Flash OFI Risk Arb Absolu 13-05-14
Flash OFI Risk Arb Absolu 13-05-14Flash OFI Risk Arb Absolu 13-05-14
Flash OFI Risk Arb Absolu 13-05-14OFI Asset Management
 
Les outils publics salon 2011
Les outils publics salon 2011Les outils publics salon 2011
Les outils publics salon 2011impulse.brussels
 
Eléments essentiels de la convention entre actionnaires Nov 2009
Eléments essentiels de la convention entre actionnaires Nov 2009Eléments essentiels de la convention entre actionnaires Nov 2009
Eléments essentiels de la convention entre actionnaires Nov 2009SDruker
 
Fusion Work Live Residencial
Fusion Work Live ResidencialFusion Work Live Residencial
Fusion Work Live ResidencialSuporteaoCorretor
 
Email marketing und talk fusion
Email marketing und talk fusionEmail marketing und talk fusion
Email marketing und talk fusionGeorg Mollstaetter
 
Fusion Work Live Apartamentos
Fusion Work Live ApartamentosFusion Work Live Apartamentos
Fusion Work Live ApartamentosSuporteaoCorretor
 

Andere mochten auch (17)

Peças Gráficas para divulgação do espetáculo "Quando Efe"
Peças Gráficas para divulgação do espetáculo "Quando Efe"Peças Gráficas para divulgação do espetáculo "Quando Efe"
Peças Gráficas para divulgação do espetáculo "Quando Efe"
 
Apresentação Eventos
Apresentação EventosApresentação Eventos
Apresentação Eventos
 
Plano de Compensação
Plano de CompensaçãoPlano de Compensação
Plano de Compensação
 
Flash OFI Risk Arb Absolu 13-05-14
Flash OFI Risk Arb Absolu 13-05-14Flash OFI Risk Arb Absolu 13-05-14
Flash OFI Risk Arb Absolu 13-05-14
 
Talkfusion power point afiliacao
Talkfusion power point afiliacaoTalkfusion power point afiliacao
Talkfusion power point afiliacao
 
Les outils publics salon 2011
Les outils publics salon 2011Les outils publics salon 2011
Les outils publics salon 2011
 
Eléments essentiels de la convention entre actionnaires Nov 2009
Eléments essentiels de la convention entre actionnaires Nov 2009Eléments essentiels de la convention entre actionnaires Nov 2009
Eléments essentiels de la convention entre actionnaires Nov 2009
 
Fusion Work Live Residencial
Fusion Work Live ResidencialFusion Work Live Residencial
Fusion Work Live Residencial
 
Fusion Office Tower
Fusion Office TowerFusion Office Tower
Fusion Office Tower
 
Fusion Work Live Hotel
Fusion Work Live HotelFusion Work Live Hotel
Fusion Work Live Hotel
 
Fusion Work Live Office
Fusion Work Live OfficeFusion Work Live Office
Fusion Work Live Office
 
Fusion Work & Live - Vendas (21) 3021-0040 - ImobiliariadoRio.com.br
Fusion Work & Live - Vendas (21) 3021-0040 - ImobiliariadoRio.com.brFusion Work & Live - Vendas (21) 3021-0040 - ImobiliariadoRio.com.br
Fusion Work & Live - Vendas (21) 3021-0040 - ImobiliariadoRio.com.br
 
Apresentação talk fusion
Apresentação   talk fusionApresentação   talk fusion
Apresentação talk fusion
 
Email marketing und talk fusion
Email marketing und talk fusionEmail marketing und talk fusion
Email marketing und talk fusion
 
Crescer seu negócio com vídeo pt
Crescer seu negócio com vídeo ptCrescer seu negócio com vídeo pt
Crescer seu negócio com vídeo pt
 
Plano compensação 2014 pt
Plano compensação 2014 ptPlano compensação 2014 pt
Plano compensação 2014 pt
 
Fusion Work Live Apartamentos
Fusion Work Live ApartamentosFusion Work Live Apartamentos
Fusion Work Live Apartamentos
 

Mehr von Marc Uwe Simon

Gesichtserkennung mit SVD
Gesichtserkennung mit SVDGesichtserkennung mit SVD
Gesichtserkennung mit SVDMarc Uwe Simon
 
ELISA Ethnographiestudie
ELISA EthnographiestudieELISA Ethnographiestudie
ELISA EthnographiestudieMarc Uwe Simon
 
Ethnografie im Rahmen des ELISA-Projektes
Ethnografie im Rahmen des ELISA-ProjektesEthnografie im Rahmen des ELISA-Projektes
Ethnografie im Rahmen des ELISA-ProjektesMarc Uwe Simon
 
Präsentation Autonomous Underwater Vehicles
Präsentation Autonomous Underwater VehiclesPräsentation Autonomous Underwater Vehicles
Präsentation Autonomous Underwater VehiclesMarc Uwe Simon
 
Facebook Sicherheitseinstellungen
Facebook  SicherheitseinstellungenFacebook  Sicherheitseinstellungen
Facebook SicherheitseinstellungenMarc Uwe Simon
 
Bachelorarbeit Simon 2009
Bachelorarbeit Simon 2009Bachelorarbeit Simon 2009
Bachelorarbeit Simon 2009Marc Uwe Simon
 
Präsentation Bachelorarbeitsbetreuungssystem (BABS)
Präsentation Bachelorarbeitsbetreuungssystem (BABS)Präsentation Bachelorarbeitsbetreuungssystem (BABS)
Präsentation Bachelorarbeitsbetreuungssystem (BABS)Marc Uwe Simon
 

Mehr von Marc Uwe Simon (7)

Gesichtserkennung mit SVD
Gesichtserkennung mit SVDGesichtserkennung mit SVD
Gesichtserkennung mit SVD
 
ELISA Ethnographiestudie
ELISA EthnographiestudieELISA Ethnographiestudie
ELISA Ethnographiestudie
 
Ethnografie im Rahmen des ELISA-Projektes
Ethnografie im Rahmen des ELISA-ProjektesEthnografie im Rahmen des ELISA-Projektes
Ethnografie im Rahmen des ELISA-Projektes
 
Präsentation Autonomous Underwater Vehicles
Präsentation Autonomous Underwater VehiclesPräsentation Autonomous Underwater Vehicles
Präsentation Autonomous Underwater Vehicles
 
Facebook Sicherheitseinstellungen
Facebook  SicherheitseinstellungenFacebook  Sicherheitseinstellungen
Facebook Sicherheitseinstellungen
 
Bachelorarbeit Simon 2009
Bachelorarbeit Simon 2009Bachelorarbeit Simon 2009
Bachelorarbeit Simon 2009
 
Präsentation Bachelorarbeitsbetreuungssystem (BABS)
Präsentation Bachelorarbeitsbetreuungssystem (BABS)Präsentation Bachelorarbeitsbetreuungssystem (BABS)
Präsentation Bachelorarbeitsbetreuungssystem (BABS)
 

Analyse hochdimensionaler Daten und deren zufällige Erzeugung

  • 1. Grundlagen Analyse der Fuhrparkdaten Erzeugung realistischer Fuhrparkdaten Zusammenfassung Analyse hochdimensionaler Daten und deren zuf¨llige Erzeugung a am Beispiel des BwFuhrpark Stephan Tzschoppe, B. Sc. Marc Uwe Simon, B. Sc Institut f¨r Theoretische Informatik, u Mathematik und Operations Research Fakult¨t f¨r Informatik a u 22.02.2011 1 / 28
  • 2. Grundlagen Analyse der Fuhrparkdaten Erzeugung realistischer Fuhrparkdaten Zusammenfassung Inhaltsverzeichnis 1 Grundlagen Verteilungen Zufallszahlen Allgemeines zu Zufallszahlen Lineare Kongruenzgeneratoren 2 Analyse der Fuhrparkdaten Vorbereitung Auswertung 3 Erzeugung realistischer Fuhrparkdaten Datenmodell und Grundannahmen Verteilungen der zu erzeugenden Daten G¨te der generierten Daten u 4 Zusammenfassung Fazit Ausblick 2 / 28
  • 3. Grundlagen Analyse der Fuhrparkdaten Verteilungen Erzeugung realistischer Fuhrparkdaten Zufallszahlen Zusammenfassung Relevante Verteilungen Definition (Wahrscheinlichkeitsfunktion nach [Bra92]) Man betrachte eine Zufallsvariable x1 und eine reelle Zahl x2 , die jeden Wert zwischen −∞ und +∞ annehmen kann. Dann ist die Wahrscheinlichkeit f¨r das Ereignis x1 < x2 eine Funktion von x u und heißt die Verteilungsfunktion von x F (x) = P(x1 < x2 ). diskrete Verteilungen stetige Verteilungen Gleichverteilung Gleichverteilung Geometrische Verteilung Exponentialverteilung 3 / 28
  • 4. Grundlagen Analyse der Fuhrparkdaten Verteilungen Erzeugung realistischer Fuhrparkdaten Zufallszahlen Zusammenfassung Grafiken relevanter Verteilungen p 0.2 Λ 0.25 Λ .0.5 p 0.4 Λ 1 p 0.7 Λ 2 2.0 p 0.9 0.8 1.5 0.6 1.0 0.4 0.5 0.2 1 2 3 4 5 2 4 6 8 10 Abbildung: Dichtefunktion der Abbildung: Dichtefunktion der Exponentialverteilung Geometrischen Verteilung λe−λx x ≥ 0 fλ (x) = f (x) = p(1 − p)x 0 x <0 4 / 28
  • 5. Grundlagen Analyse der Fuhrparkdaten Verteilungen Erzeugung realistischer Fuhrparkdaten Zufallszahlen Zusammenfassung Verwendung der Gleichverteilung Definition (Indifferenzprinzip nach [Car59]) Das Indifferenzprinzip (auch Prinzip vom unzureichenden Grund genannt) der Wahrscheinlichkeitstheorie besagt, dass bei n > 1 unterscheidbaren und sich gegenseitig ausschließenden Ereignism¨glichkeiten die Eintrittswahrscheinlichkeit jedes o 1 Ereignisses ohne Vorliegen weiterer Informationen mit p = n anzusetzen ist, d. h. eine diskrete Gleichverteilung angenommen wird. 5 / 28
  • 6. Grundlagen Analyse der Fuhrparkdaten Verteilungen Erzeugung realistischer Fuhrparkdaten Zufallszahlen Zusammenfassung Allgemeines zu Zufallszahlen Echte und Pseudo-Zufallszahlen Unterscheidung durch Art der Gewinnung Eigenschaften bestimmen Anwendungsgebiete Charakteristik PRNG TRNG Effizienz ausgezeichnet schecht Determinismus deterministisch nichtdeterministisch Periodizit¨t a periodisch aperiodisch Tabelle: Vergleich der Erzeugung von echten (TRNG) und Pseudozufallszahlen (PRNG) [Haa11] 6 / 28
  • 7. Grundlagen Analyse der Fuhrparkdaten Verteilungen Erzeugung realistischer Fuhrparkdaten Zufallszahlen Zusammenfassung Erzeugung von Pseudo-Zufallszahlen Arbeitsweise Startwert (auch Seed) x0 M¨glichst einfache Funktion f : Z/mZ → Z/mZ o x0 , x1 = f (x0 ) , . . . , xn = f (xn−1 ) Random numbers should not be generated with a ” method chosen at random.“ Donald E. Knuth ([Knu98]) Lineare Kongruenzgeneratoren ([Knu98], [Gre61], [Mar03]) Mersenne-Twister ([MN98]) 7 / 28
  • 8. Grundlagen Analyse der Fuhrparkdaten Verteilungen Erzeugung realistischer Fuhrparkdaten Zufallszahlen Zusammenfassung Lineare Kongruenzgeneratoren Iterationsfunktion f F¨r lineare Kongruenzgeneratoren hat die oben eingef¨hrte u u Funktion f : Z/mZ → Z/mZ die Form: x → f (x) = (a x + c) mod m a − Multiplikator c − Inkrement m − Modulus 8 / 28
  • 9. Grundlagen Analyse der Fuhrparkdaten Verteilungen Erzeugung realistischer Fuhrparkdaten Zufallszahlen Zusammenfassung Lineare Kongruenzgeneratoren Vorteile Nachteile Gutes Laufzeitverhalten Zusammenhang der Geringe Spreicherkomplexit¨t a Folgenglieder ([Mar03]) Geringe Periode der niedrigen Bits bei m = 2n Anwendung ungeeignet f¨r: u Monte Carlo Simulation Kryptographie (Schl¨sselerzeugung) u m¨gliche Anwendung: o Einsatz auf Systemen mit beschr¨nkten Ressourcen a 9 / 28