SlideShare ist ein Scribd-Unternehmen logo
āļŠāļ­āļ™āđ‚āļ”āļĒ
āļ”āļĢ.āļŦāļ—āļąāļĒāļĢāļąāļ•āļ™āđŒ āđ€āļāļ•āļļāļĄāļ“āļĩāļŠāļąāļĒāļĢāļąāļ•āļ™āđŒ
āļ āļēāļ„āļ§āļīāļŠāļēāļāļēāļĢāļˆāļąāļ”āļāļēāļĢāđ€āļ—āļ„āđ‚āļ™āđ‚āļĨāļĒāļĩāļāļēāļĢāļœāļĨāļīāļ•āđāļĨāļ°āļŠāļēāļĢāļŠāļ™āđ€āļ—āļĻ
Chapter 2 : Data warehouse
1
336331 āļāļēāļĢāļ—āļēāđ€āļŦāļĄāļ·āļ­āļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ (Data Ming)
āđ€āļ™āļ·āđ‰āļ­āļŦāļē
 āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ (Data warehouse)
 āļ§āļąāļ•āļ–āļļāļ›āļĢāļ°āļŠāļ‡āļ„āđŒāļ‚āļ­āļ‡āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ
 āļ„āļļāļ“āļĨāļąāļāļĐāļ“āļ°āļ‚āļ­āļ‡āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ
 āđāļšāļšāļˆāļēāļĨāļ­āļ‡āļ‚āļ­āļ‡ Data Warehouse
 Star Schema
 Snowflake Schema
 āļāļēāļĢāđ€āļĨāļ·āļ­āļ Schema
 OLAP āđāļĨāļ° Cubes
 āļ•āļąāļ§āļ­āļĒāđˆāļēāļ‡āļāļēāļĢāļ”āļēāđ€āļ™āļīāļ™āļāļēāļĢāļāļąāļš OLAP
 āđ€āļ›āļĢāļĩāļĒāļšāđ€āļ—āļĩāļĒāļš DBMS, OLAP, and Data Mining
2
āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ (Data warehouse)
 āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ āļ„āļ·āļ­ āļ—āļĩāđˆāđ€āļāđ‡āļšāļ‚āđ‰āļ­āļĄāļđāļĨāļ‚āļ­āļ‡āļ­āļ‡āļ„āđŒāļāļĢāļ—āļĩāđˆāđ„āļ”āđ‰āļĢāļąāļšāļāļēāļĢāļ­āļ­āļāđāļšāļš āđ€āļžāļ·āđˆāļ­āļŠāđˆāļ§āļĒāđƒāļ™
āļāļēāļĢāļ•āļąāļ”āļŠāļīāļ™āđƒāļˆāļ‚āļ­āļ‡āļāđˆāļēāļĒāļšāļĢāļīāļŦāļēāļĢāđ‚āļ”āļĒāļĢāļ°āļšāļšāļ‚āđ‰āļ­āļĄāļđāļĨāđ€āļžāļ·āđˆāļ­āļāļēāļĢāļšāļĢāļīāļŦāļēāļĢāļˆāļ°āđāļĒāļāļˆāļēāļ
āļāļēāļ™āļ‚āđ‰āļ­āļĄāļđāļĨāļ‡āļēāļ™āļ›āļĢāļ°āļˆāļēāļ§āļąāļ™ āļ‹āļķāđˆāļ‡āļ­āļēāļˆāđ„āļ”āđ‰āļ‚āđ‰āļ­āļĄāļđāļĨāļˆāļēāļāļāļēāļ™āļ‚āđ‰āļ­āļĄāļđāļĨāļ‡āļēāļ™āļ›āļĢāļ°āļˆāļēāļ§āļąāļ™
āļŦāļĢāļ·āļ­āļˆāļēāļāļ āļēāļĒāļ™āļ­āļāļ­āļ‡āļ„āđŒāļāļĢ āđāļĨāļ°āđ€āļāđ‡āļšāļ‚āđ‰āļ­āļĄāļđāļĨāđƒāļ™āļĢāļđāļ›āđāļšāļšāļ‚āđ‰āļ­āļĄāļđāļĨāļŠāļĢāļļāļ› āļ™āļ­āļāļˆāļēāļāļ™āļĩāđ‰
āđƒāļ™āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨāļĒāļąāļ‡āđ€āļāđ‡āļšāđ€āļ„āļĢāļ·āđˆāļ­āļ‡āļĄāļ·āļ­āļŠāļēāļŦāļĢāļąāļšāļ”āļēāđ€āļ™āļīāļ™āļāļēāļĢāļāļąāļšāļ‚āđ‰āļ­āļĄāļđāļĨ āļāļĢāļ°āļšāļ§āļ™āļāļēāļĢ
āļ—āļēāļ‡āļēāļ™āļāļąāļšāļ‚āđ‰āļ­āļĄāļđāļĨ āđāļĨāļ°āļ—āļĢāļąāļžāļĒāļēāļāļĢāļ­āļ·āđˆāļ™āđ†
3
4
āļ§āļąāļ•āļ–āļļāļ›āļĢāļ°āļŠāļ‡āļ„āđŒāļ‚āļ­āļ‡āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ
 āđ€āļ›āđ‰ āļēāļŦāļĄāļēāļĒāđƒāļ™āļāļēāļĢāļŠāļĢāđ‰āļēāļ‡āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ
 āđ€āļžāļ·āđˆāļ­āđāļĒāļāļāļĨāļļāđˆāļĄāļ‚āđ‰āļ­āļĄāļđāļĨāļŠāļēāļĢāļŠāļ™āđ€āļ—āļĻāļ—āļĩāđˆāđƒāļŠāđ‰āđƒāļ™āļāļēāļĢāļ§āļīāđ€āļ„āļĢāļēāļ°āļŦāđŒāļ—āļēāļ‡āļ˜āļļāļĢāļāļīāļˆāļ­āļ­āļāļˆāļēāļāļāļēāļ™āļ‚āđ‰āļ­āļĄāļđāļĨāļ—āļĩāđˆāđƒāļŠāđ‰āļ‡āļēāļ™
āļ›āļĢāļ°āļˆāļēāļ§āļąāļ™ āđƒāļŦāđ‰āđ€āļāļīāļ”āļ›āļĢāļ°āļŠāļīāļ—āļ˜āļīāļ āļēāļžāļŠāļđāļ‡ āđāļĨāļ°āļ—āļēāđƒāļŦāđ‰āļāļēāļĢāđ€āļĢāļĩāļĒāļāđƒāļŠāđ‰āļ‚āđ‰āļ­āļĄāļđāļĨāļŠāļļāļ”āļ™āļĩāđ‰āļ—āļēāđ„āļ”āđ‰āļ­āļĒāđˆāļēāļ‡āļĒāļ·āļ”āļŦāļĒāļļāđˆāļ™
āļĢāļ§āļ”āđ€āļĢāđ‡āļ§āļĄāļēāļāļĒāļīāđˆāļ‡āļ‚āļķāđ‰āļ™
 āļ›āļĢāļ°āđ‚āļĒāļŠāļ™āđŒāļ‚āļ­āļ‡āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ
 āļ—āļēāļāļēāļĢāļĢāļ§āļšāļĢāļ§āļĄāļ‚āđ‰āļ­āļĄāļđāļĨāļ—āļĩāđˆāļĄāļĩāļ„āļ§āļēāļĄāļ‹āļąāļšāļ‹āđ‰āļ­āļ™āđƒāļŦāđ‰āļ‡āđˆāļēāļĒāļ•āđˆāļ­āļāļēāļĢāļˆāļąāļ”āđ€āļāđ‡āļš
 āļŠāļēāļĄāļēāļĢāļ–āļ™āļēāļ‚āđ‰āļ­āļĄāļđāļĨāļĄāļēāđƒāļŠāđ‰āđ„āļ”āđ‰āļ­āļĒāđˆāļēāļ‡āļĢāļ§āļ”āđ€āļĢāđ‡āļ§āđāļĨāļ°āļ–āļđāļāļ•āđ‰āļ­āļ‡
5
āļāļēāļĢāļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ (Data Warehousing)
 āļāļĢāļ°āļšāļ§āļ™āļāļēāļĢāđƒāļ™ Data Warehousing āļ›āļĢāļ°āļāļ­āļšāđ„āļ›āļ”āđ‰āļ§āļĒ
Data
Warehouse
Data
Source 1
Data
Source 2
Data
Source 3
Data Resources Data Staging Data Store
Data Provisioning
āļŦāļĢāļ·āļ­ Data Mart
Staging
Database
Data Data
Cleaning
and
Filtering
6
āļāļēāļĢāļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ (Data Warehousing)
 āļāļēāļĢāļĢāļąāļšāļ‚āđ‰āļ­āļĄāļđāļĨāđ€āļ‚āđ‰āļē (Data Resources)
āļŦāļĄāļēāļĒāļ–āļķāļ‡ āļ§āļīāļ˜āļĩāļāļēāļĢāđāļĨāļ°āļĢāļ°āļšāļšāļ—āļĩāđˆāļˆāļ°āļ—āļēāđƒāļŦāđ‰āļ‚āđ‰āļ­āļĄāļđāļĨāļˆāļēāļ Data source āļ–āļđāļāļ™āļēāļĄāļēāđ€āļ‚āđ‰āļē
āļŠāļđāđˆāļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ
 āļāļēāļĢāļŠāļ–āļēāļ™āļ°āļ‚āđ‰āļ­āļĄāļđāļĨ (Data Staging)
āđ€āļ›āđ‡āļ™āļ§āļīāļ˜āļĩāļāļēāļĢāļ—āļĩāđˆāļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨāļˆāļ°āļ›āļĢāļąāļšāļ‚āđ‰āļ­āļĄāļđāļĨāđ€āļžāļ·āđˆāļ­āļĨāļ”āļ„āļ§āļēāļĄāļ‹āđ‰āļēāļ‹āđ‰āļ­āļ™ (Cleansing)
āđāļĨāļ°āđ€āļĨāļ·āļ­āļāđ€āļ‰āļžāļēāļ°āļ‚āđ‰āļ­āļĄāļđāļĨāļ—āļĩāđˆāđ€āļ›āđ‡āļ™āļ›āļĢāļ°āđ‚āļĒāļŠāļ™āđŒ (Filtering) āđ€āļžāļ·āđˆāļ­āļ™āļēāļĄāļēāđ€āļāđ‡āļšāđ„āļ§āđ‰āđƒāļ™
āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨāđ€āļžāļ·āđˆāļ­āđƒāļŠāđ‰āļ‡āļēāļ™āļ•āđˆāļ­āđ„āļ›
7
āļāļēāļĢāļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ (Data Warehousing)
 āļāļēāļĢāļˆāļąāļ”āđ€āļāđ‡āļšāļ‚āđ‰āļ­āļĄāļđāļĨ (Data Store)
āļāļēāļĢāļ™āļēāđ€āļ­āļēāļ‚āđ‰āļ­āļĄāļđāļĨāļ—āļĩāđˆāļœāđˆāļēāļ™āļāļēāļĢ Cleansing āđāļĨāļ° Filtering āđāļĨāđ‰āļ§āļĄāļēāđ€āļāđ‡āļšāļšāļąāļ™āļ—āļķāļāļĨāļ‡
āđƒāļ™ Data Warehouse āļ‹āļķāđˆāļ‡āļŠāđˆāļ§āļ™āļ—āļĩāđˆāļ—āļēāļŦāļ™āđ‰āļēāļ—āļĩāđˆāļˆāļąāļ”āđ€āļāđ‡āļšāļ‚āđ‰āļ­āļĄāļđāļĨāđ€āļĢāļĩāļĒāļāļ§āđˆāļē “Data
warehouse Database”
 āļāļēāļĢāđ€āļ•āļĢāļĩāļĒāļĄāļ‚āđ‰āļ­āļĄāļđāļĨāđ€āļžāļ·āđˆāļ­āđƒāļŠāđ‰āļ‡āļēāļ™ (Data Provisioning)
āļŦāļĄāļēāļĒāļ–āļķāļ‡ āļāļēāļĢāļ™āļēāđ€āļ­āļēāļ‚āđ‰āļ­āļĄāļđāļĨāļ—āļĩāđˆāļĄāļĩāļ­āļĒāļđāđˆāđƒāļ™āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨāļĄāļēāļ›āļĢāļ°āļĄāļ§āļĨāļœāļĨāđ€āļžāļ·āđˆāļ­āđƒāļŦāđ‰āđ„āļ”āđ‰
āļŠāļēāļĢāļŠāļ™āđ€āļ—āļĻāļ—āļĩāđˆāļ•āđ‰āļ­āļ‡āļāļēāļĢāđ€āļžāļ·āđˆāļ­āļĢāļ­āļāļēāļĢāđƒāļŠāđ‰āļ‡āļēāļ™āļ•āđˆāļ­āđ„āļ› āļšāļēāļ‡āļ—āļĩāđ€āļĢāļĩāļĒāļāļ§āđˆāļē “Data Mart”
8
āļ„āļļāļ“āļĨāļąāļāļĐāļ“āļ°āļ‚āļ­āļ‡āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ
1. āļāļēāļĢāđāļšāđˆāļ‡āđ‚āļ„āļĢāļ‡āļŠāļĢāđ‰āļēāļ‡āļ•āļēāļĄāđ€āļ™āļ·āđ‰āļ­āļŦāļē Subject-Oriented
 āļ‚āđ‰āļ­āļĄāļđāļĨāļ–āļđāļāļˆāļąāļ”āļāļĨāļļāđˆāļĄāđƒāļŦāđ‰āđ€āļŦāļĄāļēāļ°āļŠāļĄāļāļąāļšāļāļēāļĢāļŠāļ·āļšāļ„āđ‰āļ™ āļˆāļąāļ”āļ•āļēāļĄāļ›āļĢāļ°āđ€āļ”āđ‡āļ™āļŦāļĨāļąāļāļ‚āļ­āļ‡āļ­āļ‡āļ„āđŒāļāļĢ
āđ€āļŠāđˆāļ™
 āļĨāļđāļāļ„āđ‰āļē āļŠāļīāļ™āļ„āđ‰āļē āļĒāļ­āļ”āļ‚āļēāļĒ
 āļ‚āđ‰āļ­āļĄāļđāļĨāļˆāļ°āđ„āļĄāđˆāļ–āļđāļāļˆāļąāļ”āļ•āļēāļĄāļŦāļ™āđ‰āļēāļ—āļĩāđˆāļāļēāļĢāļ‡āļēāļ™āļ‚āļ­āļ‡āđ‚āļ›āļĢāđāļāļĢāļĄāđƒāļ”āđ‚āļ›āļĢāđāļāļĢāļĄāļŦāļ™āļķāđˆāļ‡ āđ€āļŠāđˆāļ™
 āļāļēāļĢāļ„āļ§āļšāļ„āļļāļĄāļ„āļĨāļąāļ‡āļŠāļīāļ™āļ„āđ‰āļē āļāļēāļĢāļ­āļ­āļāđƒāļšāļāļēāļāļąāļšāļ āļēāļĐāļĩ
9
āļ„āļļāļ“āļĨāļąāļāļĐāļ“āļ°āļ‚āļ­āļ‡āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ (āļ•āđˆāļ­)
10
āļ„āļļāļ“āļĨāļąāļāļĐāļ“āļ°āļ‚āļ­āļ‡āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ (āļ•āđˆāļ­)
2. āļāļēāļĢāļĢāļ§āļĄāđ€āļ›āđ‡āļ™āļŦāļ™āļķāđˆāļ‡āđ€āļ”āļĩāļĒāļ§ Integrated
 āļˆāļąāļ”āļ‚āđ‰āļ­āļĄāļđāļĨāđƒāļŦāđ‰āļ­āļĒāļđāđˆāđƒāļ™āļĢāļđāļ›āđāļšāļšāđ€āļ”āļĩāļĒāļ§āļāļąāļ™ āļˆāļēāļāđāļŦāļĨāđˆāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨāļŦāļĨāļēāļĒāđāļŦāļĨāđˆāļ‡
11
āļ„āļļāļ“āļĨāļąāļāļĐāļ“āļ°āļ‚āļ­āļ‡āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ (āļ•āđˆāļ­)
3. āļ„āļ§āļēāļĄāļŠāļąāļĄāļžāļąāļ™āļ˜āđŒāļāļąāļšāđ€āļ§āļĨāļē Time-Variant
 āļ‚āđ‰āļ­āļĄāļđāļĨāļ•āđ‰āļ­āļ‡āļĄāļĩāļ„āļ§āļēāļĄāļ–āļđāļāļ•āđ‰āļ­āļ‡ āđ€āļžāļĢāļēāļ°āđ€āļāđ‡āļšāđ„āļ§āđ‰āđƒāļŠāđ‰āļ™āļēāļ™ 5-10 āļ›āļĩ
4. āļ„āļ§āļēāļĄāđ€āļŠāļ–āļĩāļĒāļĢāļ‚āļ­āļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ Non-Volatile
 āļāļēāļĢāļ›āļĢāļąāļšāļ›āļĢāļļāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨāđ€āļ›āđ‡āļ™āļāļēāļĢāđ€āļžāļīāđˆāļĄāļ‚āđ‰āļ­āļĄāļđāļĨāđƒāļŦāļĄāđˆāđ€āļ‚āđ‰āļēāđ„āļ›āđ€āļĢāļ·āđˆāļ­āļĒāđ† āđ„āļĄāđˆāđƒāļŠāđˆāļāļēāļĢāđāļ—āļ™āļ—āļĩāđˆāļ‚āđ‰āļ­āļĄāļđāļĨ
āđ€āļāđˆāļē
12
āđāļšāļšāļˆāļēāļĨāļ­āļ‡āļ‚āļ­āļ‡ Data Warehouse
 āļāđˆāļ­āļ™āļ—āļĩāđˆāļˆāļ°āļ—āļēāļāļēāļĢāļ­āļ­āļāđāļšāļš āļ•āđ‰āļ­āļ‡āļĻāļķāļāļĐāļēāļŠāđˆāļ§āļ™āļ›āļĢāļ°āļāļ­āļšāļ‚āļ­āļ‡ āđāļšāļšāļˆāļēāļĨāļ­āļ‡āļžāļ·āđ‰āļ™āļāļēāļ™āļ‹āļķāđˆāļ‡
āļ›āļĢāļ°āļāļ­āļšāļ”āđ‰āļ§āļĒ āļ”āļąāļ‡āļ™āļĩāđ‰
āļŠāđˆāļ§āļ™āļ›āļĢāļ°āļāļ­āļš āļĢāļēāļĒāļĨāļ°āđ€āļ­āļĩāļĒāļ”
Fact table āđ€āļ›āđ‡āļ™āļ•āļēāļĢāļēāļ‡āļĻāļđāļ™āļĒāđŒāļāļĨāļēāļ‡āļ—āļĩāđˆāđƒāļŠāđ‰āđƒāļ™ data warehouse āđāļĨāļ° data
mart āļ—āļĩāđˆāļˆāļ°āđ€āļāđ‡āļšāļˆāļēāļ™āļ§āļ™ measures āđāļĨāļ°āļĢāļēāļĒāļĨāļ°āđ€āļ­āļĩāļĒāļ”āļŠāļēāļ„āļąāļ
āđƒāļ™āđ€āļŠāļīāļ‡āļ˜āļļāļĢāļāļīāļˆ
Fact āļ„āļ·āļ­ row āđƒāļ™āļ•āļēāļĢāļēāļ‡ āđ‚āļ”āļĒ fact āļˆāļ°āđ€āļāđ‡āļšāļ„āđˆāļēāļ•āļąāļ§āđ€āļĨāļ‚āļ—āļĩāđˆāđƒāļŠāđ‰āļ§āļąāļ”
āđ€āļŦāļ•āļļāļāļēāļĢāļ“āđŒāļ—āļĩāđˆāđ€āļāļīāļ”āļ‚āļķāđ‰āļ™
Measure āļ„āļ·āļ­ āļ›āļĢāļīāļĄāļēāļ“, āļˆāļēāļ™āļ§āļ™ column āđƒāļ™ fact table āđ‚āļ”āļĒ
measure āļˆāļ°āđāļŠāļ”āļ‡āđƒāļŦāđ‰āđ€āļŦāđ‡āļ™āļ–āļķāļ‡āļ„āđˆāļēāļ—āļĩāđˆāļ–āļđāļāļ§āļīāđ€āļ„āļĢāļēāļ°āļŦāđŒāđāļĨāđ‰āļ§
Dimension āļ„āļ·āļ­ āđ€āļ­āļāļĨāļąāļāļĐāļ“āđŒāļ—āļēāļ‡āļ˜āļļāļĢāļāļīāļˆāđ€āļ›āđ‡āļ™āļĨāļąāļāļĐāļ“āļ°āļ—āļēāļ‡āļāļēāļĒāļ āļēāļž
Dimension table āđ€āļ›āđ‡āļ™āļ•āļēāļĢāļēāļ‡āđƒāļ™ data warehouse āļŦāļĢāļ·āļ­ data mart āļ—āļĩāđˆ
āļ­āļ˜āļīāļšāļēāļĒāļ‚āđ‰āļ­āļĄāļđāļĨāđƒāļ™ fact table
13
Star Schema
 star schema āļˆāļ°āļĄāļĩāļĨāļąāļāļĐāļ“āļ°āļ—āļĩāđˆāļĄāļĩ fact table āļ­āļĒāļđāđˆāļ•āļĢāļ‡āļāļĨāļēāļ‡āļĨāđ‰āļ­āļĄāļĢāļ­āļšāļ”āđ‰āļ§āļĒāļŦāļĨāļēāļĒ āđ†
dimension table āļ—āļĩāđˆāđ€āļāđ‡āļšāļĢāļēāļĒāļĨāļ°āđ€āļ­āļĩāļĒāļ”āļ‚āļ­āļ‡ fact āļ—āļĩāđˆāđ„āļĄāđˆāđƒāļŠāđˆ normalized center
14
Star Schema
Store Key
Product Key
Period Key
Units
Price
Store Dimension Time Dimension
Product Dimension
Fact Table
Store Key
Store Name
City
State
Region
Period Key
Year
Quarter
Month
Product Key
Product Desc
15
Star Schema
Store Dimension
Time Dimension
Product Dimension
Fact Table
Store Key
Store Name
City
State
Region
Period Key
Year
Quarter
Month
Product Key
Product Desc
Dimension tables
Dimension
Store Key Product
Key
Period
Key
Units Price
Fact
16
Snowflake Schema
Store Key
Product Key
Period Key
Units
Price
Time Dimension
Product Dimension
Fact Table
Store Key
Store Name
City Key
Period Key
Year
Quarter
Month
Product Key
Product Desc
City Key
City
State
Region
City Dimension
Store Dimension
â€Ē Snowflake schema āļĄāļĩāļ„āļ§āļēāļĄāđāļ•āļāļ•āđˆāļēāļ‡āļˆāļēāļ Star schema āļ•āļĢāļ‡āļ—āļĩāđˆ dimension table āļˆāļ°āđ€āļāđ‡āļš
āļ‚āđ‰āļ­āļĄāļđāļĨāļˆāļ°āđ€āļāđ‡āļšāļ‚āđ‰āļ­āļĄāļđāļĨāļ—āļĩāđˆāļ­āļĒāļđāđˆāđƒāļ™āļĢāļđāļ› normal form
17
āļāļēāļĢāđ€āļĨāļ·āļ­āļ Schema
 āļĄāļĩāđāļšāļšāđƒāļ™āļāļēāļĢāļ­āļ­āļāđāļšāļšāļ­āļĒāļđāđˆ 2 āđāļšāļšāļ—āļĩāđˆāđƒāļŠāđ‰āđƒāļ™āļāļēāļĢāļ­āļ­āļāđāļšāļš Data Warehouse
 Star Schema
 āļ§āļīāļ˜āļĩāļ™āļĩāđ‰āļˆāļ°āļŠāđˆāļ§āļĒāđ€āļžāļīāđˆāļĄāļ„āļ§āļēāļĄāļŠāļēāļĄāļēāļĢāļ–āđƒāļ™āļāļēāļĢāļ„āđ‰āļ™āļŦāļēāļ‚āđ‰āļ­āļĄāļđāļĨ
 āļāļēāļĢāļ§āļīāđ€āļ„āļĢāļēāļ°āļŦāđŒāļāļēāļĢāļ„āđ‰āļ™āļŦāļēāļ‚āđ‰āļ­āļĄāļđāļĨāđƒāļ™ dimension table āļ—āļĩāđˆāđ€āļĨāđ‡āļāļˆāļ°āđƒāļŠāđ‰ dimension key
āļˆāļēāļ index āđƒāļ™ central fact table
 Snowflake Schema
 āļˆāļ°āđƒāļŠāđ‰āđƒāļ™āļ—āļēāļ‡āļ˜āļļāļĢāļāļīāļˆ āđāļ•āđˆāļˆāļ°āđ„āļĄāđˆāđāļ™āļ°āļ™āļēāđƒāļŦāđ‰āđ€āļĨāļ·āļ­āļāļ§āļīāļ˜āļĩāļ™āļĩāđ‰ āđ€āļ™āļ·āđˆāļ­āļ‡āļˆāļēāļāļ§āļīāļ˜āļĩ āļ™āļĩāđ‰āļĄāļĩāļ„āļ§āļēāļĄāļĒāļļāđˆāļ‡āļĒāļēāļāđƒāļ™
āļāļēāļĢāļ”āļđāđāļĨ āļāļēāļĢāđ€āļāđ‡āļšāļ‚āđ‰āļ­āļĄāļđāļĨāļœāļđāđ‰āđƒāļŠāđ‰āļĢāļ°āļšāļšāđ„āļĄāđˆāļŠāļēāļĄāļēāļĢāļ–āļĢāļđāđ‰āđ„āļ”āđ‰āļ§āđˆāļēāļ‚āđ‰āļ­āļĄāļđāļĨāļ­āļĒāļđāđˆāļ—āļĩāđˆ āđ„āļŦāļ™ āļ­āļĩāļāļ—āļąāđ‰āļ‡āļāļēāļĢ
āđ€āļ‚āđ‰āļēāļ–āļķāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨāļĒāļąāļ‡āļŠāđ‰āļēāļ­āļĩāļ
18
OLAP āđāļĨāļ° Cubes
 OLAP āļŦāļĢāļ·āļ­ Online analytical processing āđ€āļ›āđ‡āļ™āđ€āļ—āļ„āđ‚āļ™āđ‚āļĨāļĒāļĩāļ—āļĩāđˆāļ›āļĢāļ°āļāļ­āļšāļ”āđ‰āļ§āļĒāđ€āļ„āļĢāļ·āđˆāļ­āļ‡āļĄāļ·āļ­āļ—āļĩāđˆ
āļŠāđˆāļ§āļĒāļ”āļķāļ‡āđāļĨāļ°āļ™āļēāđ€āļŠāļ™āļ­āļ‚āđ‰āļ­āļĄāļđāļĨāđƒāļ™āļŦāļĨāļēāļĒāļĄāļīāļ•āļī (Multidimensional) āļˆāļēāļāļŦāļĨāļēāļĒ āđ† āļĄāļļāļĄāļĄāļ­āļ‡ āđ‚āļ”āļĒ
āļ—āļĩāđˆ OLAP āđ„āļ”āđ‰āļĢāļąāļšāļāļēāļĢāļ­āļ­āļāđāļšāļšāļĄāļēāļŠāļēāļŦāļĢāļąāļšāļœāļđāđ‰āđƒāļŠāđ‰āđƒāļ™āļĢāļ°āļ”āļąāļšāļ‚āļ­āļ‡āļœāļđāđ‰āļšāļĢāļīāļŦāļēāļĢāļŦāļĢāļ·āļ­āļŦāļ™āđˆāļ§āļĒāļ‡āļēāļ™āđƒāļ™
āļ­āļ‡āļ„āđŒāļāļĢ āļ—āļĩāđˆāļ•āđ‰āļ­āļ‡āļ§āļīāđ€āļ„āļĢāļēāļ°āļŦāđŒāļ‚āđ‰āļ­āļĄāļđāļĨāđ€āļžāļ·āđˆāļ­āđƒāļŠāđ‰āļ›āļĢāļ°āļāļ­āļšāļāļēāļĢāļ•āļąāļ”āļŠāļīāļ™āđƒāļˆāđƒāļ™āļĢāļ°āļ”āļąāļšāļŠāļđāļ‡ āļāļēāļĢ
āļ›āļĢāļ°āļĄāļ§āļĨāļœāļĨāļˆāļ°āļ­āļĒāļđāđˆāļĢāļđāļ›āļĨāļđāļāļšāļēāļĻāļāđŒāļ—āļĩāđˆāļĄāļĩāļŦāļĨāļēāļĒāļĄāļīāļ•āļī āđ€āļĢāļĩāļĒāļāļ§āđˆāļē “Cube”
Data
Warehouse
Time
Product
19
āļāļēāļĢāļ”āļēāđ€āļ™āļīāļ™āļāļēāļĢāļāļąāļš OLAP
1. Roll up / Consolidation āļāļēāļĢāļ›āļĢāļąāļšāļĢāļ°āļ”āļąāļšāļ„āļ§āļēāļĄāļĨāļ°āđ€āļ­āļĩāļĒāļ”āļ‚āļ­āļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ āļˆāļēāļāļĢāļ°āļ”āļąāļš
āļ—āļĩāđˆāļĨāļ°āđ€āļ­āļĩāļĒāļ”āļ‚āļķāđ‰āļ™āļĄāļēāļŠāļđāđˆāļ‚āđ‰āļ­āļĄāļđāļĨāļ—āļĩāđˆāļŦāļĒāļēāļšāļ‚āļķāđ‰āļ™
2. Drill Down āļāļēāļĢāļ›āļĢāļąāļšāļĢāļ°āļ”āļąāļšāļ„āļ§āļēāļĄāļĨāļ°āđ€āļ­āļĩāļĒāļ”āļ‚āļ­āļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ āļˆāļēāļāļĢāļ°āļ”āļąāļšāļ—āļĩāđˆāļŦāļĒāļēāļš
āđ„āļ›āļŠāļđāđˆāļ—āļĩāđˆāļ‚āđ‰āļ­āļĄāļđāļĨāļĨāļ°āđ€āļ­āļĩāļĒāļ”āļĄāļēāļāļ‚āļķāđ‰āļ™
3. Slice āļāļēāļĢāđ€āļĨāļ·āļ­āļāļžāļīāļˆāļēāļĢāļ“āļēāļœāļĨāļĨāļąāļžāļ˜āđŒāļšāļēāļ‡āļŠāđˆāļ§āļ™āļ—āļĩāđˆāđ€āļĢāļēāļŠāļ™āđƒāļˆ āđ‚āļ”āļĒāđ€āļĨāļ·āļ­āļāđ€āļ‰āļžāļēāļ°āļ„āđˆāļēāļ—āļĩāđˆ
āļ–āļđāļāļāļēāļāļąāļšāļ”āđ‰āļ§āļĒāļ‚āđ‰āļ­āļĄāļđāļĨāļšāļēāļ‡āļ„āđˆāļēāļ‚āļ­āļ‡āđāļ•āđˆāļĨāļ°āļĄāļīāļ•āļīāđ€āļ—āđˆāļēāļ™āļąāđ‰āļ™
4. Dice āļāļĢāļ°āļšāļ§āļ™āļāļēāļĢāļžāļĨāļīāļāđāļāļ™āļŦāļĢāļ·āļ­āļĄāļīāļ•āļīāļ‚āļ­āļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ āđƒāļŦāđ‰āļ•āļĢāļ‡āļ•āļēāļĄāļ„āļ§āļēāļĄāļ•āđ‰āļ­āļ‡āļāļēāļĢ
āļ‚āļ­āļ‡āļœāļđāđ‰āđƒāļŠāđ‰āļ‡āļēāļ™
20
āļ•āļąāļ§āļ­āļĒāđˆāļēāļ‡āļāļēāļĢāļ”āļēāđ€āļ™āļīāļ™āļāļēāļĢāļāļąāļš OLAP
 āļšāļĢāļīāļĐāļąāļ—āđāļŦāđˆāļ‡āļŦāļ™āļķāđˆāļ‡ āļœāļĨāļīāļ•āļŠāļīāļ™āļ„āđ‰āļēāđ€āļāļĩāđˆāļĒāļ§āļāļąāļšāļ‚āļ™āļĄāļ›āļąāļ‡ (Bread) āđāļĨāļ°āļ„āļļāļāļāļĩāđ‰ (Cookies)
 āļœāļĨāļīāļ•āļ āļąāļ“āļ‘āđŒāļŠāđˆāļ‡āļ­āļ­āļāļ‚āļēāļĒāļ—āļĩāđˆāļ āļēāļ„āļ•āļ°āļ§āļąāļ™āļ•āļ (West), āļ•āļ°āļ§āļąāļ™āļ•āļāđ€āļ‰āļĩāļĒāļ‡āđ€āļŦāļ™āļ·āļ­
(Northwest) āļ‚āļ­āļ‡āļ›āļĢāļ°āđ€āļ—āļĻāļ­āļīāļ™āđ€āļ”āļĩāļĒ āļ„āļ·āļ­āļŠāļēāļ‚āļēāļ—āļĩāđˆāđ€āļĄāļ·āļ­āļ‡ Mumbai, Pune,
Ahmadabad, Baroda
 āļ›āļĢāļ°āļ˜āļēāļ™āļšāļĢāļīāļĐāļąāļ—āļ•āđ‰āļ­āļ‡āļāļēāļĢāļ”āļđāļ‚āđ‰āļ­āļĄāļđāļĨāļāļēāļĢāļ‚āļēāļĒāļ•āđ‰āļ­āļ‡āļ—āļēāļ­āļĒāđˆāļēāļ‡āđ„āļĢ??
21
Sale Data warehouse Model
City_ID Prod_ID Month Units Rupees
1 589 1/1/1998 3 7.95
1 1218 1/1/1998 4 7.32
2 589 1/1/1998 3 7.95
2 1218 1/1/1998 4 7.32
1 580 2/1/1998 16 42.40
Product Tables
Prod_ID Product_Name Product_Category_ID
589 Wheat Bread 1
590 White Bread 1
288 Coconut Cookies 2
1218 Cheese 1
580 Swiss Rolls 1
Product_Category_ID Product_Category
1 Bread
2 Cookies
City_ID City Region Country
1 Mumbai West India
2 Pune NorthWest India
City Table
Sale Table
Product_Category
22
Sale Data warehouse Model
City_ID Prod_ID Month Units Rupees
1 589 1/1/1998 3 7.95
1 1218 1/1/1998 4 7.32
2 589 1/1/1998 3 7.95
2 1218 1/1/1998 4 7.32
1 580 2/1/1998 16 42.40
Product Tables (Dimension Table)
Product_Category_ID Product_Category
1 Bread
2 Cookies
City_ID City Region Country
1 Mumbai West India
2 Pune NorthWest India
City Table (Dimension Table)
Sale Table (Fact Table)
Prod_ID Product_Name Product_Category_ID
589 Wheat Bread 1
590 White Bread 1
288 Coconut Cookies 2
1218 Cheese 1
580 Swiss Rolls 1
Product_Category
23
Sales Fact Table
 āļĄāļīāļ•āļīāļĄāļļāļĄāļĄāļ­āļ‡ (Dimensions) – āļžāļ·āđ‰āļ™āļ—āļĩāđˆ (Region) āļŦāļĢāļ·āļ­āļŠāļēāļ‚āļē (city), āļŠāļīāļ™āļ„āđ‰āļē
(Product), āđ€āļ§āļĨāļē (Time)
 āļ›āļĢāļīāļĄāļēāļ“ (Measure) – āļĒāļ­āļ”āļ‚āļēāļĒāļŠāļīāļ™āļ„āđ‰āļē (Units), āļĢāļēāļ„āļē (Price)
24
Sale Data warehouse Model
City Product Month Units Rupees
Mumbai Wheat Bread January 3 7.95
Mumbai Cheese January 4 7.32
Pune Wheat Bread January 3 7.95
Pune Cheese January 4 7.32
Mumbai Swiss Rolls February 16 42.40
City_ID Prod_ID Month Units Rupees
1 589 1/1/1998 3 7.95
1 1218 1/1/1998 4 7.32
2 589 1/1/1998 3 7.95
2 1218 1/1/1998 4 7.32
1 580 2/1/1998 16 42.40
25
āđ€āļĢāļīāđˆāļĄāļ”āļēāđ€āļ™āļīāļ™āļāļēāļĢāļāļąāļšāļāļēāļĢāļ—āļē OLAP
City Product Month Units Rupees
Mumbai Wheat Bread January 3 7.95
Mumbai Cheese January 4 7.32
Pune Wheat Bread January 3 7.95
Pune Cheese January 4 7.32
Mumbai Wheat Bread February 16 42.40
26
Sales Information
Report: āļˆāļēāļ™āļ§āļ™āļŠāļīāđ‰āļ™āļ—āļĩāđˆāļ‚āļēāļĒāđ„āļ”āđ‰āļ—āļąāđ‰āļ‡āļŦāļĄāļ” 113
Report: āļˆāļēāļ™āļ§āļ™āļŠāļīāđ‰āļ™āļ—āļĩāđˆāļ‚āļēāļĒāđ„āļ”āđ‰āđƒāļ™āđāļ•āđˆāļĨāļ°āđ€āļ”āļ·āļ­āļ™
January February March April
14 41 33 25
27
Sales Information
 Report : āļˆāļēāļ™āļ§āļ™āļŠāļīāđ‰āļ™āļ—āļĩāđˆāļ‚āļēāļĒāđ„āļ”āđ‰āđāļĒāļāļ•āļēāļĄāļ›āļĢāļ°āđ€āļ āļ—āļ‚āļ­āļ‡āļŠāļīāļ™āļ„āđ‰āļē
Jan Feb Mar Apr
Wheat Bread 6 0 6 17
Cheese 8 16 6 8
Swiss Rolls 0 25 21 0
Time
2 āļĄāļīāļ•āļī
28
Sales Information
 Report: āļˆāļēāļ™āļ§āļ™āļŠāļīāđ‰āļ™āļ—āļĩāđˆāļ‚āļēāļĒāđ„āļ”āđ‰āđƒāļ™āđāļ•āđˆāļĨāļ°āļŠāļēāļ‚āļēāļŠāļēāļŦāļĢāļąāļšāđāļ•āđˆāļĨāļ°āļ›āļĢāļ°āđ€āļ āļ—āļ‚āļ­āļ‡
āļŠāļīāļ™āļ„āđ‰āļēāđƒāļ™āđāļ•āđˆāļĨāļ°āđ€āļ”āļ·āļ­āļ™
Jan Feb Mar Apr
Mumbai Wheat Bread 3 0 3 10
Cheese 4 16 6 0
Swiss Rolls 0 16 6 0
Pune Wheat Bread 3 0 3 7
Cheese 4 0 0 8
Swiss Rolls 0 9 15 0
Time
Product
3 āļĄāļīāļ•āļī
29
Sales Information
Report: āļˆāļēāļ™āļ§āļ™āļŠāļīāđ‰āļ™āļ—āļĩāđˆāļ‚āļēāļĒāđ„āļ”āđ‰āđāļĨāļ°āļĢāļēāļĒāđ„āļ”āđ‰āđƒāļ™āđāļ•āđˆāļĨāļ°āļŠāļēāļ‚āļēāļŠāļēāļŦāļĢāļąāļšāđāļ•āđˆāļĨāļ°āļŠāļīāļ™āļ„āđ‰āļē
āđƒāļ™āđāļ•āđˆāļĨāļ°āđ€āļ”āļ·āļ­āļ™
Jan Feb Mar Apr
Rs U Rs U Rs U Rs U
Mumbai Wheat Bread 0 0 0 0 7.44 3 24.80 10
Cheese 7.95 3 42.40 16 15.90 6 0 0
Swiss Rolls 7.32 4 29.98 16 10.98 6 0 0
Pune Wheat Bread 0 0 0 0 7.44 3 17.36 7
Cheese 7.95 3 0 0 0 0 21.20 8
Swiss Rolls 7.32 4 16.47 9 27.45 15 0 0
30
Drill down & Roll up
Roll Up
Drill Down
January February March April
14 41 33 25
Jan Feb Mar Apr
Wheat Bread 6 6 17
Cheese 8 16 6 8
Swiss Rolls 25 21
Jan Feb Mar Apr
Mumbai Wheat Bread 3 3 10
Cheese 4 16 6
Swiss Rolls 16 6
Pune Wheat Bread 3 3 7
Cheese 4 8
Swiss Rolls 9 15
31
Slide
Time
Product
Product= Swiss Rolls
Wheat Bread
Cheese
Swiss Rolls
Mumbai
Pune
Ahemdabad
Baroda
Jan Feb March Apr
Time
Jan Feb March Apr
3 10
3 7
1 1 1 2
10 5 3 4
10 5 3 4
3 10
3 7
1 1 1 2
32
Slide
Time
Product
Product= Cheese
Wheat Bread
Cheese
Swiss Rolls
Mumbai
Pune
Ahemdabad
Baroda
Jan Feb March Apr
Time
Jan Feb March Apr
3 10
3 7
1 1 1 2
10 5 3 4
10 5 3 4
3 16 6
3 8
1 1 1 2
33
Slide
Time
Product
Product= Swiss Rolls, Cheese, Wheat Bread
Wheat Bread
Cheese
Swiss Rolls
Mumbai
Pune
Ahemdabad
Baroda
Jan Feb March Apr
Time
Jan Feb March
3 10
3 7
1 1 1 2
10 5 3 4
10 5 3
3
3
1 1 1
34
Dice
Time
Product
Wheat Bread
Cheese
Swiss Rolls
Mumbai
Pune
Ahmadabad
Baroda
Jan Feb March Apr
3 10
3 7
1 1 1 2
10 5 3 4
Time
City
Cheese
Swiss Rolls
Jan Feb March Apr
Wheat Bread
Mumbai
Pune
Ahmadabad
Baroda
35
Data Warehouse & Data Mining
Customers
Etcâ€Ķ
Vendors Etcâ€Ķ
Orders
Data
Warehouse
Enterprise
“Database”
Transactions
Copied,
organized
summarized
Data Mining
Data Miners:
â€Ē “Farmers” – they know
â€Ē “Explorers” - unpredictable
36
DBMS, OLAP, and Data Mining
DBMS DW (OLAP) Data Mining
āļ‡āļēāļ™
āļ”āļķāļ‡āļĢāļēāļĒāļĨāļ°āđ€āļ­āļĩāļĒāļ”āđāļĨāļ°āļœāļĨāļŠāļĢāļļāļ›
āļ‚āļ­āļ‡āļ‚āđ‰āļ­āļĄāļđāļĨāđ„āļ”āđ‰
āļŠāļĢāļļāļ›āļ‚āđ‰āļ­āļĄāļđāļĨ āļ”āļđāđāļ™āļ§āđ‚āļ™āđ‰āļĄāđ„āļ”āđ‰
āļ„āļ§āļēāļĄāļĢāļđāđ‰āļ—āļĩāđˆāļ‹āđˆāļ­āļ™āļ­āļĒāļđāđˆāđƒāļ™
āļāļēāļ™āļ‚āđ‰āļ­āļĄāļđāļĨ
āļœāļĨāļĨāļąāļžāļ˜āđŒ āļ‚āđ‰āļ­āļĄāļđāļĨāļŠāļēāļĢāļŠāļ™āđ€āļ—āļĻ āļœāļĨāļāļēāļĢāļ§āļīāđ€āļ„āļĢāļēāļ°āļŦāđŒ
āļŠāļēāļĄāļēāļĢāļ–āđ€āļŦāđ‡āļ™āļ„āļ§āļēāļĄāļŠāļąāļĄāļžāļąāļ™āļ˜āđŒ
āđāļĒāļāđāļĒāļ°āļ‚āđ‰āļ­āļĄāļđāļĨ
āļžāļĒāļēāļāļĢāļ“āđŒāļ‚āđ‰āļ­āļĄāļđāļĨ
āļ§āļīāļ˜āļĩāļāļēāļĢ āļ–āļēāļĄāļ„āļēāļ•āļ­āļšāđāļĨāđ‰āļ§āļ•āļ­āļš
āļ—āļēāđāļšāļšāļˆāļēāļĨāļ­āļ‡āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ
āļ§āļīāđ€āļ„āļĢāļēāļ°āļŦāđŒāļ‚āđ‰āļ­āļĄāļđāļĨāļŦāļĨāļēāļĒ
āļĄāļīāļ•āļī
āļŠāļĢāđ‰āļēāļ‡āđāļšāļšāļˆāļēāļĨāļ­āļ‡āđāļĨāļ°
āļŠāļēāļĄāļēāļĢāļ–āļšāļ­āļāļĨāļąāļāļĐāļ“āļ°
āļŦāļĢāļ·āļ­āļ—āļēāļ™āļēāļĒāļ‚āđ‰āļ­āļĄāļđāļĨāđƒāļŦāļĄāđˆ
āđ„āļ”āđ‰
āļ•āļąāļ§āļ­āļĒāđˆāļēāļ‡āļ„āļēāļ–āļēāļĄ
āđƒāļ„āļĢāļ‹āļ·āđ‰āļ­āļŠāļĨāļēāļāļāļ­āļ‡āļ—āļļāļ™
āļĒāđ‰āļ­āļ™āļŦāļĨāļąāļ‡ 3 āļ›āļĩāļšāđ‰āļēāļ‡?
āđ€āļ‡āļīāļ™āđ€āļ”āļ·āļ­āļ™āđ€āļ‰āļĨāļĩāđˆāļĒāđ€āļ—āđˆāļēāđ„āļŦāļĢāđˆāļ‚āļ­āļ‡
āļ„āļ™āļ—āļĩāđˆāļ‹āļ·āđ‰āļ­āļŠāļĨāļēāļāļāļ­āļ‡āļ—āļļāļ™
āļ­āļĒāļđāđˆāđƒāļ™āđ€āļ‚āļ•āļžāļ·āđ‰āļ™āļ—āļĩāđˆāđƒāļ”āđāļĨāļ°
āđāļ•āđˆāļĨāļ°āļ›āļĩāđ€āļ—āđˆāļēāđƒāļ”?
āđƒāļ„āļĢāļˆāļ°āļ‹āļ·āđ‰āļ­āļŠāļĨāļēāļāļāļ­āļ‡āļ—āļļāļ™āļšāđ‰āļēāļ‡
āđƒāļ™ 6 āđ€āļ”āļ·āļ­āļ™āļ‚āđ‰āļēāļ‡āļŦāļ™āđ‰āļēāđāļĨāļ°
āļ—āļēāđ„āļĄāļ–āļķāļ‡āļ‹āļ·āđ‰āļ­?
37
38

Weitere ÃĪhnliche Inhalte

Was ist angesagt?

āļšāļĢāļĢāļĒāļēāļāļēāļĻ
āļšāļĢāļĢāļĒāļēāļāļēāļĻāļšāļĢāļĢāļĒāļēāļāļēāļĻ
āļšāļĢāļĢāļĒāļēāļāļēāļĻ
kulruedee_chm
 
Chapter 1. Introduction
Chapter 1. IntroductionChapter 1. Introduction
Chapter 1. Introduction
butest
 
Data mining
Data miningData mining
Data mining
Samir Sabry
 

Was ist angesagt? (20)

āļšāļĢāļĢāļĒāļēāļāļēāļĻ
āļšāļĢāļĢāļĒāļēāļāļēāļĻāļšāļĢāļĢāļĒāļēāļāļēāļĻ
āļšāļĢāļĢāļĒāļēāļāļēāļĻ
 
06 classification 2 bayesian and instance based classification
06 classification 2 bayesian and instance based classification06 classification 2 bayesian and instance based classification
06 classification 2 bayesian and instance based classification
 
Weka classification
Weka classificationWeka classification
Weka classification
 
Practical Data Mining with RapidMiner Studio 7 : A Basic and Intermediate
Practical Data Mining with RapidMiner Studio 7 : A Basic and IntermediatePractical Data Mining with RapidMiner Studio 7 : A Basic and Intermediate
Practical Data Mining with RapidMiner Studio 7 : A Basic and Intermediate
 
01. Introduction to Data Mining and BI
01. Introduction to Data Mining and BI01. Introduction to Data Mining and BI
01. Introduction to Data Mining and BI
 
Master Data Management (MDM) for Mid-Market
Master Data Management (MDM) for Mid-MarketMaster Data Management (MDM) for Mid-Market
Master Data Management (MDM) for Mid-Market
 
Introduction to Feature (Attribute) Selection with RapidMiner Studio 6
Introduction to Feature (Attribute) Selection with RapidMiner Studio 6Introduction to Feature (Attribute) Selection with RapidMiner Studio 6
Introduction to Feature (Attribute) Selection with RapidMiner Studio 6
 
Chapter 1. Introduction
Chapter 1. IntroductionChapter 1. Introduction
Chapter 1. Introduction
 
āļāļēāļĢāđƒāļŠāđ‰āđ‚āļ›āļĢāđāļāļĢāļĄ QDA Miner.pdf
āļāļēāļĢāđƒāļŠāđ‰āđ‚āļ›āļĢāđāļāļĢāļĄ QDA Miner.pdfāļāļēāļĢāđƒāļŠāđ‰āđ‚āļ›āļĢāđāļāļĢāļĄ QDA Miner.pdf
āļāļēāļĢāđƒāļŠāđ‰āđ‚āļ›āļĢāđāļāļĢāļĄ QDA Miner.pdf
 
Unlocking Greater Insights with Integrated Data Quality for Collibra
Unlocking Greater Insights with Integrated Data Quality for CollibraUnlocking Greater Insights with Integrated Data Quality for Collibra
Unlocking Greater Insights with Integrated Data Quality for Collibra
 
01 introduction to data mining
01 introduction to data mining01 introduction to data mining
01 introduction to data mining
 
OLAP Cubes in Datawarehousing
OLAP Cubes in DatawarehousingOLAP Cubes in Datawarehousing
OLAP Cubes in Datawarehousing
 
āļāļēāļĢāđ€āļžāļīāđˆāļĄāļ›āļĢāļ°āļŠāļīāļ—āļ˜āļīāļ āļēāļžāđāļĨāļ°āļāļēāļĢāļŠāļ·āļšāļ„āđ‰āļ™āļ—āļĢāļąāļžāļĒāļēāļāļĢāļ­āļīāđ€āļĨāđ‡āļāļ—āļĢāļ­āļ™āļīāļāļŠāđŒāļ”āđ‰āļ§āļĒ Metadata (āļāļēāļĢāļˆāļąāļ”āļ—āļģ ...
āļāļēāļĢāđ€āļžāļīāđˆāļĄāļ›āļĢāļ°āļŠāļīāļ—āļ˜āļīāļ āļēāļžāđāļĨāļ°āļāļēāļĢāļŠāļ·āļšāļ„āđ‰āļ™āļ—āļĢāļąāļžāļĒāļēāļāļĢāļ­āļīāđ€āļĨāđ‡āļāļ—āļĢāļ­āļ™āļīāļāļŠāđŒāļ”āđ‰āļ§āļĒ Metadata (āļāļēāļĢāļˆāļąāļ”āļ—āļģ ...āļāļēāļĢāđ€āļžāļīāđˆāļĄāļ›āļĢāļ°āļŠāļīāļ—āļ˜āļīāļ āļēāļžāđāļĨāļ°āļāļēāļĢāļŠāļ·āļšāļ„āđ‰āļ™āļ—āļĢāļąāļžāļĒāļēāļāļĢāļ­āļīāđ€āļĨāđ‡āļāļ—āļĢāļ­āļ™āļīāļāļŠāđŒāļ”āđ‰āļ§āļĒ Metadata (āļāļēāļĢāļˆāļąāļ”āļ—āļģ ...
āļāļēāļĢāđ€āļžāļīāđˆāļĄāļ›āļĢāļ°āļŠāļīāļ—āļ˜āļīāļ āļēāļžāđāļĨāļ°āļāļēāļĢāļŠāļ·āļšāļ„āđ‰āļ™āļ—āļĢāļąāļžāļĒāļēāļāļĢāļ­āļīāđ€āļĨāđ‡āļāļ—āļĢāļ­āļ™āļīāļāļŠāđŒāļ”āđ‰āļ§āļĒ Metadata (āļāļēāļĢāļˆāļąāļ”āļ—āļģ ...
 
Practical Data Mining: FP-Growth
Practical Data Mining: FP-GrowthPractical Data Mining: FP-Growth
Practical Data Mining: FP-Growth
 
Database system concepts and architecture
Database system concepts and architectureDatabase system concepts and architecture
Database system concepts and architecture
 
Data mining
Data miningData mining
Data mining
 
Enterprise Data Management
Enterprise Data ManagementEnterprise Data Management
Enterprise Data Management
 
Data Mining Presentation
Data Mining PresentationData Mining Presentation
Data Mining Presentation
 
Warehousing dimension star-snowflake_schemas
Warehousing dimension star-snowflake_schemasWarehousing dimension star-snowflake_schemas
Warehousing dimension star-snowflake_schemas
 
Data Mining
Data MiningData Mining
Data Mining
 

Mehr von āļ™āļ™āļ—āļ§āļąāļ’āļ™āđŒ āļšāļļāļāļšāļē (8)

K means cluster in weka
K means cluster in wekaK means cluster in weka
K means cluster in weka
 
Note
NoteNote
Note
 
Weka association
Weka associationWeka association
Weka association
 
1 weka introducing
1 weka introducing1 weka introducing
1 weka introducing
 
Weka dataprepocessing
Weka dataprepocessingWeka dataprepocessing
Weka dataprepocessing
 
09 anomaly detection
09 anomaly detection09 anomaly detection
09 anomaly detection
 
08 clustering
08 clustering08 clustering
08 clustering
 
07 classification 3 neural network
07 classification 3 neural network07 classification 3 neural network
07 classification 3 neural network
 

KÞrzlich hochgeladen

āļāļēāļĢāđ€āļ‚āļĩāļĒāļ™āļ‚āđ‰āļ­āđ€āļŠāļ™āļ­āđ‚āļ„āļĢāļ‡āļāļēāļĢāļ§āļīāļˆāļąāļĒ (Research Proposal)
āļāļēāļĢāđ€āļ‚āļĩāļĒāļ™āļ‚āđ‰āļ­āđ€āļŠāļ™āļ­āđ‚āļ„āļĢāļ‡āļāļēāļĢāļ§āļīāļˆāļąāļĒ (Research Proposal)āļāļēāļĢāđ€āļ‚āļĩāļĒāļ™āļ‚āđ‰āļ­āđ€āļŠāļ™āļ­āđ‚āļ„āļĢāļ‡āļāļēāļĢāļ§āļīāļˆāļąāļĒ (Research Proposal)
āļāļēāļĢāđ€āļ‚āļĩāļĒāļ™āļ‚āđ‰āļ­āđ€āļŠāļ™āļ­āđ‚āļ„āļĢāļ‡āļāļēāļĢāļ§āļīāļˆāļąāļĒ (Research Proposal)
Prachyanun Nilsook
 
Meaning Recognition āļāļēāļĢāđƒāļŠāđ‰āļ„āļģāļĻāļąāļžāļ—āđŒāđƒāļŦāđ‰āļ•āļĢāļ‡āļ„āļ§āļēāļĄāļŦāļĄāļēāļĒ.pdf
Meaning Recognition āļāļēāļĢāđƒāļŠāđ‰āļ„āļģāļĻāļąāļžāļ—āđŒāđƒāļŦāđ‰āļ•āļĢāļ‡āļ„āļ§āļēāļĄāļŦāļĄāļēāļĒ.pdfMeaning Recognition āļāļēāļĢāđƒāļŠāđ‰āļ„āļģāļĻāļąāļžāļ—āđŒāđƒāļŦāđ‰āļ•āļĢāļ‡āļ„āļ§āļēāļĄāļŦāļĄāļēāļĒ.pdf
Meaning Recognition āļāļēāļĢāđƒāļŠāđ‰āļ„āļģāļĻāļąāļžāļ—āđŒāđƒāļŦāđ‰āļ•āļĢāļ‡āļ„āļ§āļēāļĄāļŦāļĄāļēāļĒ.pdf
George638435
 

KÞrzlich hochgeladen (8)

āļāļēāļĢāđ€āļ‚āļĩāļĒāļ™āļ‚āđ‰āļ­āđ€āļŠāļ™āļ­āđ‚āļ„āļĢāļ‡āļāļēāļĢāļ§āļīāļˆāļąāļĒ (Research Proposal)
āļāļēāļĢāđ€āļ‚āļĩāļĒāļ™āļ‚āđ‰āļ­āđ€āļŠāļ™āļ­āđ‚āļ„āļĢāļ‡āļāļēāļĢāļ§āļīāļˆāļąāļĒ (Research Proposal)āļāļēāļĢāđ€āļ‚āļĩāļĒāļ™āļ‚āđ‰āļ­āđ€āļŠāļ™āļ­āđ‚āļ„āļĢāļ‡āļāļēāļĢāļ§āļīāļˆāļąāļĒ (Research Proposal)
āļāļēāļĢāđ€āļ‚āļĩāļĒāļ™āļ‚āđ‰āļ­āđ€āļŠāļ™āļ­āđ‚āļ„āļĢāļ‡āļāļēāļĢāļ§āļīāļˆāļąāļĒ (Research Proposal)
 
Meaning Recognition āļāļēāļĢāđƒāļŠāđ‰āļ„āļģāļĻāļąāļžāļ—āđŒāđƒāļŦāđ‰āļ•āļĢāļ‡āļ„āļ§āļēāļĄāļŦāļĄāļēāļĒ.pdf
Meaning Recognition āļāļēāļĢāđƒāļŠāđ‰āļ„āļģāļĻāļąāļžāļ—āđŒāđƒāļŦāđ‰āļ•āļĢāļ‡āļ„āļ§āļēāļĄāļŦāļĄāļēāļĒ.pdfMeaning Recognition āļāļēāļĢāđƒāļŠāđ‰āļ„āļģāļĻāļąāļžāļ—āđŒāđƒāļŦāđ‰āļ•āļĢāļ‡āļ„āļ§āļēāļĄāļŦāļĄāļēāļĒ.pdf
Meaning Recognition āļāļēāļĢāđƒāļŠāđ‰āļ„āļģāļĻāļąāļžāļ—āđŒāđƒāļŦāđ‰āļ•āļĢāļ‡āļ„āļ§āļēāļĄāļŦāļĄāļēāļĒ.pdf
 
1-2_āļ›āļąāļāļŦāļēāđāļĨāļ°āđ€āļ‰āļĨāļĒāļ‚āđ‰āļ­āļŠāļ­āļšāļšāļēāļĨāļĩāļŠāļ™āļēāļĄāļŦāļĨāļ§āļ‡ āļ§āļīāļŠāļē āđāļ›āļĨāļĄāļ„āļ˜āđ€āļ›āđ‡āļ™āđ„āļ—āļĒ āļ›āļĢāļ°āđ‚āļĒāļ„ 1-2 (2510-2567).pdf
1-2_āļ›āļąāļāļŦāļēāđāļĨāļ°āđ€āļ‰āļĨāļĒāļ‚āđ‰āļ­āļŠāļ­āļšāļšāļēāļĨāļĩāļŠāļ™āļēāļĄāļŦāļĨāļ§āļ‡ āļ§āļīāļŠāļē āđāļ›āļĨāļĄāļ„āļ˜āđ€āļ›āđ‡āļ™āđ„āļ—āļĒ āļ›āļĢāļ°āđ‚āļĒāļ„ 1-2 (2510-2567).pdf1-2_āļ›āļąāļāļŦāļēāđāļĨāļ°āđ€āļ‰āļĨāļĒāļ‚āđ‰āļ­āļŠāļ­āļšāļšāļēāļĨāļĩāļŠāļ™āļēāļĄāļŦāļĨāļ§āļ‡ āļ§āļīāļŠāļē āđāļ›āļĨāļĄāļ„āļ˜āđ€āļ›āđ‡āļ™āđ„āļ—āļĒ āļ›āļĢāļ°āđ‚āļĒāļ„ 1-2 (2510-2567).pdf
1-2_āļ›āļąāļāļŦāļēāđāļĨāļ°āđ€āļ‰āļĨāļĒāļ‚āđ‰āļ­āļŠāļ­āļšāļšāļēāļĨāļĩāļŠāļ™āļēāļĄāļŦāļĨāļ§āļ‡ āļ§āļīāļŠāļē āđāļ›āļĨāļĄāļ„āļ˜āđ€āļ›āđ‡āļ™āđ„āļ—āļĒ āļ›āļĢāļ°āđ‚āļĒāļ„ 1-2 (2510-2567).pdf
 
āļĢāļēāļĒāļ‡āļēāļ™āđ‚āļ„āļĢāļ‡āļ‡āļēāļ™āļāļēāļĢāļ­āļ­āļāđāļšāļšāļĨāļēāļĒāđ€āļŠāļ·āđˆāļ­āđ‚āļ”āļĒāđƒāļŠāđ‰āļĢāļđāļ›āđ€āļĢāļ‚āļēāļ„āļ“āļīāļ• āļĢāļ°āļ”āļąāļšāļ›āļĢāļ°āđ€āļ—āļĻ.pdf
āļĢāļēāļĒāļ‡āļēāļ™āđ‚āļ„āļĢāļ‡āļ‡āļēāļ™āļāļēāļĢāļ­āļ­āļāđāļšāļšāļĨāļēāļĒāđ€āļŠāļ·āđˆāļ­āđ‚āļ”āļĒāđƒāļŠāđ‰āļĢāļđāļ›āđ€āļĢāļ‚āļēāļ„āļ“āļīāļ• āļĢāļ°āļ”āļąāļšāļ›āļĢāļ°āđ€āļ—āļĻ.pdfāļĢāļēāļĒāļ‡āļēāļ™āđ‚āļ„āļĢāļ‡āļ‡āļēāļ™āļāļēāļĢāļ­āļ­āļāđāļšāļšāļĨāļēāļĒāđ€āļŠāļ·āđˆāļ­āđ‚āļ”āļĒāđƒāļŠāđ‰āļĢāļđāļ›āđ€āļĢāļ‚āļēāļ„āļ“āļīāļ• āļĢāļ°āļ”āļąāļšāļ›āļĢāļ°āđ€āļ—āļĻ.pdf
āļĢāļēāļĒāļ‡āļēāļ™āđ‚āļ„āļĢāļ‡āļ‡āļēāļ™āļāļēāļĢāļ­āļ­āļāđāļšāļšāļĨāļēāļĒāđ€āļŠāļ·āđˆāļ­āđ‚āļ”āļĒāđƒāļŠāđ‰āļĢāļđāļ›āđ€āļĢāļ‚āļēāļ„āļ“āļīāļ• āļĢāļ°āļ”āļąāļšāļ›āļĢāļ°āđ€āļ—āļĻ.pdf
 
4_āļ›āļąāļāļŦāļēāđāļĨāļ°āđ€āļ‰āļĨāļĒāļ‚āđ‰āļ­āļŠāļ­āļšāļšāļēāļĨāļĩāļŠāļ™āļēāļĄāļŦāļĨāļ§āļ‡ āļ§āļīāļŠāļē āđāļ›āļĨāđ„āļ—āļĒāđ€āļ›āđ‡āļ™āļĄāļ„āļ˜ āļ›āļĢāļ°āđ‚āļĒāļ„ āļ›.āļ˜.4 (2505-2567).pdf
4_āļ›āļąāļāļŦāļēāđāļĨāļ°āđ€āļ‰āļĨāļĒāļ‚āđ‰āļ­āļŠāļ­āļšāļšāļēāļĨāļĩāļŠāļ™āļēāļĄāļŦāļĨāļ§āļ‡ āļ§āļīāļŠāļē āđāļ›āļĨāđ„āļ—āļĒāđ€āļ›āđ‡āļ™āļĄāļ„āļ˜ āļ›āļĢāļ°āđ‚āļĒāļ„ āļ›.āļ˜.4 (2505-2567).pdf4_āļ›āļąāļāļŦāļēāđāļĨāļ°āđ€āļ‰āļĨāļĒāļ‚āđ‰āļ­āļŠāļ­āļšāļšāļēāļĨāļĩāļŠāļ™āļēāļĄāļŦāļĨāļ§āļ‡ āļ§āļīāļŠāļē āđāļ›āļĨāđ„āļ—āļĒāđ€āļ›āđ‡āļ™āļĄāļ„āļ˜ āļ›āļĢāļ°āđ‚āļĒāļ„ āļ›.āļ˜.4 (2505-2567).pdf
4_āļ›āļąāļāļŦāļēāđāļĨāļ°āđ€āļ‰āļĨāļĒāļ‚āđ‰āļ­āļŠāļ­āļšāļšāļēāļĨāļĩāļŠāļ™āļēāļĄāļŦāļĨāļ§āļ‡ āļ§āļīāļŠāļē āđāļ›āļĨāđ„āļ—āļĒāđ€āļ›āđ‡āļ™āļĄāļ„āļ˜ āļ›āļĢāļ°āđ‚āļĒāļ„ āļ›.āļ˜.4 (2505-2567).pdf
 
āļ āļēāļĐāļēāļ­āļąāļ‡āļāļĪāļĐāđ€āļžāļ·āđˆāļ­āļāļēāļĢāļ›āļāļīāļšāļąāļ•āļīāļāļĢāļĢāļĄāļāļēāļ™āđƒāļ™āļžāļĢāļ°āļžāļļāļ—āļ˜āļĻāļēāļŠāļ™āļē
āļ āļēāļĐāļēāļ­āļąāļ‡āļāļĪāļĐāđ€āļžāļ·āđˆāļ­āļāļēāļĢāļ›āļāļīāļšāļąāļ•āļīāļāļĢāļĢāļĄāļāļēāļ™āđƒāļ™āļžāļĢāļ°āļžāļļāļ—āļ˜āļĻāļēāļŠāļ™āļēāļ āļēāļĐāļēāļ­āļąāļ‡āļāļĪāļĐāđ€āļžāļ·āđˆāļ­āļāļēāļĢāļ›āļāļīāļšāļąāļ•āļīāļāļĢāļĢāļĄāļāļēāļ™āđƒāļ™āļžāļĢāļ°āļžāļļāļ—āļ˜āļĻāļēāļŠāļ™āļē
āļ āļēāļĐāļēāļ­āļąāļ‡āļāļĪāļĐāđ€āļžāļ·āđˆāļ­āļāļēāļĢāļ›āļāļīāļšāļąāļ•āļīāļāļĢāļĢāļĄāļāļēāļ™āđƒāļ™āļžāļĢāļ°āļžāļļāļ—āļ˜āļĻāļēāļŠāļ™āļē
 
1-2_āļ›āļąāļāļŦāļēāđāļĨāļ°āđ€āļ‰āļĨāļĒāļ‚āđ‰āļ­āļŠāļ­āļšāļšāļēāļĨāļĩāļŠāļ™āļēāļĄāļŦāļĨāļ§āļ‡ āļ§āļīāļŠāļē āļšāļēāļĨāļĩāđ„āļ§āļĒāļēāļāļĢāļ“āđŒ āļ›āļĢāļ°āđ‚āļĒāļ„ 1-2 (2511-2567).pdf
1-2_āļ›āļąāļāļŦāļēāđāļĨāļ°āđ€āļ‰āļĨāļĒāļ‚āđ‰āļ­āļŠāļ­āļšāļšāļēāļĨāļĩāļŠāļ™āļēāļĄāļŦāļĨāļ§āļ‡ āļ§āļīāļŠāļē āļšāļēāļĨāļĩāđ„āļ§āļĒāļēāļāļĢāļ“āđŒ āļ›āļĢāļ°āđ‚āļĒāļ„ 1-2 (2511-2567).pdf1-2_āļ›āļąāļāļŦāļēāđāļĨāļ°āđ€āļ‰āļĨāļĒāļ‚āđ‰āļ­āļŠāļ­āļšāļšāļēāļĨāļĩāļŠāļ™āļēāļĄāļŦāļĨāļ§āļ‡ āļ§āļīāļŠāļē āļšāļēāļĨāļĩāđ„āļ§āļĒāļēāļāļĢāļ“āđŒ āļ›āļĢāļ°āđ‚āļĒāļ„ 1-2 (2511-2567).pdf
1-2_āļ›āļąāļāļŦāļēāđāļĨāļ°āđ€āļ‰āļĨāļĒāļ‚āđ‰āļ­āļŠāļ­āļšāļšāļēāļĨāļĩāļŠāļ™āļēāļĄāļŦāļĨāļ§āļ‡ āļ§āļīāļŠāļē āļšāļēāļĨāļĩāđ„āļ§āļĒāļēāļāļĢāļ“āđŒ āļ›āļĢāļ°āđ‚āļĒāļ„ 1-2 (2511-2567).pdf
 
3_āļ›āļąāļāļŦāļēāđāļĨāļ°āđ€āļ‰āļĨāļĒāļ‚āđ‰āļ­āļŠāļ­āļšāļšāļēāļĨāļĩāļŠāļ™āļēāļĄāļŦāļĨāļ§āļ‡ āļ§āļīāļŠāļē āļŠāļąāļĄāļžāļąāļ™āļ˜āđŒāđ„āļ—āļĒ āļ›āļĢāļ°āđ‚āļĒāļ„ āļ›.āļ˜.3 (2500-2567).pdf
3_āļ›āļąāļāļŦāļēāđāļĨāļ°āđ€āļ‰āļĨāļĒāļ‚āđ‰āļ­āļŠāļ­āļšāļšāļēāļĨāļĩāļŠāļ™āļēāļĄāļŦāļĨāļ§āļ‡ āļ§āļīāļŠāļē āļŠāļąāļĄāļžāļąāļ™āļ˜āđŒāđ„āļ—āļĒ āļ›āļĢāļ°āđ‚āļĒāļ„ āļ›.āļ˜.3 (2500-2567).pdf3_āļ›āļąāļāļŦāļēāđāļĨāļ°āđ€āļ‰āļĨāļĒāļ‚āđ‰āļ­āļŠāļ­āļšāļšāļēāļĨāļĩāļŠāļ™āļēāļĄāļŦāļĨāļ§āļ‡ āļ§āļīāļŠāļē āļŠāļąāļĄāļžāļąāļ™āļ˜āđŒāđ„āļ—āļĒ āļ›āļĢāļ°āđ‚āļĒāļ„ āļ›.āļ˜.3 (2500-2567).pdf
3_āļ›āļąāļāļŦāļēāđāļĨāļ°āđ€āļ‰āļĨāļĒāļ‚āđ‰āļ­āļŠāļ­āļšāļšāļēāļĨāļĩāļŠāļ™āļēāļĄāļŦāļĨāļ§āļ‡ āļ§āļīāļŠāļē āļŠāļąāļĄāļžāļąāļ™āļ˜āđŒāđ„āļ—āļĒ āļ›āļĢāļ°āđ‚āļĒāļ„ āļ›.āļ˜.3 (2500-2567).pdf
 

02 data werehouse

  • 2. āđ€āļ™āļ·āđ‰āļ­āļŦāļē  āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ (Data warehouse)  āļ§āļąāļ•āļ–āļļāļ›āļĢāļ°āļŠāļ‡āļ„āđŒāļ‚āļ­āļ‡āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ  āļ„āļļāļ“āļĨāļąāļāļĐāļ“āļ°āļ‚āļ­āļ‡āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ  āđāļšāļšāļˆāļēāļĨāļ­āļ‡āļ‚āļ­āļ‡ Data Warehouse  Star Schema  Snowflake Schema  āļāļēāļĢāđ€āļĨāļ·āļ­āļ Schema  OLAP āđāļĨāļ° Cubes  āļ•āļąāļ§āļ­āļĒāđˆāļēāļ‡āļāļēāļĢāļ”āļēāđ€āļ™āļīāļ™āļāļēāļĢāļāļąāļš OLAP  āđ€āļ›āļĢāļĩāļĒāļšāđ€āļ—āļĩāļĒāļš DBMS, OLAP, and Data Mining 2
  • 3. āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ (Data warehouse)  āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ āļ„āļ·āļ­ āļ—āļĩāđˆāđ€āļāđ‡āļšāļ‚āđ‰āļ­āļĄāļđāļĨāļ‚āļ­āļ‡āļ­āļ‡āļ„āđŒāļāļĢāļ—āļĩāđˆāđ„āļ”āđ‰āļĢāļąāļšāļāļēāļĢāļ­āļ­āļāđāļšāļš āđ€āļžāļ·āđˆāļ­āļŠāđˆāļ§āļĒāđƒāļ™ āļāļēāļĢāļ•āļąāļ”āļŠāļīāļ™āđƒāļˆāļ‚āļ­āļ‡āļāđˆāļēāļĒāļšāļĢāļīāļŦāļēāļĢāđ‚āļ”āļĒāļĢāļ°āļšāļšāļ‚āđ‰āļ­āļĄāļđāļĨāđ€āļžāļ·āđˆāļ­āļāļēāļĢāļšāļĢāļīāļŦāļēāļĢāļˆāļ°āđāļĒāļāļˆāļēāļ āļāļēāļ™āļ‚āđ‰āļ­āļĄāļđāļĨāļ‡āļēāļ™āļ›āļĢāļ°āļˆāļēāļ§āļąāļ™ āļ‹āļķāđˆāļ‡āļ­āļēāļˆāđ„āļ”āđ‰āļ‚āđ‰āļ­āļĄāļđāļĨāļˆāļēāļāļāļēāļ™āļ‚āđ‰āļ­āļĄāļđāļĨāļ‡āļēāļ™āļ›āļĢāļ°āļˆāļēāļ§āļąāļ™ āļŦāļĢāļ·āļ­āļˆāļēāļāļ āļēāļĒāļ™āļ­āļāļ­āļ‡āļ„āđŒāļāļĢ āđāļĨāļ°āđ€āļāđ‡āļšāļ‚āđ‰āļ­āļĄāļđāļĨāđƒāļ™āļĢāļđāļ›āđāļšāļšāļ‚āđ‰āļ­āļĄāļđāļĨāļŠāļĢāļļāļ› āļ™āļ­āļāļˆāļēāļāļ™āļĩāđ‰ āđƒāļ™āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨāļĒāļąāļ‡āđ€āļāđ‡āļšāđ€āļ„āļĢāļ·āđˆāļ­āļ‡āļĄāļ·āļ­āļŠāļēāļŦāļĢāļąāļšāļ”āļēāđ€āļ™āļīāļ™āļāļēāļĢāļāļąāļšāļ‚āđ‰āļ­āļĄāļđāļĨ āļāļĢāļ°āļšāļ§āļ™āļāļēāļĢ āļ—āļēāļ‡āļēāļ™āļāļąāļšāļ‚āđ‰āļ­āļĄāļđāļĨ āđāļĨāļ°āļ—āļĢāļąāļžāļĒāļēāļāļĢāļ­āļ·āđˆāļ™āđ† 3
  • 4. 4
  • 5. āļ§āļąāļ•āļ–āļļāļ›āļĢāļ°āļŠāļ‡āļ„āđŒāļ‚āļ­āļ‡āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ  āđ€āļ›āđ‰ āļēāļŦāļĄāļēāļĒāđƒāļ™āļāļēāļĢāļŠāļĢāđ‰āļēāļ‡āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ  āđ€āļžāļ·āđˆāļ­āđāļĒāļāļāļĨāļļāđˆāļĄāļ‚āđ‰āļ­āļĄāļđāļĨāļŠāļēāļĢāļŠāļ™āđ€āļ—āļĻāļ—āļĩāđˆāđƒāļŠāđ‰āđƒāļ™āļāļēāļĢāļ§āļīāđ€āļ„āļĢāļēāļ°āļŦāđŒāļ—āļēāļ‡āļ˜āļļāļĢāļāļīāļˆāļ­āļ­āļāļˆāļēāļāļāļēāļ™āļ‚āđ‰āļ­āļĄāļđāļĨāļ—āļĩāđˆāđƒāļŠāđ‰āļ‡āļēāļ™ āļ›āļĢāļ°āļˆāļēāļ§āļąāļ™ āđƒāļŦāđ‰āđ€āļāļīāļ”āļ›āļĢāļ°āļŠāļīāļ—āļ˜āļīāļ āļēāļžāļŠāļđāļ‡ āđāļĨāļ°āļ—āļēāđƒāļŦāđ‰āļāļēāļĢāđ€āļĢāļĩāļĒāļāđƒāļŠāđ‰āļ‚āđ‰āļ­āļĄāļđāļĨāļŠāļļāļ”āļ™āļĩāđ‰āļ—āļēāđ„āļ”āđ‰āļ­āļĒāđˆāļēāļ‡āļĒāļ·āļ”āļŦāļĒāļļāđˆāļ™ āļĢāļ§āļ”āđ€āļĢāđ‡āļ§āļĄāļēāļāļĒāļīāđˆāļ‡āļ‚āļķāđ‰āļ™  āļ›āļĢāļ°āđ‚āļĒāļŠāļ™āđŒāļ‚āļ­āļ‡āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ  āļ—āļēāļāļēāļĢāļĢāļ§āļšāļĢāļ§āļĄāļ‚āđ‰āļ­āļĄāļđāļĨāļ—āļĩāđˆāļĄāļĩāļ„āļ§āļēāļĄāļ‹āļąāļšāļ‹āđ‰āļ­āļ™āđƒāļŦāđ‰āļ‡āđˆāļēāļĒāļ•āđˆāļ­āļāļēāļĢāļˆāļąāļ”āđ€āļāđ‡āļš  āļŠāļēāļĄāļēāļĢāļ–āļ™āļēāļ‚āđ‰āļ­āļĄāļđāļĨāļĄāļēāđƒāļŠāđ‰āđ„āļ”āđ‰āļ­āļĒāđˆāļēāļ‡āļĢāļ§āļ”āđ€āļĢāđ‡āļ§āđāļĨāļ°āļ–āļđāļāļ•āđ‰āļ­āļ‡ 5
  • 6. āļāļēāļĢāļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ (Data Warehousing)  āļāļĢāļ°āļšāļ§āļ™āļāļēāļĢāđƒāļ™ Data Warehousing āļ›āļĢāļ°āļāļ­āļšāđ„āļ›āļ”āđ‰āļ§āļĒ Data Warehouse Data Source 1 Data Source 2 Data Source 3 Data Resources Data Staging Data Store Data Provisioning āļŦāļĢāļ·āļ­ Data Mart Staging Database Data Data Cleaning and Filtering 6
  • 7. āļāļēāļĢāļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ (Data Warehousing)  āļāļēāļĢāļĢāļąāļšāļ‚āđ‰āļ­āļĄāļđāļĨāđ€āļ‚āđ‰āļē (Data Resources) āļŦāļĄāļēāļĒāļ–āļķāļ‡ āļ§āļīāļ˜āļĩāļāļēāļĢāđāļĨāļ°āļĢāļ°āļšāļšāļ—āļĩāđˆāļˆāļ°āļ—āļēāđƒāļŦāđ‰āļ‚āđ‰āļ­āļĄāļđāļĨāļˆāļēāļ Data source āļ–āļđāļāļ™āļēāļĄāļēāđ€āļ‚āđ‰āļē āļŠāļđāđˆāļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ  āļāļēāļĢāļŠāļ–āļēāļ™āļ°āļ‚āđ‰āļ­āļĄāļđāļĨ (Data Staging) āđ€āļ›āđ‡āļ™āļ§āļīāļ˜āļĩāļāļēāļĢāļ—āļĩāđˆāļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨāļˆāļ°āļ›āļĢāļąāļšāļ‚āđ‰āļ­āļĄāļđāļĨāđ€āļžāļ·āđˆāļ­āļĨāļ”āļ„āļ§āļēāļĄāļ‹āđ‰āļēāļ‹āđ‰āļ­āļ™ (Cleansing) āđāļĨāļ°āđ€āļĨāļ·āļ­āļāđ€āļ‰āļžāļēāļ°āļ‚āđ‰āļ­āļĄāļđāļĨāļ—āļĩāđˆāđ€āļ›āđ‡āļ™āļ›āļĢāļ°āđ‚āļĒāļŠāļ™āđŒ (Filtering) āđ€āļžāļ·āđˆāļ­āļ™āļēāļĄāļēāđ€āļāđ‡āļšāđ„āļ§āđ‰āđƒāļ™ āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨāđ€āļžāļ·āđˆāļ­āđƒāļŠāđ‰āļ‡āļēāļ™āļ•āđˆāļ­āđ„āļ› 7
  • 8. āļāļēāļĢāļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ (Data Warehousing)  āļāļēāļĢāļˆāļąāļ”āđ€āļāđ‡āļšāļ‚āđ‰āļ­āļĄāļđāļĨ (Data Store) āļāļēāļĢāļ™āļēāđ€āļ­āļēāļ‚āđ‰āļ­āļĄāļđāļĨāļ—āļĩāđˆāļœāđˆāļēāļ™āļāļēāļĢ Cleansing āđāļĨāļ° Filtering āđāļĨāđ‰āļ§āļĄāļēāđ€āļāđ‡āļšāļšāļąāļ™āļ—āļķāļāļĨāļ‡ āđƒāļ™ Data Warehouse āļ‹āļķāđˆāļ‡āļŠāđˆāļ§āļ™āļ—āļĩāđˆāļ—āļēāļŦāļ™āđ‰āļēāļ—āļĩāđˆāļˆāļąāļ”āđ€āļāđ‡āļšāļ‚āđ‰āļ­āļĄāļđāļĨāđ€āļĢāļĩāļĒāļāļ§āđˆāļē “Data warehouse Database”  āļāļēāļĢāđ€āļ•āļĢāļĩāļĒāļĄāļ‚āđ‰āļ­āļĄāļđāļĨāđ€āļžāļ·āđˆāļ­āđƒāļŠāđ‰āļ‡āļēāļ™ (Data Provisioning) āļŦāļĄāļēāļĒāļ–āļķāļ‡ āļāļēāļĢāļ™āļēāđ€āļ­āļēāļ‚āđ‰āļ­āļĄāļđāļĨāļ—āļĩāđˆāļĄāļĩāļ­āļĒāļđāđˆāđƒāļ™āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨāļĄāļēāļ›āļĢāļ°āļĄāļ§āļĨāļœāļĨāđ€āļžāļ·āđˆāļ­āđƒāļŦāđ‰āđ„āļ”āđ‰ āļŠāļēāļĢāļŠāļ™āđ€āļ—āļĻāļ—āļĩāđˆāļ•āđ‰āļ­āļ‡āļāļēāļĢāđ€āļžāļ·āđˆāļ­āļĢāļ­āļāļēāļĢāđƒāļŠāđ‰āļ‡āļēāļ™āļ•āđˆāļ­āđ„āļ› āļšāļēāļ‡āļ—āļĩāđ€āļĢāļĩāļĒāļāļ§āđˆāļē “Data Mart” 8
  • 9. āļ„āļļāļ“āļĨāļąāļāļĐāļ“āļ°āļ‚āļ­āļ‡āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ 1. āļāļēāļĢāđāļšāđˆāļ‡āđ‚āļ„āļĢāļ‡āļŠāļĢāđ‰āļēāļ‡āļ•āļēāļĄāđ€āļ™āļ·āđ‰āļ­āļŦāļē Subject-Oriented  āļ‚āđ‰āļ­āļĄāļđāļĨāļ–āļđāļāļˆāļąāļ”āļāļĨāļļāđˆāļĄāđƒāļŦāđ‰āđ€āļŦāļĄāļēāļ°āļŠāļĄāļāļąāļšāļāļēāļĢāļŠāļ·āļšāļ„āđ‰āļ™ āļˆāļąāļ”āļ•āļēāļĄāļ›āļĢāļ°āđ€āļ”āđ‡āļ™āļŦāļĨāļąāļāļ‚āļ­āļ‡āļ­āļ‡āļ„āđŒāļāļĢ āđ€āļŠāđˆāļ™  āļĨāļđāļāļ„āđ‰āļē āļŠāļīāļ™āļ„āđ‰āļē āļĒāļ­āļ”āļ‚āļēāļĒ  āļ‚āđ‰āļ­āļĄāļđāļĨāļˆāļ°āđ„āļĄāđˆāļ–āļđāļāļˆāļąāļ”āļ•āļēāļĄāļŦāļ™āđ‰āļēāļ—āļĩāđˆāļāļēāļĢāļ‡āļēāļ™āļ‚āļ­āļ‡āđ‚āļ›āļĢāđāļāļĢāļĄāđƒāļ”āđ‚āļ›āļĢāđāļāļĢāļĄāļŦāļ™āļķāđˆāļ‡ āđ€āļŠāđˆāļ™  āļāļēāļĢāļ„āļ§āļšāļ„āļļāļĄāļ„āļĨāļąāļ‡āļŠāļīāļ™āļ„āđ‰āļē āļāļēāļĢāļ­āļ­āļāđƒāļšāļāļēāļāļąāļšāļ āļēāļĐāļĩ 9
  • 11. āļ„āļļāļ“āļĨāļąāļāļĐāļ“āļ°āļ‚āļ­āļ‡āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ (āļ•āđˆāļ­) 2. āļāļēāļĢāļĢāļ§āļĄāđ€āļ›āđ‡āļ™āļŦāļ™āļķāđˆāļ‡āđ€āļ”āļĩāļĒāļ§ Integrated  āļˆāļąāļ”āļ‚āđ‰āļ­āļĄāļđāļĨāđƒāļŦāđ‰āļ­āļĒāļđāđˆāđƒāļ™āļĢāļđāļ›āđāļšāļšāđ€āļ”āļĩāļĒāļ§āļāļąāļ™ āļˆāļēāļāđāļŦāļĨāđˆāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨāļŦāļĨāļēāļĒāđāļŦāļĨāđˆāļ‡ 11
  • 12. āļ„āļļāļ“āļĨāļąāļāļĐāļ“āļ°āļ‚āļ­āļ‡āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ (āļ•āđˆāļ­) 3. āļ„āļ§āļēāļĄāļŠāļąāļĄāļžāļąāļ™āļ˜āđŒāļāļąāļšāđ€āļ§āļĨāļē Time-Variant  āļ‚āđ‰āļ­āļĄāļđāļĨāļ•āđ‰āļ­āļ‡āļĄāļĩāļ„āļ§āļēāļĄāļ–āļđāļāļ•āđ‰āļ­āļ‡ āđ€āļžāļĢāļēāļ°āđ€āļāđ‡āļšāđ„āļ§āđ‰āđƒāļŠāđ‰āļ™āļēāļ™ 5-10 āļ›āļĩ 4. āļ„āļ§āļēāļĄāđ€āļŠāļ–āļĩāļĒāļĢāļ‚āļ­āļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ Non-Volatile  āļāļēāļĢāļ›āļĢāļąāļšāļ›āļĢāļļāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨāđ€āļ›āđ‡āļ™āļāļēāļĢāđ€āļžāļīāđˆāļĄāļ‚āđ‰āļ­āļĄāļđāļĨāđƒāļŦāļĄāđˆāđ€āļ‚āđ‰āļēāđ„āļ›āđ€āļĢāļ·āđˆāļ­āļĒāđ† āđ„āļĄāđˆāđƒāļŠāđˆāļāļēāļĢāđāļ—āļ™āļ—āļĩāđˆāļ‚āđ‰āļ­āļĄāļđāļĨ āđ€āļāđˆāļē 12
  • 13. āđāļšāļšāļˆāļēāļĨāļ­āļ‡āļ‚āļ­āļ‡ Data Warehouse  āļāđˆāļ­āļ™āļ—āļĩāđˆāļˆāļ°āļ—āļēāļāļēāļĢāļ­āļ­āļāđāļšāļš āļ•āđ‰āļ­āļ‡āļĻāļķāļāļĐāļēāļŠāđˆāļ§āļ™āļ›āļĢāļ°āļāļ­āļšāļ‚āļ­āļ‡ āđāļšāļšāļˆāļēāļĨāļ­āļ‡āļžāļ·āđ‰āļ™āļāļēāļ™āļ‹āļķāđˆāļ‡ āļ›āļĢāļ°āļāļ­āļšāļ”āđ‰āļ§āļĒ āļ”āļąāļ‡āļ™āļĩāđ‰ āļŠāđˆāļ§āļ™āļ›āļĢāļ°āļāļ­āļš āļĢāļēāļĒāļĨāļ°āđ€āļ­āļĩāļĒāļ” Fact table āđ€āļ›āđ‡āļ™āļ•āļēāļĢāļēāļ‡āļĻāļđāļ™āļĒāđŒāļāļĨāļēāļ‡āļ—āļĩāđˆāđƒāļŠāđ‰āđƒāļ™ data warehouse āđāļĨāļ° data mart āļ—āļĩāđˆāļˆāļ°āđ€āļāđ‡āļšāļˆāļēāļ™āļ§āļ™ measures āđāļĨāļ°āļĢāļēāļĒāļĨāļ°āđ€āļ­āļĩāļĒāļ”āļŠāļēāļ„āļąāļ āđƒāļ™āđ€āļŠāļīāļ‡āļ˜āļļāļĢāļāļīāļˆ Fact āļ„āļ·āļ­ row āđƒāļ™āļ•āļēāļĢāļēāļ‡ āđ‚āļ”āļĒ fact āļˆāļ°āđ€āļāđ‡āļšāļ„āđˆāļēāļ•āļąāļ§āđ€āļĨāļ‚āļ—āļĩāđˆāđƒāļŠāđ‰āļ§āļąāļ” āđ€āļŦāļ•āļļāļāļēāļĢāļ“āđŒāļ—āļĩāđˆāđ€āļāļīāļ”āļ‚āļķāđ‰āļ™ Measure āļ„āļ·āļ­ āļ›āļĢāļīāļĄāļēāļ“, āļˆāļēāļ™āļ§āļ™ column āđƒāļ™ fact table āđ‚āļ”āļĒ measure āļˆāļ°āđāļŠāļ”āļ‡āđƒāļŦāđ‰āđ€āļŦāđ‡āļ™āļ–āļķāļ‡āļ„āđˆāļēāļ—āļĩāđˆāļ–āļđāļāļ§āļīāđ€āļ„āļĢāļēāļ°āļŦāđŒāđāļĨāđ‰āļ§ Dimension āļ„āļ·āļ­ āđ€āļ­āļāļĨāļąāļāļĐāļ“āđŒāļ—āļēāļ‡āļ˜āļļāļĢāļāļīāļˆāđ€āļ›āđ‡āļ™āļĨāļąāļāļĐāļ“āļ°āļ—āļēāļ‡āļāļēāļĒāļ āļēāļž Dimension table āđ€āļ›āđ‡āļ™āļ•āļēāļĢāļēāļ‡āđƒāļ™ data warehouse āļŦāļĢāļ·āļ­ data mart āļ—āļĩāđˆ āļ­āļ˜āļīāļšāļēāļĒāļ‚āđ‰āļ­āļĄāļđāļĨāđƒāļ™ fact table 13
  • 14. Star Schema  star schema āļˆāļ°āļĄāļĩāļĨāļąāļāļĐāļ“āļ°āļ—āļĩāđˆāļĄāļĩ fact table āļ­āļĒāļđāđˆāļ•āļĢāļ‡āļāļĨāļēāļ‡āļĨāđ‰āļ­āļĄāļĢāļ­āļšāļ”āđ‰āļ§āļĒāļŦāļĨāļēāļĒ āđ† dimension table āļ—āļĩāđˆāđ€āļāđ‡āļšāļĢāļēāļĒāļĨāļ°āđ€āļ­āļĩāļĒāļ”āļ‚āļ­āļ‡ fact āļ—āļĩāđˆāđ„āļĄāđˆāđƒāļŠāđˆ normalized center 14
  • 15. Star Schema Store Key Product Key Period Key Units Price Store Dimension Time Dimension Product Dimension Fact Table Store Key Store Name City State Region Period Key Year Quarter Month Product Key Product Desc 15
  • 16. Star Schema Store Dimension Time Dimension Product Dimension Fact Table Store Key Store Name City State Region Period Key Year Quarter Month Product Key Product Desc Dimension tables Dimension Store Key Product Key Period Key Units Price Fact 16
  • 17. Snowflake Schema Store Key Product Key Period Key Units Price Time Dimension Product Dimension Fact Table Store Key Store Name City Key Period Key Year Quarter Month Product Key Product Desc City Key City State Region City Dimension Store Dimension â€Ē Snowflake schema āļĄāļĩāļ„āļ§āļēāļĄāđāļ•āļāļ•āđˆāļēāļ‡āļˆāļēāļ Star schema āļ•āļĢāļ‡āļ—āļĩāđˆ dimension table āļˆāļ°āđ€āļāđ‡āļš āļ‚āđ‰āļ­āļĄāļđāļĨāļˆāļ°āđ€āļāđ‡āļšāļ‚āđ‰āļ­āļĄāļđāļĨāļ—āļĩāđˆāļ­āļĒāļđāđˆāđƒāļ™āļĢāļđāļ› normal form 17
  • 18. āļāļēāļĢāđ€āļĨāļ·āļ­āļ Schema  āļĄāļĩāđāļšāļšāđƒāļ™āļāļēāļĢāļ­āļ­āļāđāļšāļšāļ­āļĒāļđāđˆ 2 āđāļšāļšāļ—āļĩāđˆāđƒāļŠāđ‰āđƒāļ™āļāļēāļĢāļ­āļ­āļāđāļšāļš Data Warehouse  Star Schema  āļ§āļīāļ˜āļĩāļ™āļĩāđ‰āļˆāļ°āļŠāđˆāļ§āļĒāđ€āļžāļīāđˆāļĄāļ„āļ§āļēāļĄāļŠāļēāļĄāļēāļĢāļ–āđƒāļ™āļāļēāļĢāļ„āđ‰āļ™āļŦāļēāļ‚āđ‰āļ­āļĄāļđāļĨ  āļāļēāļĢāļ§āļīāđ€āļ„āļĢāļēāļ°āļŦāđŒāļāļēāļĢāļ„āđ‰āļ™āļŦāļēāļ‚āđ‰āļ­āļĄāļđāļĨāđƒāļ™ dimension table āļ—āļĩāđˆāđ€āļĨāđ‡āļāļˆāļ°āđƒāļŠāđ‰ dimension key āļˆāļēāļ index āđƒāļ™ central fact table  Snowflake Schema  āļˆāļ°āđƒāļŠāđ‰āđƒāļ™āļ—āļēāļ‡āļ˜āļļāļĢāļāļīāļˆ āđāļ•āđˆāļˆāļ°āđ„āļĄāđˆāđāļ™āļ°āļ™āļēāđƒāļŦāđ‰āđ€āļĨāļ·āļ­āļāļ§āļīāļ˜āļĩāļ™āļĩāđ‰ āđ€āļ™āļ·āđˆāļ­āļ‡āļˆāļēāļāļ§āļīāļ˜āļĩ āļ™āļĩāđ‰āļĄāļĩāļ„āļ§āļēāļĄāļĒāļļāđˆāļ‡āļĒāļēāļāđƒāļ™ āļāļēāļĢāļ”āļđāđāļĨ āļāļēāļĢāđ€āļāđ‡āļšāļ‚āđ‰āļ­āļĄāļđāļĨāļœāļđāđ‰āđƒāļŠāđ‰āļĢāļ°āļšāļšāđ„āļĄāđˆāļŠāļēāļĄāļēāļĢāļ–āļĢāļđāđ‰āđ„āļ”āđ‰āļ§āđˆāļēāļ‚āđ‰āļ­āļĄāļđāļĨāļ­āļĒāļđāđˆāļ—āļĩāđˆ āđ„āļŦāļ™ āļ­āļĩāļāļ—āļąāđ‰āļ‡āļāļēāļĢ āđ€āļ‚āđ‰āļēāļ–āļķāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨāļĒāļąāļ‡āļŠāđ‰āļēāļ­āļĩāļ 18
  • 19. OLAP āđāļĨāļ° Cubes  OLAP āļŦāļĢāļ·āļ­ Online analytical processing āđ€āļ›āđ‡āļ™āđ€āļ—āļ„āđ‚āļ™āđ‚āļĨāļĒāļĩāļ—āļĩāđˆāļ›āļĢāļ°āļāļ­āļšāļ”āđ‰āļ§āļĒāđ€āļ„āļĢāļ·āđˆāļ­āļ‡āļĄāļ·āļ­āļ—āļĩāđˆ āļŠāđˆāļ§āļĒāļ”āļķāļ‡āđāļĨāļ°āļ™āļēāđ€āļŠāļ™āļ­āļ‚āđ‰āļ­āļĄāļđāļĨāđƒāļ™āļŦāļĨāļēāļĒāļĄāļīāļ•āļī (Multidimensional) āļˆāļēāļāļŦāļĨāļēāļĒ āđ† āļĄāļļāļĄāļĄāļ­āļ‡ āđ‚āļ”āļĒ āļ—āļĩāđˆ OLAP āđ„āļ”āđ‰āļĢāļąāļšāļāļēāļĢāļ­āļ­āļāđāļšāļšāļĄāļēāļŠāļēāļŦāļĢāļąāļšāļœāļđāđ‰āđƒāļŠāđ‰āđƒāļ™āļĢāļ°āļ”āļąāļšāļ‚āļ­āļ‡āļœāļđāđ‰āļšāļĢāļīāļŦāļēāļĢāļŦāļĢāļ·āļ­āļŦāļ™āđˆāļ§āļĒāļ‡āļēāļ™āđƒāļ™ āļ­āļ‡āļ„āđŒāļāļĢ āļ—āļĩāđˆāļ•āđ‰āļ­āļ‡āļ§āļīāđ€āļ„āļĢāļēāļ°āļŦāđŒāļ‚āđ‰āļ­āļĄāļđāļĨāđ€āļžāļ·āđˆāļ­āđƒāļŠāđ‰āļ›āļĢāļ°āļāļ­āļšāļāļēāļĢāļ•āļąāļ”āļŠāļīāļ™āđƒāļˆāđƒāļ™āļĢāļ°āļ”āļąāļšāļŠāļđāļ‡ āļāļēāļĢ āļ›āļĢāļ°āļĄāļ§āļĨāļœāļĨāļˆāļ°āļ­āļĒāļđāđˆāļĢāļđāļ›āļĨāļđāļāļšāļēāļĻāļāđŒāļ—āļĩāđˆāļĄāļĩāļŦāļĨāļēāļĒāļĄāļīāļ•āļī āđ€āļĢāļĩāļĒāļāļ§āđˆāļē “Cube” Data Warehouse Time Product 19
  • 20. āļāļēāļĢāļ”āļēāđ€āļ™āļīāļ™āļāļēāļĢāļāļąāļš OLAP 1. Roll up / Consolidation āļāļēāļĢāļ›āļĢāļąāļšāļĢāļ°āļ”āļąāļšāļ„āļ§āļēāļĄāļĨāļ°āđ€āļ­āļĩāļĒāļ”āļ‚āļ­āļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ āļˆāļēāļāļĢāļ°āļ”āļąāļš āļ—āļĩāđˆāļĨāļ°āđ€āļ­āļĩāļĒāļ”āļ‚āļķāđ‰āļ™āļĄāļēāļŠāļđāđˆāļ‚āđ‰āļ­āļĄāļđāļĨāļ—āļĩāđˆāļŦāļĒāļēāļšāļ‚āļķāđ‰āļ™ 2. Drill Down āļāļēāļĢāļ›āļĢāļąāļšāļĢāļ°āļ”āļąāļšāļ„āļ§āļēāļĄāļĨāļ°āđ€āļ­āļĩāļĒāļ”āļ‚āļ­āļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ āļˆāļēāļāļĢāļ°āļ”āļąāļšāļ—āļĩāđˆāļŦāļĒāļēāļš āđ„āļ›āļŠāļđāđˆāļ—āļĩāđˆāļ‚āđ‰āļ­āļĄāļđāļĨāļĨāļ°āđ€āļ­āļĩāļĒāļ”āļĄāļēāļāļ‚āļķāđ‰āļ™ 3. Slice āļāļēāļĢāđ€āļĨāļ·āļ­āļāļžāļīāļˆāļēāļĢāļ“āļēāļœāļĨāļĨāļąāļžāļ˜āđŒāļšāļēāļ‡āļŠāđˆāļ§āļ™āļ—āļĩāđˆāđ€āļĢāļēāļŠāļ™āđƒāļˆ āđ‚āļ”āļĒāđ€āļĨāļ·āļ­āļāđ€āļ‰āļžāļēāļ°āļ„āđˆāļēāļ—āļĩāđˆ āļ–āļđāļāļāļēāļāļąāļšāļ”āđ‰āļ§āļĒāļ‚āđ‰āļ­āļĄāļđāļĨāļšāļēāļ‡āļ„āđˆāļēāļ‚āļ­āļ‡āđāļ•āđˆāļĨāļ°āļĄāļīāļ•āļīāđ€āļ—āđˆāļēāļ™āļąāđ‰āļ™ 4. Dice āļāļĢāļ°āļšāļ§āļ™āļāļēāļĢāļžāļĨāļīāļāđāļāļ™āļŦāļĢāļ·āļ­āļĄāļīāļ•āļīāļ‚āļ­āļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ āđƒāļŦāđ‰āļ•āļĢāļ‡āļ•āļēāļĄāļ„āļ§āļēāļĄāļ•āđ‰āļ­āļ‡āļāļēāļĢ āļ‚āļ­āļ‡āļœāļđāđ‰āđƒāļŠāđ‰āļ‡āļēāļ™ 20
  • 21. āļ•āļąāļ§āļ­āļĒāđˆāļēāļ‡āļāļēāļĢāļ”āļēāđ€āļ™āļīāļ™āļāļēāļĢāļāļąāļš OLAP  āļšāļĢāļīāļĐāļąāļ—āđāļŦāđˆāļ‡āļŦāļ™āļķāđˆāļ‡ āļœāļĨāļīāļ•āļŠāļīāļ™āļ„āđ‰āļēāđ€āļāļĩāđˆāļĒāļ§āļāļąāļšāļ‚āļ™āļĄāļ›āļąāļ‡ (Bread) āđāļĨāļ°āļ„āļļāļāļāļĩāđ‰ (Cookies)  āļœāļĨāļīāļ•āļ āļąāļ“āļ‘āđŒāļŠāđˆāļ‡āļ­āļ­āļāļ‚āļēāļĒāļ—āļĩāđˆāļ āļēāļ„āļ•āļ°āļ§āļąāļ™āļ•āļ (West), āļ•āļ°āļ§āļąāļ™āļ•āļāđ€āļ‰āļĩāļĒāļ‡āđ€āļŦāļ™āļ·āļ­ (Northwest) āļ‚āļ­āļ‡āļ›āļĢāļ°āđ€āļ—āļĻāļ­āļīāļ™āđ€āļ”āļĩāļĒ āļ„āļ·āļ­āļŠāļēāļ‚āļēāļ—āļĩāđˆāđ€āļĄāļ·āļ­āļ‡ Mumbai, Pune, Ahmadabad, Baroda  āļ›āļĢāļ°āļ˜āļēāļ™āļšāļĢāļīāļĐāļąāļ—āļ•āđ‰āļ­āļ‡āļāļēāļĢāļ”āļđāļ‚āđ‰āļ­āļĄāļđāļĨāļāļēāļĢāļ‚āļēāļĒāļ•āđ‰āļ­āļ‡āļ—āļēāļ­āļĒāđˆāļēāļ‡āđ„āļĢ?? 21
  • 22. Sale Data warehouse Model City_ID Prod_ID Month Units Rupees 1 589 1/1/1998 3 7.95 1 1218 1/1/1998 4 7.32 2 589 1/1/1998 3 7.95 2 1218 1/1/1998 4 7.32 1 580 2/1/1998 16 42.40 Product Tables Prod_ID Product_Name Product_Category_ID 589 Wheat Bread 1 590 White Bread 1 288 Coconut Cookies 2 1218 Cheese 1 580 Swiss Rolls 1 Product_Category_ID Product_Category 1 Bread 2 Cookies City_ID City Region Country 1 Mumbai West India 2 Pune NorthWest India City Table Sale Table Product_Category 22
  • 23. Sale Data warehouse Model City_ID Prod_ID Month Units Rupees 1 589 1/1/1998 3 7.95 1 1218 1/1/1998 4 7.32 2 589 1/1/1998 3 7.95 2 1218 1/1/1998 4 7.32 1 580 2/1/1998 16 42.40 Product Tables (Dimension Table) Product_Category_ID Product_Category 1 Bread 2 Cookies City_ID City Region Country 1 Mumbai West India 2 Pune NorthWest India City Table (Dimension Table) Sale Table (Fact Table) Prod_ID Product_Name Product_Category_ID 589 Wheat Bread 1 590 White Bread 1 288 Coconut Cookies 2 1218 Cheese 1 580 Swiss Rolls 1 Product_Category 23
  • 24. Sales Fact Table  āļĄāļīāļ•āļīāļĄāļļāļĄāļĄāļ­āļ‡ (Dimensions) – āļžāļ·āđ‰āļ™āļ—āļĩāđˆ (Region) āļŦāļĢāļ·āļ­āļŠāļēāļ‚āļē (city), āļŠāļīāļ™āļ„āđ‰āļē (Product), āđ€āļ§āļĨāļē (Time)  āļ›āļĢāļīāļĄāļēāļ“ (Measure) – āļĒāļ­āļ”āļ‚āļēāļĒāļŠāļīāļ™āļ„āđ‰āļē (Units), āļĢāļēāļ„āļē (Price) 24
  • 25. Sale Data warehouse Model City Product Month Units Rupees Mumbai Wheat Bread January 3 7.95 Mumbai Cheese January 4 7.32 Pune Wheat Bread January 3 7.95 Pune Cheese January 4 7.32 Mumbai Swiss Rolls February 16 42.40 City_ID Prod_ID Month Units Rupees 1 589 1/1/1998 3 7.95 1 1218 1/1/1998 4 7.32 2 589 1/1/1998 3 7.95 2 1218 1/1/1998 4 7.32 1 580 2/1/1998 16 42.40 25
  • 26. āđ€āļĢāļīāđˆāļĄāļ”āļēāđ€āļ™āļīāļ™āļāļēāļĢāļāļąāļšāļāļēāļĢāļ—āļē OLAP City Product Month Units Rupees Mumbai Wheat Bread January 3 7.95 Mumbai Cheese January 4 7.32 Pune Wheat Bread January 3 7.95 Pune Cheese January 4 7.32 Mumbai Wheat Bread February 16 42.40 26
  • 27. Sales Information Report: āļˆāļēāļ™āļ§āļ™āļŠāļīāđ‰āļ™āļ—āļĩāđˆāļ‚āļēāļĒāđ„āļ”āđ‰āļ—āļąāđ‰āļ‡āļŦāļĄāļ” 113 Report: āļˆāļēāļ™āļ§āļ™āļŠāļīāđ‰āļ™āļ—āļĩāđˆāļ‚āļēāļĒāđ„āļ”āđ‰āđƒāļ™āđāļ•āđˆāļĨāļ°āđ€āļ”āļ·āļ­āļ™ January February March April 14 41 33 25 27
  • 28. Sales Information  Report : āļˆāļēāļ™āļ§āļ™āļŠāļīāđ‰āļ™āļ—āļĩāđˆāļ‚āļēāļĒāđ„āļ”āđ‰āđāļĒāļāļ•āļēāļĄāļ›āļĢāļ°āđ€āļ āļ—āļ‚āļ­āļ‡āļŠāļīāļ™āļ„āđ‰āļē Jan Feb Mar Apr Wheat Bread 6 0 6 17 Cheese 8 16 6 8 Swiss Rolls 0 25 21 0 Time 2 āļĄāļīāļ•āļī 28
  • 29. Sales Information  Report: āļˆāļēāļ™āļ§āļ™āļŠāļīāđ‰āļ™āļ—āļĩāđˆāļ‚āļēāļĒāđ„āļ”āđ‰āđƒāļ™āđāļ•āđˆāļĨāļ°āļŠāļēāļ‚āļēāļŠāļēāļŦāļĢāļąāļšāđāļ•āđˆāļĨāļ°āļ›āļĢāļ°āđ€āļ āļ—āļ‚āļ­āļ‡ āļŠāļīāļ™āļ„āđ‰āļēāđƒāļ™āđāļ•āđˆāļĨāļ°āđ€āļ”āļ·āļ­āļ™ Jan Feb Mar Apr Mumbai Wheat Bread 3 0 3 10 Cheese 4 16 6 0 Swiss Rolls 0 16 6 0 Pune Wheat Bread 3 0 3 7 Cheese 4 0 0 8 Swiss Rolls 0 9 15 0 Time Product 3 āļĄāļīāļ•āļī 29
  • 31. Drill down & Roll up Roll Up Drill Down January February March April 14 41 33 25 Jan Feb Mar Apr Wheat Bread 6 6 17 Cheese 8 16 6 8 Swiss Rolls 25 21 Jan Feb Mar Apr Mumbai Wheat Bread 3 3 10 Cheese 4 16 6 Swiss Rolls 16 6 Pune Wheat Bread 3 3 7 Cheese 4 8 Swiss Rolls 9 15 31
  • 32. Slide Time Product Product= Swiss Rolls Wheat Bread Cheese Swiss Rolls Mumbai Pune Ahemdabad Baroda Jan Feb March Apr Time Jan Feb March Apr 3 10 3 7 1 1 1 2 10 5 3 4 10 5 3 4 3 10 3 7 1 1 1 2 32
  • 33. Slide Time Product Product= Cheese Wheat Bread Cheese Swiss Rolls Mumbai Pune Ahemdabad Baroda Jan Feb March Apr Time Jan Feb March Apr 3 10 3 7 1 1 1 2 10 5 3 4 10 5 3 4 3 16 6 3 8 1 1 1 2 33
  • 34. Slide Time Product Product= Swiss Rolls, Cheese, Wheat Bread Wheat Bread Cheese Swiss Rolls Mumbai Pune Ahemdabad Baroda Jan Feb March Apr Time Jan Feb March 3 10 3 7 1 1 1 2 10 5 3 4 10 5 3 3 3 1 1 1 34
  • 35. Dice Time Product Wheat Bread Cheese Swiss Rolls Mumbai Pune Ahmadabad Baroda Jan Feb March Apr 3 10 3 7 1 1 1 2 10 5 3 4 Time City Cheese Swiss Rolls Jan Feb March Apr Wheat Bread Mumbai Pune Ahmadabad Baroda 35
  • 36. Data Warehouse & Data Mining Customers Etcâ€Ķ Vendors Etcâ€Ķ Orders Data Warehouse Enterprise “Database” Transactions Copied, organized summarized Data Mining Data Miners: â€Ē “Farmers” – they know â€Ē “Explorers” - unpredictable 36
  • 37. DBMS, OLAP, and Data Mining DBMS DW (OLAP) Data Mining āļ‡āļēāļ™ āļ”āļķāļ‡āļĢāļēāļĒāļĨāļ°āđ€āļ­āļĩāļĒāļ”āđāļĨāļ°āļœāļĨāļŠāļĢāļļāļ› āļ‚āļ­āļ‡āļ‚āđ‰āļ­āļĄāļđāļĨāđ„āļ”āđ‰ āļŠāļĢāļļāļ›āļ‚āđ‰āļ­āļĄāļđāļĨ āļ”āļđāđāļ™āļ§āđ‚āļ™āđ‰āļĄāđ„āļ”āđ‰ āļ„āļ§āļēāļĄāļĢāļđāđ‰āļ—āļĩāđˆāļ‹āđˆāļ­āļ™āļ­āļĒāļđāđˆāđƒāļ™ āļāļēāļ™āļ‚āđ‰āļ­āļĄāļđāļĨ āļœāļĨāļĨāļąāļžāļ˜āđŒ āļ‚āđ‰āļ­āļĄāļđāļĨāļŠāļēāļĢāļŠāļ™āđ€āļ—āļĻ āļœāļĨāļāļēāļĢāļ§āļīāđ€āļ„āļĢāļēāļ°āļŦāđŒ āļŠāļēāļĄāļēāļĢāļ–āđ€āļŦāđ‡āļ™āļ„āļ§āļēāļĄāļŠāļąāļĄāļžāļąāļ™āļ˜āđŒ āđāļĒāļāđāļĒāļ°āļ‚āđ‰āļ­āļĄāļđāļĨ āļžāļĒāļēāļāļĢāļ“āđŒāļ‚āđ‰āļ­āļĄāļđāļĨ āļ§āļīāļ˜āļĩāļāļēāļĢ āļ–āļēāļĄāļ„āļēāļ•āļ­āļšāđāļĨāđ‰āļ§āļ•āļ­āļš āļ—āļēāđāļšāļšāļˆāļēāļĨāļ­āļ‡āļ„āļĨāļąāļ‡āļ‚āđ‰āļ­āļĄāļđāļĨ āļ§āļīāđ€āļ„āļĢāļēāļ°āļŦāđŒāļ‚āđ‰āļ­āļĄāļđāļĨāļŦāļĨāļēāļĒ āļĄāļīāļ•āļī āļŠāļĢāđ‰āļēāļ‡āđāļšāļšāļˆāļēāļĨāļ­āļ‡āđāļĨāļ° āļŠāļēāļĄāļēāļĢāļ–āļšāļ­āļāļĨāļąāļāļĐāļ“āļ° āļŦāļĢāļ·āļ­āļ—āļēāļ™āļēāļĒāļ‚āđ‰āļ­āļĄāļđāļĨāđƒāļŦāļĄāđˆ āđ„āļ”āđ‰ āļ•āļąāļ§āļ­āļĒāđˆāļēāļ‡āļ„āļēāļ–āļēāļĄ āđƒāļ„āļĢāļ‹āļ·āđ‰āļ­āļŠāļĨāļēāļāļāļ­āļ‡āļ—āļļāļ™ āļĒāđ‰āļ­āļ™āļŦāļĨāļąāļ‡ 3 āļ›āļĩāļšāđ‰āļēāļ‡? āđ€āļ‡āļīāļ™āđ€āļ”āļ·āļ­āļ™āđ€āļ‰āļĨāļĩāđˆāļĒāđ€āļ—āđˆāļēāđ„āļŦāļĢāđˆāļ‚āļ­āļ‡ āļ„āļ™āļ—āļĩāđˆāļ‹āļ·āđ‰āļ­āļŠāļĨāļēāļāļāļ­āļ‡āļ—āļļāļ™ āļ­āļĒāļđāđˆāđƒāļ™āđ€āļ‚āļ•āļžāļ·āđ‰āļ™āļ—āļĩāđˆāđƒāļ”āđāļĨāļ° āđāļ•āđˆāļĨāļ°āļ›āļĩāđ€āļ—āđˆāļēāđƒāļ”? āđƒāļ„āļĢāļˆāļ°āļ‹āļ·āđ‰āļ­āļŠāļĨāļēāļāļāļ­āļ‡āļ—āļļāļ™āļšāđ‰āļēāļ‡ āđƒāļ™ 6 āđ€āļ”āļ·āļ­āļ™āļ‚āđ‰āļēāļ‡āļŦāļ™āđ‰āļēāđāļĨāļ° āļ—āļēāđ„āļĄāļ–āļķāļ‡āļ‹āļ·āđ‰āļ­? 37
  • 38. 38