SQL – deel 1

Katrien Verbert en Joris Klerkx

•  SEQUEL (Structured English Query Language)
   –  voor experimentele gegevensbank "System R" (IBM)
•  → SQL (Structured Query Language)
   –  voor DB2, Oracle, INGRES/SQL, ...
   –  eerste commerciële versie: Oracle in 1979

standaardisatie: ANSI - ISO

•  SQL1 : 1986
•  SQL2 of SQL92 : 1992
   –  “levels of conformance”: entry – intemediate - full
•  SQL99 : 1999
   –  aanvullingen met o.a. nieuwe data types, object-georiënteerde
      concepten en triggers
   –  levels of conformance: Core SQL:1999 - Enhanced SQL:1999

 de meeste implementaties van SQL verschillen in meer
 of mindere mate van de standaard

SQL 2003
•    ongeveer zelfde Core als SQL99
•    nieuwe object-relationele features (multiset, array types, etc.)
•    XML-gerelateerde features (SQL/XML)
•    meer functies (sequentiegenerator, merge)
•    datawarehousing features
•    verfijning van bestaande features


•  relationeel model   •  SQL

   –    schema           –    schema
   –    relatie          –    tabel
   –    tupel            –    rij
   –    attribuut        –    kolom


•  bevat
   –  schema-naam
   –  eigenaar en
   –  beschrijving van elementen
      •    tabellen
      •    restricties (constraints)
      •    views
      •    domeinen
      •    autorisaties
      •    …

•  creatie van schema: CREATE SCHEMA

                   CREATE SCHEMA COMPANY 
                         AUTHORIZATION Jsmith ;

•    = een verzameling gegevensbankschema's in een “SQL omgeving”
•    de cataloog bevat één speciaal schema: INFORMATION_SCHEMA
•    integriteitsrestricties kunnen opgelegd worden tussen relaties in cataloog
•    schema’s binnen eenzelfde cataloog kunnen elementen delen

creatie van een tabel

CREATE TABLE  [ <schema name >. ] <table name> 

     ( { <column name> <column type> [<aAribute constraint>] }  

      {<table constraint>} *) 
•  naam
•  voor alle attributen:
    –  naam + SQL-gegevenstype + restricties
•  restricties

numerieke gegevenstypes en domeinen
 •  gehele waarden:
    –  INTEGER - INT
 •  niet gehele waarden:
    –  FLOAT – REAL
 •  geformateerde getallen:
    –  DECIMAL (i, j) – DEC (i, j) – NUMERIC (i, j) met
        i: precisie (= totaal aantal dec.cijfers)
        j: schaal (= aantal cijfers na dec. punt)

karakter strings
•  string met vaste lengte:
   –  CHAR (n) – CHARACTER (n)
•  string met variabele lengte:
•  notatie van waarden: tussen apostrofs: ‘abc‘

gegevenstypes en domeinen in SQL

•  bit strings:
   –  met vaste lengte: BIT (n)
   –  met variabele lengte: BIT VARYING (n)
   –  notatie van waarden: B’10101’
•  logische waarden
   –  mogelijke waarden:      TRUE    FALSE UNKNOWN

datum en tijd

  –  10 posities: YYYY-MM-DD
  –  DATE’2004-02-23’
  –  ten minste 8 posities: HH:MM:SS
  –  TIME’09:12:47’
  –  DATE en TIME en 6 posities voor fracties van seconden:
  –  TIMESTAMP’2004-02-23 09:12:47 648302’

in verschillende implementaties

•  namen kunnen verschillen
•  soms nog meer variaties in types

•  voorbeeld:

definitie van type van een attribuut

•  ofwel rechtstreeks
•  ofwel via definitie van domein


definiëren van restricties op tabel
•  Soorten:
   –  primaire sleutel:       PRIMARY KEY <attrlist>
   –  alternatieve sleutel:   UNIQUE <attrlist>
   –  verwijssleutel:         FOREIGN KEY <attrlist> REFERENCES
•  Actie bij schending van referentiële integriteit:
   –  bij trigger:            ON DELETE / ON UPDATE
   –  actie:                  SET NULL / CASCADE / SET DEFAULT

restricties op attribuut
•  NOT NULL (automatisch voor primaire sleutels)
•  DEFAULT <value>
•  CHECK (voorwaarde)
   –  kan ook samen met domein declaratie

Dnumber INT NOT NULL CHECK (Dnumber > 0 AND Dnumber < 

specificeren van restricties

•  twee mogelijkheden
   –  onmiddellijk bij tabel of attribuut
   –  met sleutelwoord ‘CONSTRAINT’ en het geven van een naam
      •  geeft de mogelijkheid om de restrictie later gemakkelijk aan te passen, weg
         te laten,….

weglaten van tabel / schema

•  Drop behaviour voor schema:
   –  CASCADE:
      •  schema + alle tabellen erin weglaten
      •  schema enkel weglaten als het leeg is

•  Drop behaviour voor tabel:
   –  CASCADE:
      •  alle restricties en views die aan de tabel refereren worden mee weggelaten
      •  tabel enkel weglaten als er geen restricties of views naar verwijzen

   DROP SCHEMA  <name> <drop behaviour> 
   DROP TABLE      <name> <drop behaviour> 
wijzigen van tabel

ALTER TABLE <name>  
        {   ADD      <column name> <column type> 
           | DROP   <column name> <drop behaviour> 
           | ALTER  <column name> <default opVon> 
           | ADD  CONSTRAINT    <constraint definiVon> 
           | DROP  CONSTRAINT  <constraint name>  <drop 
behaviour> }
                    –  <drop behaviour> =
                        •  CASCADE | RESTRICT
                    –  <default option> =
                        •  DROP DEFAULT | SET DEFAULT <value>

      ADD COLUMN Job VARCHAR(12) ;


           ALTER COLUMN Mgr_ssn DROP DEFAULT ;

       ALTER COLUMN Mgr_ssn SET DEFAULT ‘33445555’ ;

opvragingen (queries) in SQL

•  Basisvorm van een vraag (query):

            SELECT <aAributen lijst>  
                 FROM     <tabellen lijst> 
                 WHERE  <condiVes> ;

•  vgl. met relationele algebra:
   –  SELECT          projectie
   –  FROM            carthesisch product
   –  WHERE           selectie


•  Q_0: geef de geboortedatum en het adres van
   werknemer John B. Smith

   SELECT        Bdate, Address 
   FROM          EMPLOYEE 
   WHERE         Fname='John' AND Minit='B' AND Lname='Smith’ ;

  Bdate                Address
  ----------            ------------------------
  1965-01-09            731 Fondren, Houston, TX

   In relaVonele algebra:  
   πBdate,Address (σ Fname = 'John'  AND  Minit = ‘John’  AND  Lname = 
   ‘Smith’ (EMPLOYEE) ) 
•  Q1B: geef naam en adres van alle werknemers die voor
   het "research" departement werken

    SELECT       E.Fname, E.Lname, E.Address 
    WHERE        D.Dname = 'Research' AND D.Dnumber = E.Dno ;

      •  vergelijk met uitdrukking in tupel relationele calculus

    { t.Fname, t.Lname, t.Address | EMPLOYEE(t)  
                                    AND (∃d) (DEPARTMENT(d)  
                                          AND d.Dname = 'Research’ 
                                          AND d.Number = t.Dno) } 

 geef namen van projecten die gecontroleerd worden door 
 departement 5 

                                            select  ? 
                                            from   ? 
                                            where ? 

 SELECT pname FROM project WHERE dnum=5; 

 geef social security numbers van werknemers die werken aan 
 projecten die gecontroleerd worden door departement 5 

                                            select  ? 
                                            from   ? 
                                            where ? 

 SELECT pname, essn FROM project, works_on 
 WHERE dnum=5 and pno=pnumber; 

 geef voornaam en familienaam van werknemers die werken aan 
 projecten die gecontroleerd worden door departement 5 

                                           select  ? 
                                           from   ? 
                                           where ? 

SELECT pname 
FROM project 
WHERE dnum=5; 

SELECT pname, essn 
FROM project, works_on 
WHERE dnum=5 and pno=pnumber; 

SELECT pname, fname, lname  
FROM project, works_on, employee  
WHERE dnum=5 and pno=pnumber and essn=ssn; 

•  geef voor elk project dat als locatie Stafford heeft, het
   projectnummer, nummer van het departement dat het leidt, en de
   familienaam, adres en geboortedatum van de manager van dat

          SELECT      Pnumber, Dnum, Lname, Address, Bdate 
          WHERE       Dnum = Dnumber  AND  Mgr_ssn = Ssn 
                      AND  PlocaVon = 'Stafford’ ; 

    Pnumber Dnum        Lname               Address
    ------- ----
    resultaat:         -------     -----------------------
       10      4       Wallace     291 Berry, Bellaire, TX
       30      4       Wallace     291 Berry, Bellaire, TX
dubbelzinnige attribuutnamen

•  Tot nog toe: steeds duidelijk bij welke relatie een
   attribuut behoorde
•  Wat indien dit niet het geval is?
   vb. attributen Name en Dnumber (i.p.v. Dno) in EMPLOYEE en
     DEPARTMENT tabel

•  Oplossing: attribuutnaam = <tabel>.<attribuut>

  SELECT      Fname, EMPLOYEE.Name, Address 
  WHERE       DEPARTMENT.Name = 'Research' 
              AND DEPARTMENT.Dnumber = EMPLOYEE.Dnumber ;

•  voorbeeld:
   –  geef voor elke werknemer de voor- en familienaam en de
      familienaam van zijn/haar supervisor
   –  2 verwijzingen naar EMPLOYEE: een voor werknemer zelf, een
      voor supervisor

•  hoe van elkaar onderscheiden?
•  "aliases": de verwijzingen krijgen aparte namen

       SELECT     E.Fname,  E.Lname, S.Fname, S.Lname 
       WHERE      E.Super_ssn = S.Ssn ;

–  Q 8: for each employee, retrieve the employee’s first and last
   name and the last name of his or her immediate supervisor

       SELECT       E.Fname,  E.Lname, S.Fname, S.Lname 
       FROM         EMPLOYEE  AS E,   EMPLOYEE AS S 
       WHERE        E.Super_ssn = S.Ssn ;

    SELECT        E.Fname,  E.Lname, S.Fname, S.Lname 
    FROM          EMPLOYEE  E  S 
    WHERE         E.Super_ssn = S.Ssn ; 

–  Definitie: - onmiddellijk na de naam van de relatie
              - na sleutelwoord AS

weglaten van WHERE en van attributenlijst

•  WHERE kan weggelaten worden: geen selectie

    SELECT     Ssn 
    FROM       EMPLOYEE ;

    SELECT     Ssn, Dname 
   carthesisch product

weglaten van WHERE en van attributenlijst

•  Alle attributen selecteren (met *) : geen projectie

      SELECT      * 
      FROM        EMPLOYEE 
      WHERE     Dno = 5 ;

       SELECT     * 
       WHERE      Dname = 'Research' AND Dno = Dnumber ;

      SELECT      * 

Verschil tussen tabellen en relaties

•  een relatie uit het relationeel model is een verzameling
   tupels en bevat dus geen dubbels
•  SQL elimineert niet automatisch dubbels

SELECT      Salary        •  Vermijden van dubbels:
                             SELECT DISTINCT
equivalent met
 SELECT   ALL Salary         SELECT   DISTINCT Salary 
      FROM       EMPLOYEE ;

          Salary                  Salary
          ------                  ------
          30000                   30000
          40000                   40000
          25000                   25000
          43000                   43000
          38000                   38000
          25000                   55000
Verzameling-bewerkingen in SQL
–  UNION, INTERSECT, EXCEPT (= verschil)
–  relaties moeten vergelijkbaar zijn
    •  zelfde attribuuttypes in zelfde volgorde
–  dubbels worden automatisch verwijderd

–  vb: Q 4:
    •  geef alle projecten waarbij Smith betrokken is als manager van het
       controlerend departement of waaraan hij meewerkt

(SELECT        DISTINCT Pnumber 
 WHERE         Dnum = Dnumber AND Mgr_ssn = Ssn AND Lname = 'Smith')  


(SELECT        DISTINCT Pnumber 
 WHERE         Pno = Pnumber AND Essn = Ssn AND Lname = 'Smith') ;
operaties die slaan op multisets

•  sleutelwoord ALL na de operator:

 R  A     S  A        T  A        V  A     W  A 
    a1       a1          a1          a2       a1 
    a2       a2          a1          a3       a2 
    a2       a4          a2 
    a3       a5          a2 
                         a2    T ← R UNION ALL S
                         a4    V ← R EXCEPT ALL S
                               W ← R INTERSECT ALL S
string- en rekenkundige operatoren
•  Test string op patroon: LIKE
    –  _ : één willekeurig teken
    –  % : willekeurige rij tekens

Q12: Geef de naam van alle werknemers die in Houston, Texas wonen
   SELECT       Fname,Lname 
   FROM         EMPLOYEE 
   WHERE        Address LIKE  '%Houston,TX%’ ; 

Q12A: Geef de naam van alle werknemers die in de jaren 1950
geboren zijn
    SELECT        Fname,Lname 
    FROM          EMPLOYEE 
    WHERE         Bdate LIKE  '_ _5_ _ _ _ _ _ _’ ;
rekenkundige operatoren: +, -, *, /

•  kunnen gebruikt worden op numerieke waarden

•  Q13: Geef het salaris van elke werknemer die werkt
   aan project ‘ProductX’, verhoogd met 10 %

     SELECT      Fname, Lname,  1.1 * Salary AS Increased_sal 
     WHERE       Ssn = Essn  AND  Pno = Pnumber  
                 AND  Pname = 'ProductX’ ;

andere operatoren
•  strings
   –  concatenatie       ||
•  datum, tijd, tijdsstempel:
   –  verhogen of verlagen met een interval
   –  verschil tussen data, tijden: → een interval
   –  Q14: Geef alle werknemers van departement 5 met een
      salaris tussen 30 000 en 40 000 EUR

   SELECT       * 
   FROM         EMPLOYEE 
   WHERE        (Salary BETWEEN 30 000 AND 40 000) AND  Dno = 5 ;

   de salaris-voorwaarde is equivalent met
   ((Salary >= 30 000) AND (Salary <= 40 000))                       43
ordenen van query resultaten
•  ORDER BY <attributen> [ ASC | DESC ]

    –  Q 15: Geef een lijst van de namen van de werknemers en de namen van de
       projecten waarop zij werken, per departement, en in elk departement
       alfabetisch geordend volgens familienaam, voornaam

   SELECT               Dname,  Fname,  Lname,  Pname 
   WHERE                Dnumber = Dno  AND  Ssn = Essn  
                        AND  Pno = Pnumber  
   ORDER BY             Dname, Lname, Fname ; 

•  default ordening is stijgend (ASC)
•  dalende orde (DESC) moet steeds expliciet vermeld worden:

  ORDER BY                Dname DESC, Lname ASC, Fname ASC
null en 3-waardige logica

•  3 mogelijkheden:
   –  waarde is niet gekend
   –  waarde is onbeschikbaar of niet vrij gegeven
   –  attribuut is niet van toepassing
•  elke null waarde wordt als verschillend aanzien
•  ⇒ SQL gebruikt 3-waardige logica:

•  nagaan of een waarde null is:
   –  IS NULL

•  Q 18 : retrieve the names of all employees who have no

             SELECT     Fname, Lname 
             FROM       EMPLOYEE 
             WHERE      Super_ssn IS NULL ;

geneste queries

•  geneste queries
   –  sommige queries vereisen ophalen van bestaande waarden en
      het gebruik ervan in voorwaarden;
   –  dat kan dikwijls op eenvoudige wijze geformuleerd worden met
      geneste queries.
•  IN operator in conditie :
   –  test of tupel ∈ verzameling
   –  verzameling kan zelf door SQL-query bekomen zijn
       •  → geneste queries


  –  Q 4A: geef alle projecten waarbij Smith betrokken is als
     manager van het controlerend departement of waaraan hij

 FROM                   PROJECT 
 WHERE                  Pnumber IN  
                        (SELECT    Pnumber 
                       FROM        PROJECT, DEPARTMENT, EMPLOYEE 
                          WHERE   Dnum = Dnumber AND Mgr_ssn = Ssn 
                                   AND Lname = 'Smith') 
                        Pnumber IN  
                        (SELECT    Pno 
                         FROM      WORKS_ON, EMPLOYEE 
                         WHERE   Essn = Ssn AND Lname = 'Smith') ; 

IN operator met tupel i.p.v.
enkelvoudige waarde
•  tupel moet vergelijkbaar zijn met een element van de
•  vb:
   –  selecteer de ssn’s van alle werknemers die met dezelfde
      combinatie (project, aantal uren) werken op om het even welk
      project waarop de werknemer ssn = ‘123456789’ werkt

    FROM                   WORKS_ON 
    WHERE                  (Pno, Hours) IN  (SELECT   Pno, Hours 
                                               FROM          WORKS_ON 
                                               WHERE     Ssn = '123456789') ; 

•  geef de naam van elke werknemer die een persoon ten
   laste heeft met dezelfde voornaam en hetzelfde
   geslacht als de werknemer
    SELECT       E.Fname,  E.Lname 
    FROM         EMPLOYEE  AS  E 
    WHERE        E.Ssn IN (SELECT ESSN 
                             FROM   DEPENDENT  AS  D  
                             WHERE D.Essn   AND   E.Sex = D.Sex 
                             AND   E.Fname = D.Dependent_name) ; 

  Kan dit ook zonder geneste query?

     SELECT       E.Fname,  E.Lname 
     WHERE        E.Ssn = D.Essn   AND   E.Sex = D.Sex 
                  AND   E.Fname = D.Dependent_name ; 
andere vergelijkingsoperatoren
•  >, >=, <, <=, <>
•  combinatie met ANY (of SOME)
   –  v > ANY s : er bestaat een element e van s waarvoor v > e
   –  = ANY is equivalent met IN
•  combinatie met ALL
   –  v > ALL s : voor alle elementen e van s geldt v >e


•  bepaal de namen van alle werknemers waarvan het
   salaris groter is dan de salarissen van alle werknemers
   van departement 5

     SELECT                 Lname, Fname 
     FROM                   EMPLOYEE 
     WHERE                  Salary > ALL  (SELECT    Salary 
                                                FROM        EMPLOYEE 
                                                WHERE       Dno = 5) ; 

oplossen van dubbelzinnigheid in
geneste queries
•  verscheidene niveaus van innesteling zijn mogelijk

•  indien attributen met dezelfde naam voorkomen in
   buitenste en binnenste query:
   –  een referentie verwijst dan naar de binnenste geneste query
   –  om naar een andere relatie te verwijzen moet de attribuutnaam
      gekwalificeerd worden

   SELECT                 E.Fname,  E.Lname 
   FROM                   EMPLOYEE  AS  E 
   WHERE                  E.Ssn  IN ( SELECT  Essn 
                                        FROM     DEPENDENT 
                                        WHERE  Sex = E.Sex 
                                              AND  E.Fname = Dependent_name) ;


