MIBE-konferencia - Hírigény és hírszolgáltatás, 2010. június 9.
Szemantikus megoldások az MTI hírfeldolgozásában és adatbázis-szolgáltatásaiban
Török Róbert média üzletágvezető, MTI Zrt.
Szemantikus megoldások az MTI hírfeldolgozásában és adatbázis-szolgáltatásaiban
1. 2010. június 10. Török Róbert Szemantikus megoldások az MTI hírfeldolgozásában és adatbázis-szolgáltatásaiban
2.
3.
4.
5. 06/12/10 Az MTI archívumai FOTÓBANK Közel 500 ezer kép Több mint 10 ezer grafika MIKROFILMTÁR Több mint 12 millió oldal FOTÓTÁR Több mint 13 millió analóg fotó HÍRADATBANK (SAB) 2,7 millió rekord 1988-tól
6. Az archívumok helye az MTI-ben 06/12/10 Hír Fotó Grafika KIADÁS! MTI Rt. archívumai Fotó Grafika KIADÁS! Adatbázisok és archívumok (MTI Zrt. Archívumai) SZOLGÁLTATÁS! K Ó D O L Á S
9. A tartalom automatikus kódolása (AKR) 10-06-12 Célja: Az újságírók munkájának egyszerűsítése (kódolás-mentesítés ) E gysé ges kódolás Feltétele: A kódolást támogató Tudásbázis létrehozása
10.
11. Egységes kódrendszer 10-06-12 Művészet, kultúra és szórakozás Közgyűjtemény Könyvtár Az IPTC - nemzetközi kódrendszerhez illeszkedik (20 + 1 témakör) F ö ldrajzi k ó d
12. A Tudásbázis (TB) és az AKR 10-06-12 TB Adatt ár (ki kicsoda, helyesír á s) K ódok, földrajzi kódok, hívófogalmak kapcsolatrendszere AKR TB-elemek felism erése és kódlapra listázása
13. AKR 10-06-12 Mit tud: mindent, amire a tud ásbázist megtanítottuk Mit nem tud: amire nem tanítottuk meg „ nem ismer tréfát” azonos alakú szavak azonos nevek sakk-matt helyzetek
22. Köszönöm a figyelm üke t! Török Róbert E-mail: [email_address] Mobil: 30/211-31-78
Hinweis der Redaktion
Az 1881 óta működő magyar nemzeti hírügynökségnél a gyors, pontos és megbízható hírszolgáltatást tekintjük legfontosabb feladatunknak, amit korszerű technikai háttér és munkatársaink szakmai felkészültsége biztosít. Az MTI Zrt.-nél kettős követelményrendszerben dolgozunk. Egyfelől közszolgálati feladatokat látunk el, másfelől a piaci igényeknek megfelelve szolgáltatunk. Ügyfeleinknek három szolgáltatáscsoportot kínálunk: • "hagyományos" hírügynökségi szolgáltatások (hír- és fotószolgáltatás). • Az MTI-ben felhalmozódott, az archívumokon és adatbázisokon alapuló hatalmas adat- és fotókincs. • A legkorszerűbb multimédiás technológiákra épülő új szolgáltatások. Ahány ember, annyi érdeklődési terület. Hírügynökségünk folyamatosan alkalmazkodik a sajtó- és médiapiac követelményeihez. Az üzleti világnak is kínálunk szolgáltatáscsomagokat, miközben nem engedünk a magas szakmai színvonalból, a hírszolgáltatás hitelességéből és hírügynökségünk megbízhatóságából. Célunk, hogy új szolgáltatásaink a hagyományos médiapiacon kívül az üzleti és nonprofit szférában, továbbá az egyéni megrendelők körében is népszerűek legyenek.
Ügyfeleinknek három szolgáltatáscsoportot kínálunk: • "hagyományos" hírügynökségi szolgáltatások (hír- és fotószolgáltatás). • Az MTI-ben felhalmozódott, az archívumokon és adatbázisokon alapuló hatalmas adat- és fotókincs. • A legkorszerűbb multimédiás technológiákra épülő új szolgáltatások. Ahány ember, annyi érdeklődési terület. Hírügynökségünk folyamatosan alkalmazkodik a sajtó- és médiapiac követelményeihez. Az üzleti világnak is kínálunk szolgáltatáscsomagokat, miközben nem engedünk a magas szakmai színvonalból, a hírszolgáltatás hitelességéből és hírügynökségünk megbízhatóságából. Célunk, hogy új szolgáltatásaink a hagyományos médiapiacon kívül az üzleti és nonprofit szférában, továbbá az egyéni megrendelők körében is népszerűek legyenek.
Magyarország legnagyobb szöveges híradatbázisa. Állandóan frissülő, digitálisan rendszerezett adatbázis az MTI 1988 óta kiadott híreiből. Híradatbankunk mintegy ötven hírügynökségtől évente 150 ezer anyaggal, valamint belföldi és külföldi tudósítóinktól származó napi öt-hatszáz beszámolóval bővül. Adatbázisunkban megtalálhatók a belpolitika és a nemzetközi élet eseményei, gazdasági, külgazdasági és sporthírek. Híradatbankunk alrendszerei mindent tartalmaznak a független országok adataitól kezdve a tudomány és a kultúra újdonságain keresztül a politikusok életrajzáig. A hírek a kiadásukat követő napon adatbázisunkban szabadszavasan, kronologikusan és a tematikus gyűjtést segítő kódokkal egyaránt visszakereshetők.
Fejlesztés: a TudásBázis építéssel kezdődött 2005-ben Bevezetés: 2007 február, visszakódolás: 2009 közepe
Fejlesztés célja: AKR mögött - TUDÁSBÁZIS (építésének kezdete: 2005) - relációs adatbázis - meghatározzuk az egyes elemek egymáshoz való viszonyát pl: - kivétel, amikor éppen ennek az ellenkezőjét tesszük, mert azt akarjuk, hogy az adott fogalmat ne kapcsolja semmihez pl: TÖRTÉNELMI MÉLYPONT (ha történelmi mélyponton van a forint árfolyama, akkor ne tegye rá a történelem-társadalomtudomány-tudomány és technika kódsort.
Rel. AB elemei: - tematikus kódrendszer IPTC - 3 szintű - alá-fölé rendeltség pl: INFORMATIKA (középső szintű kód) - a fölé- és alárendelt kódjaival - földrajzi kódrendsze r - 3 szintű - alá-fölérendeltség pl: Budapest - hívófogalmak: Típusba sorolás: általános (pl: információáramlás) Személy (pl: Kovács Katalin) Intézmény (pl: Louvre) Esemény (pl: Peking 2008) Funkció (pl: államtitkár) - kivétel utótagok - ide kerülnek azok a szavak, amelyeknél nem akarom, hogy az előtte álló szót figyelembe vegye (pl: fasor, körút, út, stb., Ha a Bartók Béla úton baleset történt, nem szeretném, ha a Bartók Béla miatt komolyzene kódot tenne rá) - kulcsszavak (speciális tematikai megjelölések, amik automatizmussal nem tehetők rá, emberi döntés szükséges) Általános kulcsszavak a hírekhez Fotó kulcsszavak a fotókhoz (arckkép, képkivágás, egész alakos fotó, éjszakai felvétel) Grafikai kulcsszavak a grafikához (pl. téglatest, diagram, síkidom) Intézmény-funkció-személy kapcsolat (jelöletlen - nem kódol a személyből) (jelölt- FONTOS - kódol a személyből pl. Sólyom)
Általános kód Baleset, katasztrófa Belpolitika Egészségügy Életmód és szabadidő Gazdaság, üzlet és pénzügy Időjárás Jog, bűnügy és igazságszolgáltatás Katonai kérdés Környezet, környezetvédelem Külpolitika Munka Művészet, kultúra és szórakozás Oktatás Sport Színes, vegyes Társadalmi kérdés Tömegtájékoztatás, média Tudomány és technika Választás Vallás és hit
-”nem ismer tréfát” – átvitt értelemű dolgokat – pl: veri az ördög a feleségét-re nem teszi rá az időjárás kódot Azonos alakú szavak – ár: meg kell mondani, hogy közgazdasági értelemben, vízzel kapcsolatos, vagy cipészettel azonos nevek: pl. Kovács Kati énekes vagy kajakos Sakk-matt: pl. II. Albert belga és luxemburgi uralkodót is hívnak így, vagy George Bush néven két USA elnököt is hívtak így, ill. Pápa-Pápa