2. <menu>
Wie is Dries?
Wie is Bart?
Een woordje over de taalsector & DeTaalsector
Huwelijk tussen Joomla! en Drupal – de wondere wereld van CrossLang
Onder de motorkap van onze Joomla! installatie
Een paar tweaks waren nodig …
Toekomstvisie
</menu>
3. Wie is Dries?
Dries Debackere
Consultant (www.driesdebackere.com)
Begon een paar jaar geleden te spelen met het idee van een
taalsector (language industry), in de zin van de sector voor
iedereen die met taalwerk en taalgerelateerd werk zijn
brood verdient > taalprofessionals.
Aanstoker
4. Wie is Bart?
• Afgestudeerd als LicentiaatTolk.
• Sinds 2002 werkzaam in de IT-sector.
• Voorliefde voor alles wat met web en internet te maken
heeft.
• Actief bezig met Jooma! sinds 2007 .
• Maakt regelmatig een zijsprong richting Drupal &
Wordpress.
• Niet alleen bezig met ontwikkeling maar ook met
systeembeheer.
En … vader van twee dochters
die ik goed probeer op te voeden.
5. Een blik op de taalsector
Past, present & future
6. Een blik op de taalsector / DeTaalsector
Wat is de taalsector?Wie is de taalsector?
Historiek DeTaalsector:
1 artikel > 2 artikelen > knippen & plakken inWord > pdf-magazine
Van Word naar cms: taalsector.be / taalsector.nl op joomla 1.5 -> migratie naar joomla 2.5
(met betaalmuur)
1 taal > 24 talen = thelanguageindustry.eu
Volume: meer dan 3000 artikelen
Volume thelanguageindustry.eu: meer dan 3000 artikelen in x talen
7. De wondere wereld van
CrossLang
een huwelijk tussen joomla! en Drupal
8. CrossLang Gateway
• Gent
• innovatieve taaltechnologie
• multi-translation-engine: verschillende vertaalengines (MT)
aanspreken binnen eenzelfde vertaalproject
• toepassing ontwikkeld rond Drupal
• biedt REST API
9. CrossLang Gateway
Waarom niet 1 MT-engine of GoogleTranslate on the fly?
• Content is mix van
1. original content,
2. human translation,
3. raw machine translation,
4. human assisted machine translation,
5. machine assisted human translation
• postediteren moet bij ons
• vertaalgeheugen moet bij ons
• intellectueel eigendomsrecht moet bij auteur / post-editor blijven
• thelanguageindustry.eu = neutraal > scala aan MT-engines laten zien
12. Een paar statistieken
Momenteel 150,000 records in de falang_content table
16 talen actief
106 gepostediteerde artikelen
54112 vertalingen
3391 artikelen
+/- 130 vertalingen kunnen per uur door het systeem gehaald worden in de vertaalflow.
17. Any to Any translations
Momenteel geen voorziening in Falang om content in verschillende ‘brontalen’ in te
voegen
Workaround via ‘taal-flagging’ in joomla!
Taggen anderstalige teksten als ‘toon enkel in Duits/Pools/…’
Vertaalflow doorlopen
Brontekst taggen als ‘toon in alle talen’
Vertalingen beschikbaar
Gebruik van ‘bugje’ in Falang dat een vertaling van de standaardtaal toelaat
18. Tuning
Aangepaste MySQL config : spelen met buffers en cache
joomla! file cache geeft problemen (door frequente updates)
tweaken van joomla! search om ook afgeschermde content in de search results te
laten verschijnen (doorzoekbaarheid kan nog beter)
autologin – ip (Yireo-basis) aangepast voor CIDR-ranges
standaard sitevertalingen zijn niet altijd O.K., vertaling zit ook in bijzonder veel
verschillende bestanden (component, modules, plugins, …)
20. 2015 and beyond …
Migratie naar joomla 3.4.x
Uitbreiding aantal doeltalen & brontalen
Meer vertaalengines toevoegen (via CrossLang) (Moses!)
Mobile
Indexeren van aangepaste vertalingen en binden aan template (standaard language
override niet werkbaar bij deze grootteorde)