Diese Präsentation wurde erfolgreich gemeldet.
Wir verwenden Ihre LinkedIn Profilangaben und Informationen zu Ihren Aktivitäten, um Anzeigen zu personalisieren und Ihnen relevantere Inhalte anzuzeigen. Sie können Ihre Anzeigeneinstellungen jederzeit ändern.
Приложения на
компютърната
лингвистика
Божидар Божанов
Компютри и език?
● Компютрите разбират ли езика?
● Защо е нужно компютрите да разбират езика?
● Какво е компютърна лингвис...
Основни “инструменти”
● Стеминг (stemming)
● Откриване на части на речта (PoS tagging)
● Синтактичен анализ
● Семантичен а...
Части на речта
● части на речта + морфологичен анализ
● списък с думи със съответната им част на речта? (гори, lead)
● кон...
Стеминг
● таблица с форми
● правила за премахване на афикси
● лематизация
o каква част на речта е?
o премахване на афикси,...
Синтактичен и семантичен анализ
● синтактични дървета
● семантични роли
o вършител
o пациенс
o тема
o инструмент
o място
o...
Анализ на сентимент
● Дали един текст е положителен, отрицателен или неутрален?
● http://nlp.stanford.edu:8080/sentiment/r...
Корекция на правопис
● необхидими данни: списък с думи; речник на афикси => пълен речник
на словоформите
● ефективна струк...
Машинен превод
● свещеният граал на компютърната лингвистика
● приложения:
o за ежедневна употреба
o машинно-асистиран пре...
Машинен превод - как работи?
● какво е корпус? А двуезичен (паралелен) корпус?
● методи: правила; аналогия; статистика/n-g...
Машинен превод (3)
Интерлингва?
Машинен превод (4)
● решима задача ли е? Да. Решението е нашият мозък.
● невронни мрежи?
● машинно учене на език. Първи ез...
Статистика, статистика...
● вероятности
● теоретичната лингвистика е само малка част. Правилно ли е това?
● компютърните л...
А задачи?
● задачи за компютърна лингвистика
● решаване на традиционни задачи задачи
o хаос и ред
o стеминг на ум
Въпроси?
Nächste SlideShare
Wird geladen in …5
×

Приложения на компютърната лингвистика

1.443 Aufrufe

Veröffentlicht am

Въведение в някои приложения на компютърната лингвистика

Veröffentlicht in: Wissenschaft
  • Als Erste(r) kommentieren

Приложения на компютърната лингвистика

  1. 1. Приложения на компютърната лингвистика Божидар Божанов
  2. 2. Компютри и език? ● Компютрите разбират ли езика? ● Защо е нужно компютрите да разбират езика? ● Какво е компютърна лингвистика?
  3. 3. Основни “инструменти” ● Стеминг (stemming) ● Откриване на части на речта (PoS tagging) ● Синтактичен анализ ● Семантичен анализ
  4. 4. Части на речта ● части на речта + морфологичен анализ ● списък с думи със съответната им част на речта? (гори, lead) ● контекст, вероятности (зелени гори, the lead) ● скрити вериги на Марков, Витерби, динамично програмине, машинно самообучение, статистика… ко? да..
  5. 5. Стеминг ● таблица с форми ● правила за премахване на афикси ● лематизация o каква част на речта е? o премахване на афикси, таблица с форми o идвам-ела, гори ● статистика, машинно самообучение
  6. 6. Синтактичен и семантичен анализ ● синтактични дървета ● семантични роли o вършител o пациенс o тема o инструмент o място o причина o ... ● Как? Магия… формална граматика. [AGENTShaw Publishing] offered [RECEPIENTMr. Smith] [THEMEa reimbursement] [TIMElast March]
  7. 7. Анализ на сентимент ● Дали един текст е положителен, отрицателен или неутрален? ● http://nlp.stanford.edu:8080/sentiment/rntnDemo.html ● “торба с думи”, сентимент на дума (стеминг, определяне части на речта) ● Приложения: анализ на ревюта на продукт, на мнения за компания или събитие в социални мрежи
  8. 8. Корекция на правопис ● необхидими данни: списък с думи; речник на афикси => пълен речник на словоформите ● ефективна структура от данни (trie) ● предложения - левенщайново разстояние: o броят букви, които е нужно да се променят, за да се превърне една дума в друга (добавяне, изтриване, замяна) o пароними o барлина:балерина (?), ленгвист:лингвист (?), лекксиика:лексика(?)
  9. 9. Машинен превод ● свещеният граал на компютърната лингвистика ● приложения: o за ежедневна употреба o машинно-асистиран превод o превод, специфичен за дадена област - прогнози за времето, футболни коментари ● Google translate, Skype translate ● “out of sight, out of mind” -> китайски -> “blind idiot”; constipated potatoes, strangled language
  10. 10. Машинен превод - как работи? ● какво е корпус? А двуезичен (паралелен) корпус? ● методи: правила; аналогия; статистика/n-gram-и. ● “от всичко”: стеминг, части на речта, синтактичен анализ ● интерлингва
  11. 11. Машинен превод (3)
  12. 12. Интерлингва?
  13. 13. Машинен превод (4) ● решима задача ли е? Да. Решението е нашият мозък. ● невронни мрежи? ● машинно учене на език. Първи език? ● съществува ли абстрактна интерлингва? o Сапир-Уорф
  14. 14. Статистика, статистика... ● вероятности ● теоретичната лингвистика е само малка част. Правилно ли е това? ● компютърните лингвисти нямат задълбочени познания по теоретична лингвистика (обобщение) ● мозъкът ползва статистика при вземане на решения
  15. 15. А задачи? ● задачи за компютърна лингвистика ● решаване на традиционни задачи задачи o хаос и ред o стеминг на ум
  16. 16. Въпроси?

×