SlideShare a Scribd company logo
1 of 40
Word Net-словари как лексический компонент автоматизированных систем анализа текста Ирина Владимировна Азарова Санкт - Петербургский   государственный университет  Факультет филологии и исскуств  Кафедра математической лингвистики
WordNet (G.Miller, Ch.Fellbaum) – Пси холексикология http://wordnet.princeton.edu/ ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Структура  WordNet
Структура  WordNet
Статистика  WordNet 2. *
EuroWordNet   –  Многоязычная   лексическая   база   http :// www . illc . uva . nl / EuroWordNet /
Структура  EuroWordNet
Семантические отношения в  EuroWordNet ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
RussNet http:// project.phil.pu.ru / RussNet /
Причины изменения методики  построения словаря ,[object Object],[object Object],[object Object]
Методика построения  RussNet   ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Менеджер корпуса Bonito
Подготовка выборочной совокупности к разметке
Определение частотности значений слова  ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Разметка контекстов по значениям
Нумерация значений в  RussNet
Структура слово-значений в предметной области
Дополнительные свойства  RussNet ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Примеры синсетов глаголов движения с частотами элементов ,[object Object],[object Object]
Рамки валентности в тезаурусе Ru s sNet ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Неформальное описание валентностей синсета ,[object Object],[object Object],[object Object]
Формальное описание валентных позиций
Аргументные позиции в семантическом дереве глаголов (активные рамки валентностей)
Статистическая устойчивость активных рамок валентностей
Использование  RussNet  при автоматической обработке текста
 
 
Варианты разбора фразы  «Я был знаком с тобой...»
 
Использование данных рамок валентностей
 
Автоматизация подготовки данных для  RussNet   ,[object Object],[/PM 103/Num ]/PM ./PM Иначе/Adv <говоря> ,/PM авторы/Nnom подлога/Ngen не/Prcl делали/Vimperf из/Prep признаков/Ngen подлога/Ngen ./PM Собственно/Adv <говоря> ,/PM в/Prep ряде/Nloc случаев/Ngen именно/Prcl почему/Adv мы/Pnom о/Prep ней/Ploc не/Prcl <говорим> в/Prep этой/Ploc книге/Nloc ?/PM Потому/Conj ./PM большинством/Nabl партии/Ngen и/Conj ,/PM <говоря> официальным/Aabl языком/Nabl той/Pgen эпохи/Ngen ,/PM
Дистрибуции морфологически размеченных контекстов ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Параметры дистрибутивного анализа ,[object Object],[object Object],[object Object],[object Object]
Для анализа глаголов ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Мера сходства  между дистрибуциями ,[object Object]
 
Стемма объединения всех глаголов в окне анализа  [-10,+10]
Стемма кластеризации в окне анализа  [-3,+5]
Выделенные кластеры ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

More Related Content

Similar to RussNet

Построение правил для автоматического извлечения словосочетаний из текста
Построение правил для автоматического извлечения словосочетаний из текстаПостроение правил для автоматического извлечения словосочетаний из текста
Построение правил для автоматического извлечения словосочетаний из текста
Irene Pochinok
 
построение правил для автоматического извлечения словосочетаний из текста
построение правил для автоматического извлечения словосочетаний из текстапостроение правил для автоматического извлечения словосочетаний из текста
построение правил для автоматического извлечения словосочетаний из текста
Yury Katkov
 
Предварительная обработка и разметка корпуса текстов
Предварительная обработка и разметка корпуса текстовПредварительная обработка и разметка корпуса текстов
Предварительная обработка и разметка корпуса текстов
Artem Lukanin
 
гибридная технология перевода. юлия епифанцева. зал.4
гибридная технология перевода. юлия епифанцева. зал.4гибридная технология перевода. юлия епифанцева. зал.4
гибридная технология перевода. юлия епифанцева. зал.4
rit2011
 
лекция 5 тема 1
лекция 5 тема 1лекция 5 тема 1
лекция 5 тема 1
Noobie312
 
об альтернативах коллокациям
об альтернативах коллокациямоб альтернативах коллокациям
об альтернативах коллокациям
Lidia Pivovarova
 

Similar to RussNet (20)

Максим Литвинов
Максим ЛитвиновМаксим Литвинов
Максим Литвинов
 
Построение правил для автоматического извлечения словосочетаний из текста
Построение правил для автоматического извлечения словосочетаний из текстаПостроение правил для автоматического извлечения словосочетаний из текста
Построение правил для автоматического извлечения словосочетаний из текста
 
построение правил для автоматического извлечения словосочетаний из текста
построение правил для автоматического извлечения словосочетаний из текстапостроение правил для автоматического извлечения словосочетаний из текста
построение правил для автоматического извлечения словосочетаний из текста
 
Rule b platf
Rule b platfRule b platf
Rule b platf
 
Puls Russian
Puls RussianPuls Russian
Puls Russian
 
Яндекс Малый ШАД - лингвистика в поиске
Яндекс  Малый ШАД - лингвистика в поискеЯндекс  Малый ШАД - лингвистика в поиске
Яндекс Малый ШАД - лингвистика в поиске
 
презентация 08.09.10. даньшина ирина
презентация 08.09.10. даньшина иринапрезентация 08.09.10. даньшина ирина
презентация 08.09.10. даньшина ирина
 
Программная поддержка морфемного словаря
Программная поддержка морфемного словаряПрограммная поддержка морфемного словаря
Программная поддержка морфемного словаря
 
Masa
MasaMasa
Masa
 
Извлечение знаний и фактов из текстов
Извлечение знаний и фактов из текстовИзвлечение знаний и фактов из текстов
Извлечение знаний и фактов из текстов
 
Программные средства выявления теминологических вариантов в текстах
Программные средства выявления теминологических вариантов в текстахПрограммные средства выявления теминологических вариантов в текстах
Программные средства выявления теминологических вариантов в текстах
 
Klimenko
KlimenkoKlimenko
Klimenko
 
Ruwikt
RuwiktRuwikt
Ruwikt
 
Предварительная обработка и разметка корпуса текстов
Предварительная обработка и разметка корпуса текстовПредварительная обработка и разметка корпуса текстов
Предварительная обработка и разметка корпуса текстов
 
WordNet для русского языка. Русские тезаурусы: что есть и что надо? Ведущий: ...
WordNet для русского языка. Русские тезаурусы: что есть и что надо? Ведущий: ...WordNet для русского языка. Русские тезаурусы: что есть и что надо? Ведущий: ...
WordNet для русского языка. Русские тезаурусы: что есть и что надо? Ведущий: ...
 
гибридная технология перевода. юлия епифанцева. зал.4
гибридная технология перевода. юлия епифанцева. зал.4гибридная технология перевода. юлия епифанцева. зал.4
гибридная технология перевода. юлия епифанцева. зал.4
 
Презентация PROMT для РИТ
Презентация PROMT для РИТПрезентация PROMT для РИТ
Презентация PROMT для РИТ
 
Сбор, анализ, обработка текстовой информации
Сбор, анализ, обработка текстовой информацииСбор, анализ, обработка текстовой информации
Сбор, анализ, обработка текстовой информации
 
лекция 5 тема 1
лекция 5 тема 1лекция 5 тема 1
лекция 5 тема 1
 
об альтернативах коллокациям
об альтернативах коллокациямоб альтернативах коллокациям
об альтернативах коллокациям
 

More from NLPseminar

конф ии и ея гаврилова
конф ии и ея  гавриловаконф ии и ея  гаврилова
конф ии и ея гаврилова
NLPseminar
 
кудрявцев V3
кудрявцев V3кудрявцев V3
кудрявцев V3
NLPseminar
 

More from NLPseminar (20)

[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо
[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо
[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо
 
Events
EventsEvents
Events
 
Tomita
TomitaTomita
Tomita
 
бетин
бетинбетин
бетин
 
Andreev
AndreevAndreev
Andreev
 
клышинский
клышинскийклышинский
клышинский
 
конф ии и ея гаврилова
конф ии и ея  гавриловаконф ии и ея  гаврилова
конф ии и ея гаврилова
 
кудрявцев V3
кудрявцев V3кудрявцев V3
кудрявцев V3
 
rubashkin
rubashkinrubashkin
rubashkin
 
Vlasova
VlasovaVlasova
Vlasova
 
Ageev
AgeevAgeev
Ageev
 
Khomitsevich
Khomitsevich Khomitsevich
Khomitsevich
 
акинина осмоловская
акинина осмоловскаяакинина осмоловская
акинина осмоловская
 
Serebryakov
SerebryakovSerebryakov
Serebryakov
 
потапов
потаповпотапов
потапов
 
molchanov(promt)
molchanov(promt)molchanov(promt)
molchanov(promt)
 
белканова
белкановабелканова
белканова
 
Skatov
SkatovSkatov
Skatov
 
гвоздикин
гвоздикингвоздикин
гвоздикин
 
веселов
веселоввеселов
веселов
 

RussNet