SlideShare ist ein Scribd-Unternehmen logo
1 von 14
Дипломная работа Программная поддержка морфемного словаря Швейкина О.А., 525 гр. Научный руководитель:  к.ф.-м.н. доцент Большакова Е.И.
Терминология ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],/14
Морфемные словари и  подходы к их построению ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],/14
Постановка задачи ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],/14
Принципы организации словарных данных ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],/14
Схема базы данных словаря words word_morphs morphs allomorphs /14 Слово Id  слова Бетономешалка 235 Процедура 15782 Id 1 Id 2 1543 1547 1543 1569 Корень Рас 1543 Корень Бетон 147 Id  морфа морф Тип морфа 21 О Соед.гласная 1547 Раст Корень Id  слова №  морфа в слове Id  морфа 235 1 147 235 2 21
Функции словаря ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],/14
Поиск вариантов морфемного разбиения  (для отсутствующих в БД слов) ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],/14
Дерево поиска. Пример 1)«» 2) Столик 3) Приставка 1)«» 2) Столик 3) корень Приставка = « » 1)«+Стол» 2) ик 3) суффикс Корень = «Стол» 1)«+Стол-и» 2) к 3) суффикс 1)«+Стол-ик» 2) - 3) - Суффикс = «ик» Суффикс = «и» Суффикс = « » 1)«+Стол-и-к» 2) - 3) - Суффикс = «к» /14 1)«-С» 2) толик 3) корень 1)«+Стол» 2) ик 3) окончание Приставка = «  С »
Программная реализация ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],/14
Пользовательский интерфейс. Поиск морфемного состава /14
Пользовательский интерфейс. Поиск слов с заданной морфемой /14
Результаты работы ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],/14
/14 Благодарю за внимание!

Weitere ähnliche Inhalte

Was ist angesagt?

English In Russian
English In RussianEnglish In Russian
English In Russian
guest511e16b
 
презентацияRek1
презентацияRek1презентацияRek1
презентацияRek1
Grigory
 
олимпиада 8 кл
олимпиада 8 клолимпиада 8 кл
олимпиада 8 кл
Irina Zerkal
 
russki jazyk
russki jazykrusski jazyk
russki jazyk
Valnev
 
канивец произношение компьютерных терминов
канивец произношение компьютерных терминовканивец произношение компьютерных терминов
канивец произношение компьютерных терминов
KANIVEC.EK
 

Was ist angesagt? (19)

Перефразировщик текста
Перефразировщик текстаПерефразировщик текста
Перефразировщик текста
 
English In Russian
English In RussianEnglish In Russian
English In Russian
 
Открытый код Томита-парсера. Виктор Бочаров
 Открытый код Томита-парсера. Виктор Бочаров Открытый код Томита-парсера. Виктор Бочаров
Открытый код Томита-парсера. Виктор Бочаров
 
презентацияRek1
презентацияRek1презентацияRek1
презентацияRek1
 
NLTK и Python для работы с текстами
NLTK и Python для работы с текстами  NLTK и Python для работы с текстами
NLTK и Python для работы с текстами
 
кинасова
кинасовакинасова
кинасова
 
Promt
PromtPromt
Promt
 
олимпиада 8 кл
олимпиада 8 клолимпиада 8 кл
олимпиада 8 кл
 
Lande, Jigalo
Lande, JigaloLande, Jigalo
Lande, Jigalo
 
russki jazyk
russki jazykrusski jazyk
russki jazyk
 
ФАЙЛ И ФАЙЛОВАЯ СИСТЕМА
ФАЙЛ И ФАЙЛОВАЯ СИСТЕМАФАЙЛ И ФАЙЛОВАЯ СИСТЕМА
ФАЙЛ И ФАЙЛОВАЯ СИСТЕМА
 
файловая система
файловая системафайловая система
файловая система
 
Лекция 9. Основы HTML. Часть 2.
Лекция 9. Основы HTML. Часть 2.Лекция 9. Основы HTML. Часть 2.
Лекция 9. Основы HTML. Часть 2.
 
канивец произношение компьютерных терминов
канивец произношение компьютерных терминовканивец произношение компьютерных терминов
канивец произношение компьютерных терминов
 
Вопросно-ответный поиск
Вопросно-ответный поискВопросно-ответный поиск
Вопросно-ответный поиск
 
Русский среди других языков
Русский среди других языковРусский среди других языков
Русский среди других языков
 
Поиск информации в Интернете
Поиск информации в ИнтернетеПоиск информации в Интернете
Поиск информации в Интернете
 
Программные средства выявления теминологических вариантов в текстах
Программные средства выявления теминологических вариантов в текстахПрограммные средства выявления теминологических вариантов в текстах
Программные средства выявления теминологических вариантов в текстах
 
Концепция поисковых расширений
Концепция поисковых расширенийКонцепция поисковых расширений
Концепция поисковых расширений
 

Ähnlich wie Программная поддержка морфемного словаря

Semantic feature machine translation system
Semantic feature machine translation systemSemantic feature machine translation system
Semantic feature machine translation system
Dmitry Kan
 
АОТ - Введение
АОТ - ВведениеАОТ - Введение
АОТ - Введение
eibolshakova
 
олимпиада 11 кл.
олимпиада 11 кл.олимпиада 11 кл.
олимпиада 11 кл.
VFI130600
 
Конспект урока русского языка в 5 классе по фгос на тему чередование звуков. ...
Конспект урока русского языка в 5 классе по фгос на тему чередование звуков. ...Конспект урока русского языка в 5 классе по фгос на тему чередование звуков. ...
Конспект урока русского языка в 5 классе по фгос на тему чередование звуков. ...
Юрий Хмелевский
 
Предварительная обработка и разметка корпуса текстов
Предварительная обработка и разметка корпуса текстовПредварительная обработка и разметка корпуса текстов
Предварительная обработка и разметка корпуса текстов
Artem Lukanin
 

Ähnlich wie Программная поддержка морфемного словаря (20)

Модули автоматической обработки текстов в проекте aot.ru
Модули автоматической обработки текстов в проекте aot.ruМодули автоматической обработки текстов в проекте aot.ru
Модули автоматической обработки текстов в проекте aot.ru
 
Методы морфологического анализа текстов
Методы морфологического анализа текстовМетоды морфологического анализа текстов
Методы морфологического анализа текстов
 
Морфемика и словообразование в современном русском языке
Морфемика и словообразование в современном русском языкеМорфемика и словообразование в современном русском языке
Морфемика и словообразование в современном русском языке
 
Извлечение терминологических словосочетаний из текстов
Извлечение терминологических словосочетаний из текстовИзвлечение терминологических словосочетаний из текстов
Извлечение терминологических словосочетаний из текстов
 
RussNet
RussNetRussNet
RussNet
 
Ruwikt
RuwiktRuwikt
Ruwikt
 
10 класс зачет
10 класс зачет10 класс зачет
10 класс зачет
 
группа
группагруппа
группа
 
Semantic feature machine translation system
Semantic feature machine translation systemSemantic feature machine translation system
Semantic feature machine translation system
 
АОТ - Введение
АОТ - ВведениеАОТ - Введение
АОТ - Введение
 
Подготовка школьников к олимпиаде по русскому языку
Подготовка школьников к олимпиаде по русскому языкуПодготовка школьников к олимпиаде по русскому языку
Подготовка школьников к олимпиаде по русскому языку
 
олимпиада 11 кл.
олимпиада 11 кл.олимпиада 11 кл.
олимпиада 11 кл.
 
презентация1
презентация1презентация1
презентация1
 
Конспект урока русского языка в 5 классе по фгос на тему чередование звуков. ...
Конспект урока русского языка в 5 классе по фгос на тему чередование звуков. ...Конспект урока русского языка в 5 классе по фгос на тему чередование звуков. ...
Конспект урока русского языка в 5 классе по фгос на тему чередование звуков. ...
 
Intro to NLP (RU)
Intro to NLP (RU)Intro to NLP (RU)
Intro to NLP (RU)
 
Zadanie 24. varianty_1-12
Zadanie 24. varianty_1-12Zadanie 24. varianty_1-12
Zadanie 24. varianty_1-12
 
Актуальные проблемы орфографии и методики ее преподавания. Способы подачи ор...
Актуальные проблемы орфографии и методики ее преподавания. Способы подачи ор...Актуальные проблемы орфографии и методики ее преподавания. Способы подачи ор...
Актуальные проблемы орфографии и методики ее преподавания. Способы подачи ор...
 
Электронные словари паронимов
Электронные словари паронимовЭлектронные словари паронимов
Электронные словари паронимов
 
Предварительная обработка и разметка корпуса текстов
Предварительная обработка и разметка корпуса текстовПредварительная обработка и разметка корпуса текстов
Предварительная обработка и разметка корпуса текстов
 
Языковые корпуса
Языковые корпусаЯзыковые корпуса
Языковые корпуса
 

Mehr von Спецсеминар "Искусственный Интеллект" кафедры АЯ ВМК МГУ

Mehr von Спецсеминар "Искусственный Интеллект" кафедры АЯ ВМК МГУ (20)

Баев. Поиск шаблонов и машинное обучение для демографических событий (Pattern...
Баев. Поиск шаблонов и машинное обучение для демографических событий (Pattern...Баев. Поиск шаблонов и машинное обучение для демографических событий (Pattern...
Баев. Поиск шаблонов и машинное обучение для демографических событий (Pattern...
 
Муромцев. Методы анализа социальных графов и поиска сообществ
Муромцев. Методы анализа социальных графов и поиска сообществМуромцев. Методы анализа социальных графов и поиска сообществ
Муромцев. Методы анализа социальных графов и поиска сообществ
 
Рой. Аспектный анализ тональности отзывов
Рой. Аспектный анализ тональности отзывов Рой. Аспектный анализ тональности отзывов
Рой. Аспектный анализ тональности отзывов
 
Котиков Простые методы выделения ключевых слов и построения рефератов
Котиков Простые методы выделения ключевых слов и построения рефератовКотиков Простые методы выделения ключевых слов и построения рефератов
Котиков Простые методы выделения ключевых слов и построения рефератов
 
Лукьяненко. Извлечение коллокаций из текста
Лукьяненко. Извлечение коллокаций из текстаЛукьяненко. Извлечение коллокаций из текста
Лукьяненко. Извлечение коллокаций из текста
 
Иванов. Автоматизация построения предметных указателей
Иванов. Автоматизация построения предметных указателейИванов. Автоматизация построения предметных указателей
Иванов. Автоматизация построения предметных указателей
 
Можарова. Автоматическое извлечение именованных сущностей методами машинного ...
Можарова. Автоматическое извлечение именованных сущностей методами машинного ...Можарова. Автоматическое извлечение именованных сущностей методами машинного ...
Можарова. Автоматическое извлечение именованных сущностей методами машинного ...
 
Сапин. Интеллектуальные агенты и обучение с подкреплением
Сапин. Интеллектуальные агенты и обучение с подкреплениемСапин. Интеллектуальные агенты и обучение с подкреплением
Сапин. Интеллектуальные агенты и обучение с подкреплением
 
Смолина Пользовательские интерфейсы систем лингвистической разметки текстов
Смолина Пользовательские интерфейсы систем лингвистической разметки текстовСмолина Пользовательские интерфейсы систем лингвистической разметки текстов
Смолина Пользовательские интерфейсы систем лингвистической разметки текстов
 
Багдатов Методы автоматического выявления плагиата в текстах компьютерных про...
Багдатов Методы автоматического выявления плагиата в текстах компьютерных про...Багдатов Методы автоматического выявления плагиата в текстах компьютерных про...
Багдатов Методы автоматического выявления плагиата в текстах компьютерных про...
 
Тодуа. Сериализация и язык YAML
Тодуа. Сериализация и язык YAMLТодуа. Сериализация и язык YAML
Тодуа. Сериализация и язык YAML
 
Савкуев. Построение формального описания фотографий на основе контекстно-собы...
Савкуев. Построение формального описания фотографий на основе контекстно-собы...Савкуев. Построение формального описания фотографий на основе контекстно-собы...
Савкуев. Построение формального описания фотографий на основе контекстно-собы...
 
Савостин. Системы и методы научного поиска и мониторинга
Савостин. Системы и методы научного поиска и мониторингаСавостин. Системы и методы научного поиска и мониторинга
Савостин. Системы и методы научного поиска и мониторинга
 
Мищенко. Методы автоматического определения наиболее частотного значения слова.
Мищенко. Методы автоматического определения наиболее частотного значения слова.Мищенко. Методы автоматического определения наиболее частотного значения слова.
Мищенко. Методы автоматического определения наиболее частотного значения слова.
 
Мадорский. Извлечение тематически сгруппированных ключевых терминов из тексто...
Мадорский. Извлечение тематически сгруппированных ключевых терминов из тексто...Мадорский. Извлечение тематически сгруппированных ключевых терминов из тексто...
Мадорский. Извлечение тематически сгруппированных ключевых терминов из тексто...
 
Панфилов. Корпусы текстов и принципы их создания
Панфилов. Корпусы текстов и принципы их созданияПанфилов. Корпусы текстов и принципы их создания
Панфилов. Корпусы текстов и принципы их создания
 
Муромцев. Обзор библиографических менеджеров
Муромцев. Обзор библиографических менеджеровМуромцев. Обзор библиографических менеджеров
Муромцев. Обзор библиографических менеджеров
 
Можарова Тематические модели: учет сходства между униграммами и биграммами.
Можарова Тематические модели: учет сходства между униграммами и биграммами.Можарова Тематические модели: учет сходства между униграммами и биграммами.
Можарова Тематические модели: учет сходства между униграммами и биграммами.
 
Смирнова. Методы исправления ошибок в текстах, написанных иностранцами.
Смирнова. Методы исправления ошибок в текстах, написанных иностранцами.Смирнова. Методы исправления ошибок в текстах, написанных иностранцами.
Смирнова. Методы исправления ошибок в текстах, написанных иностранцами.
 
Баев Системы для обучения программированию
Баев Системы для обучения программированиюБаев Системы для обучения программированию
Баев Системы для обучения программированию
 

Программная поддержка морфемного словаря

  • 1. Дипломная работа Программная поддержка морфемного словаря Швейкина О.А., 525 гр. Научный руководитель: к.ф.-м.н. доцент Большакова Е.И.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6. Схема базы данных словаря words word_morphs morphs allomorphs /14 Слово Id слова Бетономешалка 235 Процедура 15782 Id 1 Id 2 1543 1547 1543 1569 Корень Рас 1543 Корень Бетон 147 Id морфа морф Тип морфа 21 О Соед.гласная 1547 Раст Корень Id слова № морфа в слове Id морфа 235 1 147 235 2 21
  • 7.
  • 8.
  • 9. Дерево поиска. Пример 1)«» 2) Столик 3) Приставка 1)«» 2) Столик 3) корень Приставка = « » 1)«+Стол» 2) ик 3) суффикс Корень = «Стол» 1)«+Стол-и» 2) к 3) суффикс 1)«+Стол-ик» 2) - 3) - Суффикс = «ик» Суффикс = «и» Суффикс = « » 1)«+Стол-и-к» 2) - 3) - Суффикс = «к» /14 1)«-С» 2) толик 3) корень 1)«+Стол» 2) ик 3) окончание Приставка = « С »
  • 10.
  • 11. Пользовательский интерфейс. Поиск морфемного состава /14
  • 12. Пользовательский интерфейс. Поиск слов с заданной морфемой /14
  • 13.
  • 14. /14 Благодарю за внимание!