SlideShare ist ein Scribd-Unternehmen logo
1 von 11
Электронные корпуса
Основные понятия
Корпусная лингвистика – это наука о
создании и использовании корпусов,
возникшая вследствие растущих
потребностей лингвистики во внедрении
компьютерных технологий для работы с
большими массивами языковых данных.
Основные понятия
Корпус – это информационно-справочная
система, основанная на собрании текстов на
некотором языке в электронной форме.

Под текстами в этом случае понимаются не только
продукты письменного языка (газетные статьи,
романы, письма, электронные сообщения, дневники
и т.п.), но и устные высказывания (доклады, радио-
и телепередачи, телефонные разговоры и т.п.).
Основные понятия
Тексты, входящие в состав корпусов,

 отобраны исходя из определенных
принципов,
 специально подготовлены и размечены,

 с помощью специальных программ в них

можно искать необходимые фрагменты
текста по заданным параметрам.
Основные понятия
Национальный корпус
представляет данный язык на определенном
этапе его существования и во всём
многообразии жанров, стилей,
территориальных и социальных вариантов.
Основные понятия
Национальный корпус имеет две важные
особенности:
1. Он характеризуется
представительностью, или
сбалансированным составом текстов.
2. Корпус содержит особую дополнительную
информацию о свойствах входящих в него
текстов (так называемую разметку, или
аннотацию).
Основные понятия
Типы корпусов:
1. Противопоставление корпусов, относящихся ко
всему языку, корпусам, относящимся к какому-либо
подъязыку (жанр, стиль, язык определенной
возрастной или социальной группы, язык писателя
или ученого и т.п.);

2. Разделение корпусов по типу лингвистической
разметки.
Несмотря на наличие множества типов разметки,
большинство реально существующих корпусов
относится к корпусам морфологического либо
синтаксического типа (treebanks, «банки
синтаксических структур»).
Основные понятия
                     Критерий                    Типы корпусов

Корпуса отличаются   Формат текста               Электронный
                                                 Неэлектронный
друг от друга по
                     Полнота текстов             Полнотекстовый
многим критериям:
                                                 Выборочный
                     Завершенность корпуса       Статичный
                                                 Пополняемый
                     Средство реализации языка   Корпус письменной речи
                                                 Корпус устной речи
                     Языковые разновидности      Корпус стандартного языка
                                                 Корпус молодежного языка
                                                 Корпус экономического /
                                                        компьютерного языка
                     Временной параметр          Корпус современного языка
                                                 Корпус исторического языка
                     Количество языков           Одноязычный
                                                 Многоязычный
Основные понятия
Конкорданс – это список всех
употреблений заданного языкового
выражения (например, слова) в контексте,
возможно, со ссылками на источник.
Существуют специальные программы
составления конкордансов по некоторому
корпусу текстов, так называемые
конкордансеры.
Основные понятия
Итак, корпуса используются, прежде всего, при
  исследовании различных языковых
   разновидностей;
  составлении словарей, грамматических
   справочников и т.п.;
  изучении и преподавании иностранных языков
   (составление учебных пособий, упражнений,
   доступ к аутентичным материалам);
  переводе (проверка сочетаемости слов,
   стилистических особенностей).
Источники литературы
   Захаров В.П. Обзор корпусов. Презентация. – Режим доступа:
    download.yandex.ru/class/zakharov/CL_L9.ppt
   Образовательный портал Национального корпуса русского языка. – Режим
    доступа: http://studiorum.ruscorpora.ru
    /index.php?option=com_content&view=article&id=241&Itemid=48
   Подлесская В.И. Современные компьютерные методы в изучении и преподавании
    лингвистических дисциплин: корпусная лингвистика. – Режим доступа: http://
    zhangbyrzhan.ucoz.ru/publ/metodika/inostrannyj_jazyk/
    sovremennye_kompjuternye_metody_v_izuchenii_i_prepodavanii_lingvisticheskikh_disciplin
    /12-1-0-27
   Портал «Национальный корпус русского языка». – Режим доступа: http://
    www.ruscorpora.ru/
   Портал «Фонд знаний ЛОМОНОСОВ». Энциклопедия. Статья «Конкорданс». –
    Режим доступа: http://www.lomonosov-fund.ru/enc/ru/encyclopedia:0127200
   Scherer C. Korpuslinguistik. – Universitätsverlag WINTER Heidelberg. – 2006. – 98 S.

Weitere ähnliche Inhalte

Was ist angesagt?

Предварительная обработка и разметка корпуса текстов
Предварительная обработка и разметка корпуса текстовПредварительная обработка и разметка корпуса текстов
Предварительная обработка и разметка корпуса текстовArtem Lukanin
 
Понятие лексикографии
Понятие лексикографииПонятие лексикографии
Понятие лексикографииArtem Lukanin
 
львова о в лингвистические корпусы
львова о в лингвистические корпусыльвова о в лингвистические корпусы
львова о в лингвистические корпусыmetodika
 
Электронные корпусы как основа словарей современного английского языка
Электронные корпусы как основа словарей современного английского языкаЭлектронные корпусы как основа словарей современного английского языка
Электронные корпусы как основа словарей современного английского языкаYevgeniya Grigoryeva
 
бесконечное слово
бесконечное словобесконечное слово
бесконечное словоArsenij Lebedev
 
Корпус современного американского английского
Корпус современного американского английскогоКорпус современного американского английского
Корпус современного американского английскогоmaymarina19
 
Корпусная лингвистика: Проект открытый корпус и применение в народном хозяйстве
Корпусная лингвистика: Проект открытый корпус и применение в народном хозяйствеКорпусная лингвистика: Проект открытый корпус и применение в народном хозяйстве
Корпусная лингвистика: Проект открытый корпус и применение в народном хозяйствеWitology
 
Сравнительное исследование переводов книги "Преступление и наказание"
Сравнительное исследование переводов книги "Преступление и наказание" Сравнительное исследование переводов книги "Преступление и наказание"
Сравнительное исследование переводов книги "Преступление и наказание" Анастасия Терешенко
 
История развития английской лексикографии
История развития английской лексикографииИстория развития английской лексикографии
История развития английской лексикографииYevgeniya Grigoryeva
 
Sleng Nezavisim
Sleng NezavisimSleng Nezavisim
Sleng NezavisimForgevalt
 
копия юджин альберт найда
копия юджин альберт найдакопия юджин альберт найда
копия юджин альберт найдаKlunnyy
 

Was ist angesagt? (14)

Предварительная обработка и разметка корпуса текстов
Предварительная обработка и разметка корпуса текстовПредварительная обработка и разметка корпуса текстов
Предварительная обработка и разметка корпуса текстов
 
Понятие лексикографии
Понятие лексикографииПонятие лексикографии
Понятие лексикографии
 
львова о в лингвистические корпусы
львова о в лингвистические корпусыльвова о в лингвистические корпусы
львова о в лингвистические корпусы
 
Электронные корпусы как основа словарей современного английского языка
Электронные корпусы как основа словарей современного английского языкаЭлектронные корпусы как основа словарей современного английского языка
Электронные корпусы как основа словарей современного английского языка
 
P2 ozo kav
P2 ozo kavP2 ozo kav
P2 ozo kav
 
бесконечное слово
бесконечное словобесконечное слово
бесконечное слово
 
Корпус современного американского английского
Корпус современного американского английскогоКорпус современного американского английского
Корпус современного американского английского
 
Корпусная лингвистика: Проект открытый корпус и применение в народном хозяйстве
Корпусная лингвистика: Проект открытый корпус и применение в народном хозяйствеКорпусная лингвистика: Проект открытый корпус и применение в народном хозяйстве
Корпусная лингвистика: Проект открытый корпус и применение в народном хозяйстве
 
Сравнительное исследование переводов книги "Преступление и наказание"
Сравнительное исследование переводов книги "Преступление и наказание" Сравнительное исследование переводов книги "Преступление и наказание"
Сравнительное исследование переводов книги "Преступление и наказание"
 
История развития английской лексикографии
История развития английской лексикографииИстория развития английской лексикографии
История развития английской лексикографии
 
Английский за пределами учебной аудитории! (English outside the classroom!)
Английский за пределами учебной аудитории! (English outside the classroom!)Английский за пределами учебной аудитории! (English outside the classroom!)
Английский за пределами учебной аудитории! (English outside the classroom!)
 
компьютерная лексикография
компьютерная лексикографиякомпьютерная лексикография
компьютерная лексикография
 
Sleng Nezavisim
Sleng NezavisimSleng Nezavisim
Sleng Nezavisim
 
копия юджин альберт найда
копия юджин альберт найдакопия юджин альберт найда
копия юджин альберт найда
 

Ähnlich wie Электронные корпуса

01. русский язык 5 9 фкгос
01. русский язык 5 9 фкгос01. русский язык 5 9 фкгос
01. русский язык 5 9 фкгосrassyhaev
 
10 русск яз-рудяков_фролова_2010_рус
10 русск яз-рудяков_фролова_2010_рус10 русск яз-рудяков_фролова_2010_рус
10 русск яз-рудяков_фролова_2010_русAira_Roo
 
Rosijska mova-10-klas-rudjakov
Rosijska mova-10-klas-rudjakovRosijska mova-10-klas-rudjakov
Rosijska mova-10-klas-rudjakovkreidaros1
 
10 ry r_r
10 ry r_r10 ry r_r
10 ry r_rUA1011
 
847 русский язык. 10кл. рудяков, фролова, быкова-украина, 2010 -288с
847  русский язык. 10кл. рудяков, фролова, быкова-украина, 2010 -288с847  русский язык. 10кл. рудяков, фролова, быкова-украина, 2010 -288с
847 русский язык. 10кл. рудяков, фролова, быкова-украина, 2010 -288сpsvayy
 
Portfel.in.ua 107 rus_yaz_rud
Portfel.in.ua 107 rus_yaz_rudPortfel.in.ua 107 rus_yaz_rud
Portfel.in.ua 107 rus_yaz_rudportfel
 
10 ry r_r
10 ry r_r10 ry r_r
10 ry r_r4book
 
письмо
письмописьмо
письмоArafel
 
курс русский язык 1 4 новый
курс русский язык 1 4 новыйкурс русский язык 1 4 новый
курс русский язык 1 4 новыйqwer16r36
 
Шлуинский А. Б.
Шлуинский А. Б. Шлуинский А. Б.
Шлуинский А. Б. zpsh
 
01. русский язык 10 11 классы фкгос
01. русский  язык 10 11 классы фкгос01. русский  язык 10 11 классы фкгос
01. русский язык 10 11 классы фкгосrassyhaev
 
Корпусная лингвистика
Корпусная лингвистикаКорпусная лингвистика
Корпусная лингвистикаKseniyaDolgova
 
7 русск яз_самонова_полякова_7год_2015_рус
7 русск яз_самонова_полякова_7год_2015_рус7 русск яз_самонова_полякова_7год_2015_рус
7 русск яз_самонова_полякова_7год_2015_русAira_Roo
 

Ähnlich wie Электронные корпуса (20)

презентация1
презентация1презентация1
презентация1
 
522
522522
522
 
01. русский язык 5 9 фкгос
01. русский язык 5 9 фкгос01. русский язык 5 9 фкгос
01. русский язык 5 9 фкгос
 
10 русск яз-рудяков_фролова_2010_рус
10 русск яз-рудяков_фролова_2010_рус10 русск яз-рудяков_фролова_2010_рус
10 русск яз-рудяков_фролова_2010_рус
 
10
1010
10
 
Rosijska mova-10-klas-rudjakov
Rosijska mova-10-klas-rudjakovRosijska mova-10-klas-rudjakov
Rosijska mova-10-klas-rudjakov
 
10 ry r_r
10 ry r_r10 ry r_r
10 ry r_r
 
bdxvxg
bdxvxgbdxvxg
bdxvxg
 
847 русский язык. 10кл. рудяков, фролова, быкова-украина, 2010 -288с
847  русский язык. 10кл. рудяков, фролова, быкова-украина, 2010 -288с847  русский язык. 10кл. рудяков, фролова, быкова-украина, 2010 -288с
847 русский язык. 10кл. рудяков, фролова, быкова-украина, 2010 -288с
 
Portfel.in.ua 107 rus_yaz_rud
Portfel.in.ua 107 rus_yaz_rudPortfel.in.ua 107 rus_yaz_rud
Portfel.in.ua 107 rus_yaz_rud
 
10 ry r_r
10 ry r_r10 ry r_r
10 ry r_r
 
письмо
письмописьмо
письмо
 
курс русский язык 1 4 новый
курс русский язык 1 4 новыйкурс русский язык 1 4 новый
курс русский язык 1 4 новый
 
ЭОР
ЭОРЭОР
ЭОР
 
Шлуинский А. Б.
Шлуинский А. Б. Шлуинский А. Б.
Шлуинский А. Б.
 
01. русский язык 10 11 классы фкгос
01. русский  язык 10 11 классы фкгос01. русский  язык 10 11 классы фкгос
01. русский язык 10 11 классы фкгос
 
Язык
ЯзыкЯзык
Язык
 
Корпусная лингвистика
Корпусная лингвистикаКорпусная лингвистика
Корпусная лингвистика
 
элективные курсы
элективные курсыэлективные курсы
элективные курсы
 
7 русск яз_самонова_полякова_7год_2015_рус
7 русск яз_самонова_полякова_7год_2015_рус7 русск яз_самонова_полякова_7год_2015_рус
7 русск яз_самонова_полякова_7год_2015_рус
 

Mehr von anna_pal

презентация икк переводчики
презентация икк переводчикипрезентация икк переводчики
презентация икк переводчикиanna_pal
 
Электронная лингводидактика
Электронная лингводидактикаЭлектронная лингводидактика
Электронная лингводидактикаanna_pal
 
Стратегии преподавания
Стратегии преподаванияСтратегии преподавания
Стратегии преподаванияanna_pal
 
фпк 2014
фпк 2014фпк 2014
фпк 2014anna_pal
 
Webinar WebQquests
Webinar WebQquestsWebinar WebQquests
Webinar WebQquestsanna_pal
 
Beitrag palkova
Beitrag palkovaBeitrag palkova
Beitrag palkovaanna_pal
 
История Интернета_Гипертекст
История Интернета_ГипертекстИстория Интернета_Гипертекст
История Интернета_Гипертекстanna_pal
 
презентация семинар по бд
презентация семинар по бдпрезентация семинар по бд
презентация семинар по бдanna_pal
 
Projekt Graffiti
Projekt GraffitiProjekt Graffiti
Projekt Graffitianna_pal
 
Graffiti in Berlin
Graffiti in BerlinGraffiti in Berlin
Graffiti in Berlinanna_pal
 
Интернет-технологии интерактивного языкового тренинга
Интернет-технологии интерактивного языкового тренингаИнтернет-технологии интерактивного языкового тренинга
Интернет-технологии интерактивного языкового тренингаanna_pal
 

Mehr von anna_pal (12)

презентация икк переводчики
презентация икк переводчикипрезентация икк переводчики
презентация икк переводчики
 
Электронная лингводидактика
Электронная лингводидактикаЭлектронная лингводидактика
Электронная лингводидактика
 
Стратегии преподавания
Стратегии преподаванияСтратегии преподавания
Стратегии преподавания
 
ИКК
ИККИКК
ИКК
 
фпк 2014
фпк 2014фпк 2014
фпк 2014
 
Webinar WebQquests
Webinar WebQquestsWebinar WebQquests
Webinar WebQquests
 
Beitrag palkova
Beitrag palkovaBeitrag palkova
Beitrag palkova
 
История Интернета_Гипертекст
История Интернета_ГипертекстИстория Интернета_Гипертекст
История Интернета_Гипертекст
 
презентация семинар по бд
презентация семинар по бдпрезентация семинар по бд
презентация семинар по бд
 
Projekt Graffiti
Projekt GraffitiProjekt Graffiti
Projekt Graffiti
 
Graffiti in Berlin
Graffiti in BerlinGraffiti in Berlin
Graffiti in Berlin
 
Интернет-технологии интерактивного языкового тренинга
Интернет-технологии интерактивного языкового тренингаИнтернет-технологии интерактивного языкового тренинга
Интернет-технологии интерактивного языкового тренинга
 

Электронные корпуса

  • 2. Основные понятия Корпусная лингвистика – это наука о создании и использовании корпусов, возникшая вследствие растущих потребностей лингвистики во внедрении компьютерных технологий для работы с большими массивами языковых данных.
  • 3. Основные понятия Корпус – это информационно-справочная система, основанная на собрании текстов на некотором языке в электронной форме. Под текстами в этом случае понимаются не только продукты письменного языка (газетные статьи, романы, письма, электронные сообщения, дневники и т.п.), но и устные высказывания (доклады, радио- и телепередачи, телефонные разговоры и т.п.).
  • 4. Основные понятия Тексты, входящие в состав корпусов,  отобраны исходя из определенных принципов,  специально подготовлены и размечены,  с помощью специальных программ в них можно искать необходимые фрагменты текста по заданным параметрам.
  • 5. Основные понятия Национальный корпус представляет данный язык на определенном этапе его существования и во всём многообразии жанров, стилей, территориальных и социальных вариантов.
  • 6. Основные понятия Национальный корпус имеет две важные особенности: 1. Он характеризуется представительностью, или сбалансированным составом текстов. 2. Корпус содержит особую дополнительную информацию о свойствах входящих в него текстов (так называемую разметку, или аннотацию).
  • 7. Основные понятия Типы корпусов: 1. Противопоставление корпусов, относящихся ко всему языку, корпусам, относящимся к какому-либо подъязыку (жанр, стиль, язык определенной возрастной или социальной группы, язык писателя или ученого и т.п.); 2. Разделение корпусов по типу лингвистической разметки. Несмотря на наличие множества типов разметки, большинство реально существующих корпусов относится к корпусам морфологического либо синтаксического типа (treebanks, «банки синтаксических структур»).
  • 8. Основные понятия Критерий Типы корпусов Корпуса отличаются Формат текста Электронный Неэлектронный друг от друга по Полнота текстов Полнотекстовый многим критериям: Выборочный Завершенность корпуса Статичный Пополняемый Средство реализации языка Корпус письменной речи Корпус устной речи Языковые разновидности Корпус стандартного языка Корпус молодежного языка Корпус экономического / компьютерного языка Временной параметр Корпус современного языка Корпус исторического языка Количество языков Одноязычный Многоязычный
  • 9. Основные понятия Конкорданс – это список всех употреблений заданного языкового выражения (например, слова) в контексте, возможно, со ссылками на источник. Существуют специальные программы составления конкордансов по некоторому корпусу текстов, так называемые конкордансеры.
  • 10. Основные понятия Итак, корпуса используются, прежде всего, при  исследовании различных языковых разновидностей;  составлении словарей, грамматических справочников и т.п.;  изучении и преподавании иностранных языков (составление учебных пособий, упражнений, доступ к аутентичным материалам);  переводе (проверка сочетаемости слов, стилистических особенностей).
  • 11. Источники литературы  Захаров В.П. Обзор корпусов. Презентация. – Режим доступа: download.yandex.ru/class/zakharov/CL_L9.ppt  Образовательный портал Национального корпуса русского языка. – Режим доступа: http://studiorum.ruscorpora.ru /index.php?option=com_content&view=article&id=241&Itemid=48  Подлесская В.И. Современные компьютерные методы в изучении и преподавании лингвистических дисциплин: корпусная лингвистика. – Режим доступа: http:// zhangbyrzhan.ucoz.ru/publ/metodika/inostrannyj_jazyk/ sovremennye_kompjuternye_metody_v_izuchenii_i_prepodavanii_lingvisticheskikh_disciplin /12-1-0-27  Портал «Национальный корпус русского языка». – Режим доступа: http:// www.ruscorpora.ru/  Портал «Фонд знаний ЛОМОНОСОВ». Энциклопедия. Статья «Конкорданс». – Режим доступа: http://www.lomonosov-fund.ru/enc/ru/encyclopedia:0127200  Scherer C. Korpuslinguistik. – Universitätsverlag WINTER Heidelberg. – 2006. – 98 S.