SlideShare a Scribd company logo
1 of 12
Download to read offline
hi@realspeaker.org
Виктор Осетров
API для преобразовании речи в текст
Основано на технике глубокого обучения
Получить APIСкачать или
Количество жестких дисков объемом 10 терабайт, которые потребуются российским
операторам связи для хранения всех переговоров в соответствии с «антитеррористическими
законами» Ирины Яровой.
Source: Meduza
3
API для преобразования аудио в текст
Тестовая страница:
https://api.realspeaker.org/recognition/ru-RU
Библиотеки с примерами:
https://bitbucket.org/realspeaker/realspeaker.js
База данных
накопленная
по речи за 3
года
3
API
доступ
Мы делаем API для проверки произношения
Храните в
тексте, а не
в аудио
Ключ
Распознавание
речи в текст
Как это работает
3
Мы делаем API для проверки произношения
Обработка после коммуникации.
Oktell по завершению коммуникации включает свой алгоритм для обработки контента.
В этом алгоритме можно прописать получение пути к записи разговора или копирование этой записи в папку,
которая нам нужна.
Для начала эта запись (stereo) должна быть разбита на два mono файла.
Эти файлы должны быть восприняты системой как единая связка и из этой связки должен сформироваться
диалог с таймингом фраз и обозначением спикера.
Соответственно Oktell должен отправить какой-то запрос в систему, чтобы та забрала файл, при помощи
инструмента запуска внешнего приложения с параметрами можно запустить наше приложение или
воспользоваться функцией запроса WEB формы.
После чего система Oktell должна получить ответ в виде текста (с таймингом и разбиением на диалог). И эту
информацию Oktell поместит в таблицу с помощью sql запроса.
Пример того, как текст должен попасть в таблицу:
Вариант 1 (один из возможных кейсов)
Диалог Оператор Собеседник
12.08.2016 15:01:29
Оператор - Добрый день
меня зовут Петр
12.08.2016 15:01:50
Собеседник - Добрый
хочу кота
12.08.2016 15:02:15
Оператор - У нас нету
12.08.2016 15:01:29
Оператор - Добрый день,
меня зовут Петр
12.08.2016 15:02:15
Оператор - У нас нету
12.08.2016 15:01:50
Собеседник - Добрый, хочу
кота
3
Мы делаем API для проверки произношения
Обработка в конце рабочего дня
В Oktell за весь день в базе данных формируются записи путей к записям разговоров.
Ночью автоматически запускается сценарий, который будет выгружать все пути записей разговоров в файл
или напрямую в приложение.
Также возможен вариант прохода по очереди. Берется запись в базе данных, в которой лежит путь к записи
разговора после чего формируется запрос и отправляется нам на сервер (варианты описаны выше в
варианте 1)
- Приложение или запрос на сервер должно вернуть текст.
- Этот текст помещается в базу данных.
Вариант 2 (один из возможных кейсов)
Диалог Оператор Собеседник
12.08.2016 15:01:29
Оператор - Добрый день
меня зовут Петр
12.08.2016 15:01:50
Собеседник - Добрый
хочу кота
12.08.2016 15:02:15
Оператор - У нас нету
12.08.2016 15:01:29
Оператор - Добрый день,
меня зовут Петр
12.08.2016 15:02:15
Оператор - У нас нету
12.08.2016 15:01:50
Собеседник - Добрый, хочу
кота
более 3,5 тыс платных пользователей
Стоимость
100 000
руб
/500 руб за
расшифровку 1
тыс. минут
Подключение
+API/SDK
Наша команда
Виктор
Осетров
CEO
Алия
Мусина
Finance/
CFO
Артем
Смирнов
CTO
Облака и мобильная
версия
Сегодня
Windows
Локальный рынок
Мультиплатформенность
и
Мультиязычность
ВидениеСтарт
Дорожная карта
Наши преимущества
RealSpeaker 2.0
Д е ш е в л е ,
н е ж е л и х р а н и т ь
а у д и о н а д и с к е
+
Г о т о в ы й
п р о д у к т
р а с п о з н а в а н и я
К о н в е р т а ц и я
ф а й л о в
в
т е к с т
С о б с т в е н н а я
б а з а
д а н н ы х
Снизим Ваши затраты на диски!
realspeaker.net

More Related Content

Viewers also liked

3 minpitchrealspeakerlatest
3 minpitchrealspeakerlatest3 minpitchrealspeakerlatest
3 minpitchrealspeakerlatest
RealSpeaker 2.0
 
RealSpeaker презентация на русском языке
RealSpeaker презентация на русском языкеRealSpeaker презентация на русском языке
RealSpeaker презентация на русском языке
RealSpeaker 2.0
 

Viewers also liked (7)

Personal kitchen hygiene. Preparation for Survival week. Draper University.
Personal kitchen hygiene. Preparation for Survival week. Draper University. Personal kitchen hygiene. Preparation for Survival week. Draper University.
Personal kitchen hygiene. Preparation for Survival week. Draper University.
 
RealSpeaker for Sberbank
RealSpeaker for SberbankRealSpeaker for Sberbank
RealSpeaker for Sberbank
 
3 minpitchrealspeakerlatest
3 minpitchrealspeakerlatest3 minpitchrealspeakerlatest
3 minpitchrealspeakerlatest
 
RealSpeaker & Forbes
RealSpeaker & ForbesRealSpeaker & Forbes
RealSpeaker & Forbes
 
Маркетинговое исследование: Рынок систем распознавания речи 2012-2016 гг.
Маркетинговое исследование: Рынок систем распознавания речи 2012-2016 гг.Маркетинговое исследование: Рынок систем распознавания речи 2012-2016 гг.
Маркетинговое исследование: Рынок систем распознавания речи 2012-2016 гг.
 
Презентация РеалСпикер от 18 марта 2014 года
Презентация РеалСпикер от 18 марта 2014 годаПрезентация РеалСпикер от 18 марта 2014 года
Презентация РеалСпикер от 18 марта 2014 года
 
RealSpeaker презентация на русском языке
RealSpeaker презентация на русском языкеRealSpeaker презентация на русском языке
RealSpeaker презентация на русском языке
 

Similar to API для преобразования речи в текст

Flash Media Server
Flash Media ServerFlash Media Server
Flash Media Server
dinosaur
 
введение в интернет
введение в интернетвведение в интернет
введение в интернет
Ulyana1973
 
Инфраструктура социального проекта
Инфраструктура социального проектаИнфраструктура социального проекта
Инфраструктура социального проекта
Media Gorod
 

Similar to API для преобразования речи в текст (20)

Информационные ресурсы и сервисы Интернета
Информационные ресурсы и сервисы ИнтернетаИнформационные ресурсы и сервисы Интернета
Информационные ресурсы и сервисы Интернета
 
сетевые протоколы
сетевые протоколысетевые протоколы
сетевые протоколы
 
Flash Media Server
Flash Media ServerFlash Media Server
Flash Media Server
 
архитектура и принципы работы типового Web приложения
архитектура и принципы работы типового Web приложенияархитектура и принципы работы типового Web приложения
архитектура и принципы работы типового Web приложения
 
введение в интернет
введение в интернетвведение в интернет
введение в интернет
 
Аудио в текст.docx
Аудио в текст.docxАудио в текст.docx
Аудио в текст.docx
 
Твое место во всемирной паутинеи
Твое место во всемирной паутинеиТвое место во всемирной паутинеи
Твое место во всемирной паутинеи
 
Протокол HTTP. Клиент-серверная модель взаимодействия. Servlet API
Протокол HTTP. Клиент-серверная модель взаимодействия. Servlet APIПротокол HTTP. Клиент-серверная модель взаимодействия. Servlet API
Протокол HTTP. Клиент-серверная модель взаимодействия. Servlet API
 
Natural Language Processing (NLP) with .NET for #dotnetby meetup-29
Natural Language Processing (NLP) with .NET for #dotnetby meetup-29Natural Language Processing (NLP) with .NET for #dotnetby meetup-29
Natural Language Processing (NLP) with .NET for #dotnetby meetup-29
 
Лекция 1. Модель OSI.
Лекция 1. Модель OSI.Лекция 1. Модель OSI.
Лекция 1. Модель OSI.
 
Maleev
MaleevMaleev
Maleev
 
Html лаб 2
Html лаб 2Html лаб 2
Html лаб 2
 
Present.pps
Present.ppsPresent.pps
Present.pps
 
Present.pps
Present.ppsPresent.pps
Present.pps
 
Инфраструктура социального проекта
Инфраструктура социального проектаИнфраструктура социального проекта
Инфраструктура социального проекта
 
Python-технология которую легко продавать!
Python-технология которую легко продавать!Python-технология которую легко продавать!
Python-технология которую легко продавать!
 
Протокол HTTP
Протокол HTTPПротокол HTTP
Протокол HTTP
 
Cпецкурс 2014, занятие 7. Web-приложения
Cпецкурс 2014, занятие 7. Web-приложенияCпецкурс 2014, занятие 7. Web-приложения
Cпецкурс 2014, занятие 7. Web-приложения
 
4CIO.ppt
4CIO.ppt4CIO.ppt
4CIO.ppt
 
4CIO.ppt
4CIO.ppt4CIO.ppt
4CIO.ppt
 

More from RealSpeaker 2.0

RealSpeaker Russia September
RealSpeaker Russia SeptemberRealSpeaker Russia September
RealSpeaker Russia September
RealSpeaker 2.0
 

More from RealSpeaker 2.0 (20)

20161018204632
2016101820463220161018204632
20161018204632
 
MyRussia18 - 15 слайдов
MyRussia18 - 15 слайдовMyRussia18 - 15 слайдов
MyRussia18 - 15 слайдов
 
Cамый вежливый программист
Cамый вежливый программистCамый вежливый программист
Cамый вежливый программист
 
Safe presentation about ticks for Survival week. Draper University
Safe presentation about ticks for Survival week. Draper UniversitySafe presentation about ticks for Survival week. Draper University
Safe presentation about ticks for Survival week. Draper University
 
InvestorDeck RealSpeaker 2.0
InvestorDeck RealSpeaker 2.0InvestorDeck RealSpeaker 2.0
InvestorDeck RealSpeaker 2.0
 
RealSpeaker 2_0_investor
RealSpeaker 2_0_investorRealSpeaker 2_0_investor
RealSpeaker 2_0_investor
 
Presentation about the main ideas of the DeepDive (Stanford University)
Presentation about the main ideas of the DeepDive (Stanford University)Presentation about the main ideas of the DeepDive (Stanford University)
Presentation about the main ideas of the DeepDive (Stanford University)
 
RealSpeaker (Chile 4.0)
RealSpeaker (Chile 4.0)RealSpeaker (Chile 4.0)
RealSpeaker (Chile 4.0)
 
Регистрация компании в США. Древо решений: Делавер или Калифорния
Регистрация компании в США. Древо решений: Делавер или КалифорнияРегистрация компании в США. Древо решений: Делавер или Калифорния
Регистрация компании в США. Древо решений: Делавер или Калифорния
 
Presentation RealSpeaker (3.0) Chile
Presentation RealSpeaker (3.0) ChilePresentation RealSpeaker (3.0) Chile
Presentation RealSpeaker (3.0) Chile
 
RealSpeaker Chile V 2.0
RealSpeaker Chile V 2.0RealSpeaker Chile V 2.0
RealSpeaker Chile V 2.0
 
RealSpeaker - Chile v.1.0
RealSpeaker - Chile v.1.0RealSpeaker - Chile v.1.0
RealSpeaker - Chile v.1.0
 
RealSpeaker Skolkovo SuperLeague presentation (october of 2014)
RealSpeaker Skolkovo SuperLeague presentation (october of 2014)RealSpeaker Skolkovo SuperLeague presentation (october of 2014)
RealSpeaker Skolkovo SuperLeague presentation (october of 2014)
 
Surviving Malaysia (according to Hofstede model)
Surviving Malaysia (according to Hofstede model)Surviving Malaysia (according to Hofstede model)
Surviving Malaysia (according to Hofstede model)
 
RealSpeaker Russia September
RealSpeaker Russia SeptemberRealSpeaker Russia September
RealSpeaker Russia September
 
RealSpeaker English September 2014
RealSpeaker English September 2014RealSpeaker English September 2014
RealSpeaker English September 2014
 
RealSpeaker for Tesla
RealSpeaker for TeslaRealSpeaker for Tesla
RealSpeaker for Tesla
 
RealSpeaker & MTS
RealSpeaker & MTSRealSpeaker & MTS
RealSpeaker & MTS
 
SCRUM - разработка без начальника
SCRUM - разработка без начальникаSCRUM - разработка без начальника
SCRUM - разработка без начальника
 
Протоколы испытаний
Протоколы испытанийПротоколы испытаний
Протоколы испытаний
 

API для преобразования речи в текст

  • 1. hi@realspeaker.org Виктор Осетров API для преобразовании речи в текст Основано на технике глубокого обучения Получить APIСкачать или
  • 2. Количество жестких дисков объемом 10 терабайт, которые потребуются российским операторам связи для хранения всех переговоров в соответствии с «антитеррористическими законами» Ирины Яровой. Source: Meduza
  • 3. 3 API для преобразования аудио в текст Тестовая страница: https://api.realspeaker.org/recognition/ru-RU Библиотеки с примерами: https://bitbucket.org/realspeaker/realspeaker.js
  • 4. База данных накопленная по речи за 3 года 3 API доступ Мы делаем API для проверки произношения Храните в тексте, а не в аудио Ключ Распознавание речи в текст Как это работает
  • 5. 3 Мы делаем API для проверки произношения Обработка после коммуникации. Oktell по завершению коммуникации включает свой алгоритм для обработки контента. В этом алгоритме можно прописать получение пути к записи разговора или копирование этой записи в папку, которая нам нужна. Для начала эта запись (stereo) должна быть разбита на два mono файла. Эти файлы должны быть восприняты системой как единая связка и из этой связки должен сформироваться диалог с таймингом фраз и обозначением спикера. Соответственно Oktell должен отправить какой-то запрос в систему, чтобы та забрала файл, при помощи инструмента запуска внешнего приложения с параметрами можно запустить наше приложение или воспользоваться функцией запроса WEB формы. После чего система Oktell должна получить ответ в виде текста (с таймингом и разбиением на диалог). И эту информацию Oktell поместит в таблицу с помощью sql запроса. Пример того, как текст должен попасть в таблицу: Вариант 1 (один из возможных кейсов) Диалог Оператор Собеседник 12.08.2016 15:01:29 Оператор - Добрый день меня зовут Петр 12.08.2016 15:01:50 Собеседник - Добрый хочу кота 12.08.2016 15:02:15 Оператор - У нас нету 12.08.2016 15:01:29 Оператор - Добрый день, меня зовут Петр 12.08.2016 15:02:15 Оператор - У нас нету 12.08.2016 15:01:50 Собеседник - Добрый, хочу кота
  • 6. 3 Мы делаем API для проверки произношения Обработка в конце рабочего дня В Oktell за весь день в базе данных формируются записи путей к записям разговоров. Ночью автоматически запускается сценарий, который будет выгружать все пути записей разговоров в файл или напрямую в приложение. Также возможен вариант прохода по очереди. Берется запись в базе данных, в которой лежит путь к записи разговора после чего формируется запрос и отправляется нам на сервер (варианты описаны выше в варианте 1) - Приложение или запрос на сервер должно вернуть текст. - Этот текст помещается в базу данных. Вариант 2 (один из возможных кейсов) Диалог Оператор Собеседник 12.08.2016 15:01:29 Оператор - Добрый день меня зовут Петр 12.08.2016 15:01:50 Собеседник - Добрый хочу кота 12.08.2016 15:02:15 Оператор - У нас нету 12.08.2016 15:01:29 Оператор - Добрый день, меня зовут Петр 12.08.2016 15:02:15 Оператор - У нас нету 12.08.2016 15:01:50 Собеседник - Добрый, хочу кота
  • 7. более 3,5 тыс платных пользователей
  • 8. Стоимость 100 000 руб /500 руб за расшифровку 1 тыс. минут Подключение +API/SDK
  • 10. Облака и мобильная версия Сегодня Windows Локальный рынок Мультиплатформенность и Мультиязычность ВидениеСтарт Дорожная карта
  • 11. Наши преимущества RealSpeaker 2.0 Д е ш е в л е , н е ж е л и х р а н и т ь а у д и о н а д и с к е + Г о т о в ы й п р о д у к т р а с п о з н а в а н и я К о н в е р т а ц и я ф а й л о в в т е к с т С о б с т в е н н а я б а з а д а н н ы х
  • 12. Снизим Ваши затраты на диски! realspeaker.net