2. Математическая поисковая система Uniquation
Что такое Uniquation
Uniquation – научная поисковая система, которая позволяет
искать математическую информацию в интернете, используя её
смысл, а не конкретное представление. Если в качестве запроса
указать уравнение, то результатом поиска будет ссылка на
документ, где оно упоминается, и где, возможно, есть его
решение.
В основе поисковой системы – алгоритм нормализации
формул, который решает проблему множества эквивалентных
представлений формул.
3. Математическая поисковая система Uniquation
Цель
Создать инструмент, который позволит математикам,
исследующим какую-либо модель, и инженерам (экономистам,
биологам...), использующим её, быстро находить работы друг
друга и продуктивно взаимодействовать. Инструмент, который
позволит найти решение задачи и помочь в расчетах.
Инструмент, который сделает решение задачи (уравнения)
доступным всему миру, как только она будет в первый раз
кем-то решена.
4. Математическая поисковая система Uniquation
Путь к цели
Поиск
Реализовать поисковую систему, помогающую в типовых
расчетах школьникам, студентам и инженерам. Доступна альфа
версия.
5. Математическая поисковая система Uniquation
Путь к цели
Энциклопедия
Создать свободную математическую энциклопедию, в которой
каждая статья посвящена какому-либо математическому
объекту. Например, в статье про конкретное
дифференциальное уравнение могут быть указаны его решение,
свойства и применение. Обеспечить интеллектуальный поиск
по статьям, например, статья про класс уравнений
f (t) + af (t) = 0 должна быть найдена по запросу уравнения
из этого класса y (x) + 2y (x) = 0. С поддержкой поиска
общего по частному, энциклопедия предоставит
функциональность CAS, но лишенную её недостатков. Проект в
стадии разработки, кодовое название – GaloisWiki, на конкурсе
прототипов hackday2 занял второе место.
6. Математическая поисковая система Uniquation
Конкуренты
Прямого конкурента нет, есть родственные проекты:
Wolframalpha, Нигма.Математика и CAS.
Эти проекты объединяет то, что они вычисляют решение, а не
ищут его. Так как алгоритмы символьных вычислений
ограничены, то всегда будет существовать задачи, которые уже
имеют решение, но которые не могут быть решены с помощью
CAS. Идея заменить вычисление на поиск обходит этот
ограничение. Другое преимущество поиска заключается в том,
что он может предоставить всю информацию по исследуемой
модели, в том числе и список людей, которые в данный момент
ей занимаются.
7. Математическая поисковая система Uniquation
Проблема эквивалентных представлений формул
Проблема реализации поиска заключается в существовании
множества эквивалентных представлений одной и той же
формулы.
Формула может иметь разные представления вследствие
альфа-эквивалентности использования разных переменных
sin(a + b) ∼ sin(x + y )
коммутативности разного порядка переменных коммутативных
операторов y + y ∼ y + y
эквивалентности комбинации первых двух пунктов
8. Математическая поисковая система Uniquation
Анализ проблемы
Решение проблемы многозначности представлений также
является решением проблемы канонизации графов (Graph
Сanonization). Принадлежность последней задачи к P или NP
классу еще не доказана. Будем рассматривать худший вариант,
следовательно, любой алгоритм решения задачи
многозначности представлений имеет экспоненциальную
сложность.
Разработанный алгоритм, используя эвристики формул,
приводит выражение к каноническому виду менее чем за одну
миллисекунду! В случае, если обработка формулы превышает
ограничение на ресурсы, можно привести задачу к классу P,
увеличив скорость работы, но потеряв точность.
тестировались формулы представленные в Wikipedia
9. Математическая поисковая система Uniquation
Анализ существующих решений
Исследование проблемы различия представлений
эквивалентных формул и создание математической поисковой
системы велось в университете Болоньи (в рамках проекта
mowgli) и в университете Бремена (в рамках проекта kwarc).
Результаты описаны в работах:
M. Kohlhase, I. Sucan. A Search Engine for Mathematical
Formulae. Volume 4120 in LNCS.
A.Asperti. A Content Based Mathematical Search Engine:
Whelp. Volume 3839 in LNCS.
Первая работа игнорирует коммутативность, вторая
альфа-эквивалентность, что делает алгоритмы неприменимыми
там, где нужна точность поиска.
10. Математическая поисковая система Uniquation
Анализ решения
Проблему многозначности представлений решает оператор
нормализации (F ), который преобразует отношение
эквивалентности представлений в отношение равенства их
образов. Он позволяет использовать DHT для хранения
проиндексированных формул, обеспечивая прозрачное
горизонтальное масштабирование.
a ∼ b ⇒ F (a) = F (b)
11. Математическая поисковая система Uniquation
Анализ решения
Операция индексирования сводиться к применению оператора
нормализации и сохранению результата в DHT.
Операция поиска сводиться к применению оператора
нормализации и поиска в DHT.
Так как оператор нормализации зависит только от входных
данных (введенного запроса) и не зависит от объема DHT, то
скорость поиска и индексации практически не зависит от
текущего объема DHT.
12. Математическая поисковая система Uniquation
Дополнительная информация
Электронная почта – rystsov.denis@gmail.com (Рысцов Денис)
Альфа-версия поиска – uniquation.ru
О GaloisWiki – hackday.ru/33.html