Исследователи Массачусетского технологического института утверждают, что они разработали простой прибор, помогающий аналитикам прогнозировать будущее по временным рядам данных.
Определяемые как коллекция наблюдений, записанных в течение определенного времени, временные ряды данных и их прогнозы имеют решающее значение для анализа акций, медицинской диагностики и даже прогнозирования погоды.
Никто не знает, что ждет нас в будущем. К менее научным подходам к прогнозированию будущего относятся такие люди, как экстрасенсы, медиумы и астрологические предсказатели. Но такие практики и их методы не смогли постоянно давать научно обоснованные результаты.
Напротив, математики и статистики, работающие в области анализа данных, часто используют инструменты прогностического анализа, чтобы предложить достаточно точный взгляд на возможные будущие события. К сожалению, большинство таких систем прогнозирования зависят от сложных алгоритмов и значительных вычислительных мощностей, что делает их в основном недоступными для рядовых аналитиков временных рядов данных.
Исследователи Массачусетского технологического института утверждают, что они изменили это уравнение, разработав упрощенный алгоритм прогнозирования будущего, который может использовать любой исследователь.
«Создание прогнозов на основе данных временных рядов обычно требует нескольких этапов обработки данных и использования сложных алгоритмов машинного обучения, — объясняется в пресс-релизе, анонсирующем новый инструмент прогнозирования будущего, — которые имеют настолько крутую кривую обучения, что не могут быть легко доступны для неспециалистов».
На помощь приходят исследователи Массачусетского технологического института и их новый инструмент — tspDB (база данных прогнозирования временных рядов). В отличие от других сложных инструментов анализа данных и прогнозирования, tspDB «делает все сложное моделирование за кулисами, так что неспециалист может легко создать прогноз всего за несколько секунд».
Удивительно, но команда, стоящая за новой системой, утверждает, что tspDB точнее и эффективнее почти всех современных методов глубокого обучения в двух ключевых областях: прогнозирование будущих значений и заполнение недостающих точек данных. Исследователь программы Абдулла Аломар говорит, что эффективность достигается благодаря тому, что в tspDB используется «новый алгоритм прогнозирования временных рядов», который уникально эффективен при анализе многомерных временных рядов данных. В качестве примера можно привести анализ погоды, где такие показатели, как облачность, температура и точка росы, зависят от прошлых значений.
В опубликованных результатах команда MIT объясняет, как они тестировали систему tspDB против конкурирующих алгоритмов, включая передовые методы глубокого обучения, анализируя реальные наборы данных временных рядов. Они включали данные из электрической сети, схемы движения транспорта и финансовых рынков. Как и было «предсказано», новый алгоритм показал отличные результаты, превзойдя в прогнозировании будущих значений все, кроме одной из других протестированных систем.
«Одна из причин, почему я считаю, что это работает так хорошо, заключается в том, что модель захватывает много динамики временного ряда, но в конце концов, это все еще простая модель», — сказал Аломар. «Когда вы работаете с чем-то простым, как эта модель, вместо нейронной сети, которая может легко подогнать данные, вы можете добиться лучших результатов».
В своей нынешней форме инструмент прогнозирования MIT может быть установлен поверх существующей базы данных, что позволяет исследователям выполнять запрос на прогнозирование «всего несколькими нажатиями клавиш примерно за 0,9 миллисекунды, по сравнению с 0,5 миллисекунды для стандартного поискового запроса». Наряду с беспрецедентной скоростью и точностью, исследователи отмечают, что их инструмент прогнозирования становится еще более точным, когда в систему добавляется больше данных.
«Даже когда данные временных рядов становятся все более сложными, этот алгоритм может эффективно улавливать любую структуру временных рядов», — говорит старший автор Деваврат Шах. «Такое ощущение, что мы нашли правильную линзу, чтобы взглянуть на модельную сложность данных временных рядов».
Команда MIT отмечает эффективность и точность системы, но они говорят, что их усилиями движет простота использования системы для рядовых исследователей.
«Наш интерес на самом высоком уровне заключается в том, чтобы добиться успеха tspDB в виде широко используемой системы с открытым исходным кодом», — добавил Аломар. «Данные временных рядов очень важны, и это прекрасная концепция создания функций прогнозирования непосредственно в базе данных. Такого еще не было, и поэтому мы хотим убедиться, что мир использует это».
Оригинал earth-chronicles.ru