Научный журнал

ISSN 1814-2400

ИНФОРМАТИКА И СИСТЕМЫ УПРАВЛЕНИЯ

Григорьев Ю. А., Плутенко А. Д.

МЕТОД ОЦЕНКИ ВРЕМЕНИ ТЕТА-СОЕДИНЕНИЯ ТАБЛИЦ БАЗЫ ДАННЫХ ПО ТЕХНОЛОГИИ MAPREDUCE

Исследованы две стратегии копирования (дублирования) кортежей при выполнении многотабличного тета-соединения по технологии MapReduce: с использованием кривых Гильберта и интервальная стратегия. Определены варианты их преимущественного использования. Получены формулы для оценки времени выполнения тета-соединения, учитывающие процессорную, дисковую и сетевую составляющие. Рассмотрен практический пример, выявлен характер изменения процессорного времени в ходе соединения фрагментов таблиц в узле.

Ключевые слова: оценка времени, тета-соединение, технология MapReduce, кривая Гильберта, интервальная стратегия