МЕТОД ОЦЕНКИ ВРЕМЕНИ ТЕТА-СОЕДИНЕНИЯ ТАБЛИЦ БАЗЫ ДАННЫХ ПО ТЕХНОЛОГИИ MAPREDUCE
Исследованы две стратегии копирования (дублирования) кортежей при выполнении многотабличного тета-соединения по технологии MapReduce: с использованием кривых Гильберта и интервальная стратегия. Определены варианты их преимущественного использования. Получены формулы для оценки времени выполнения тета-соединения, учитывающие процессорную, дисковую и сетевую составляющие. Рассмотрен практический пример, выявлен характер изменения процессорного времени в ходе соединения фрагментов таблиц в узле.
Ключевые слова: оценка времени, тета-соединение, технология MapReduce, кривая Гильберта, интервальная стратегия