Инфраструктура Hadoop – популярное решение для таких задач, как распределённое хранение данных и вычисления Map/Reduce на кластере. Хорошая масштабируемость и развитая экосистема подкупают и обеспечивают Hadoop’у прочное место в инфраструктуре различных информационных систем. Но чем больше ответственности возлагается на этот компонент, тем важнее обеспечивать его отказоустойчивость и high availability.
В докладе я расскажу про обеспечение высокой доступности компонентов Hadoop-кластера. Кроме этого, поговорю:
Доклад будет наиболее полезен тем, кто уже использует Hadoop (для углубления своих знаний). Другой части аудитории доклад будет интересен с точки зрения обзора архитектурных решений, применяемых в этом программном комплексе.
Руководитель DataTeam в компании Badoo.
Занимаюсь разработкой инструментов для обработки данных в рамках ETL и процессинга различного рода статистики, инфраструктурой Hadoop.
Опыт web-dev более 10 лет. Для достижения наилучших результатов не гнушаюсь использовать гремучие смеси из языков программирования (JAVA, PHP, Go), баз данных (MySQL, Exasol) и технологий распределённых вычислений (Hadoop, Spark, Hive, Presto).
Компания: «Badoo», Россия