Объем обрабатываемых данных во всех областях человеческой деятельности продолжает расти быстрыми темпами. Существуют ли эффективные приемы работы с ним? В этой книге рассказывается об Apache Spark, открытой системе кластерных вычислений, которая позволяет быстро создавать высокопроизводительные программы анализа данных. C помощью Spark вы сможете манипулировать огромными объемами данных посредством простого API на Python, Java и Scala. Написанная разработчиками Spark, эта книга поможет исследователям данных и программистам быстро включиться в работу. Она рассказывает, как организовать параллельное выполнение заданий всего несколькими строчками кода, и охватывает примеры от простых пакетных приложений до программ, осуществляющих обработку потоковых данных и использующих алгоритмы машинного обучения.
Федеральное государственное бюджетное учреждение культуры «Российская государственная библиотека для молодёжи»
Главное здание
107061 Москва, ул. Б. Черкизовская, дом 4, корпус 1 Метро «Преображенская площадь» (выход №5) Телефон для справок: +7 499 670-80-01 E-mail: [email protected]
Филиал библиотеки МИКК «Особняк В.Д. Носова»
107023 Москва, ул. Электрозаводская, 12, стр. 1 Метро «Электрозаводская» Телефоны для справок: +7 499 670-80-01 (доб. 600) E-mail: [email protected]