Анализ корпоративных данных начинается с чтения, фильтрации и объединения файлов и потоков из многих источников. Механизм обработки данных Spark способен обрабатывать эти разнообразные объемы информации как признанный лидер в этой области, обеспечивая в 100 раз большую скорость, чем например Hadoop. Благодаря поддержке SQL, интуитивно понятному интерфейсу и простому и ясному многоязыковому API вы можете использовать Spark без глубокого изучения новой сложной экосистемы. Эта книга научит вас создавать полноценные и завершенные аналитические приложения. В качестве примера используется полный конвейер обработки данных, поступающих со спутников NASA.
Для чтения этой книги не требуется какой-либо предварительный опыт работы со Spark, Scala или Hadoop.
Переводчик: Снастин А. В.
Analiz korporativnykh dannykh nachinaetsja s chtenija, filtratsii i obedinenija fajlov i potokov iz mnogikh istochnikov. Mekhanizm obrabotki dannykh Spark sposoben obrabatyvat eti raznoobraznye obemy informatsii kak priznannyj lider v etoj oblasti, obespechivaja v 100 raz bolshuju skorost, chem naprimer Hadoop. Blagodarja podderzhke SQL, intuitivno ponjatnomu interfejsu i prostomu i jasnomu mnogojazykovomu API vy mozhete ispolzovat Spark bez glubokogo izuchenija novoj slozhnoj ekosistemy. Eta kniga nauchit vas sozdavat polnotsennye i zavershennye analiticheskie prilozhenija. V kachestve primera ispolzuetsja polnyj konvejer obrabotki dannykh, postupajuschikh so sputnikov NASA.
Dlja chtenija etoj knigi ne trebuetsja kakoj-libo predvaritelnyj opyt raboty so Spark, Scala ili Hadoop.
Perevodchik: Snastin A. V.