Обработка больших массивов данных с помощью традиционных СУБД может оказаться трудным делом. Apache Hadoop - это каркас для разработки приложений, предназначенных для выполнения в распределенном кластере, без применения SQL. Такие приложения прекрасно масштабируются и могут обрабатывать гигантские массивы данных.Для чтения книги требуется знание основ языка Java. Некоторое знакомство с математической статистикой поможет разобраться в более сложных примерах.Практические примеры, иллюстрирующие идеи.
Obrabotka bolshikh massivov dannykh s pomoschju traditsionnykh SUBD mozhet okazatsja trudnym delom. Apache Hadoop - eto karkas dlja razrabotki prilozhenij, prednaznachennykh dlja vypolnenija v raspredelennom klastere, bez primenenija SQL. Takie prilozhenija prekrasno masshtabirujutsja i mogut obrabatyvat gigantskie massivy dannykh.Dlja chtenija knigi trebuetsja znanie osnov jazyka Java. Nekotoroe znakomstvo s matematicheskoj statistikoj pomozhet razobratsja v bolee slozhnykh primerakh.Prakticheskie primery, illjustrirujuschie idei.