Книга позволяет изучить науку о данных (Data Science) и применить полученные знания на практике. Она написана так, что способствует погружению в Data Science аналитика, фактически не обладающего глубокими знаниями в этой прикладной дисциплине.В объемах, достаточных для начала работы в области Data Science, книга содержит интенсивный курс языка Python, элементы линейной алгебры, математической статистики, теории вероятностей, методов сбора, очистки, нормализации и обработки данных. Даны основы машинного обучения. Описаны различные математические модели и их реализация по методу k ближайших соседей, наивной байесовской классификации, линейной и логистической регрессии, а также модели на основе деревьев принятия решений, нейронных сетей и кластеризации. Рассказано о работе с рекомендательными системами, описаны приемы обработки естественного языка, методы анализа социальных сетей, основы баз данных, SQL и MapReduce.
Kniga pozvoljaet izuchit nauku o dannykh (Data Science) i primenit poluchennye znanija na praktike. Ona napisana tak, chto sposobstvuet pogruzheniju v Data Science analitika, fakticheski ne obladajuschego glubokimi znanijami v etoj prikladnoj distsipline.V obemakh, dostatochnykh dlja nachala raboty v oblasti Data Science, kniga soderzhit intensivnyj kurs jazyka Python, elementy linejnoj algebry, matematicheskoj statistiki, teorii verojatnostej, metodov sbora, ochistki, normalizatsii i obrabotki dannykh. Dany osnovy mashinnogo obuchenija. Opisany razlichnye matematicheskie modeli i ikh realizatsija po metodu k blizhajshikh sosedej, naivnoj bajesovskoj klassifikatsii, linejnoj i logisticheskoj regressii, a takzhe modeli na osnove derevev prinjatija reshenij, nejronnykh setej i klasterizatsii. Rasskazano o rabote s rekomendatelnymi sistemami, opisany priemy obrabotki estestvennogo jazyka, metody analiza sotsialnykh setej, osnovy baz dannykh, SQL i MapReduce.