Затронуты расширенные темы глубокого обучения: оптимизационные алгоритмы, настройка гиперпараметров, отсев и анализ ошибок, стратегии решения типичных задач во время тренировки глубоких нейронных сетей. Описаны простые активационные функции с единственным нейроном (ReLu, сигмоида и Swish), линейная и логистическая регрессии, библиотека TensorFlow, выбор стоимостной функции, а также более сложные нейросетевые архитектуры с многочисленными слоями и нейронами. Показана отладка и оптимизация расширенных методов отсева и регуляризации, настройка проектов машинного обучения, ориентированных на глубокое обучение с использованием сложных наборов данных. Приведены результаты анализа ошибок нейронной сети с примерами решения проблем, возникающих из-за дисперсии, смещения, переподгонки или разрозненных наборов данных. По каждому техническому решению даны примеры решения практических задач.
Zatronuty rasshirennye temy glubokogo obuchenija: optimizatsionnye algoritmy, nastrojka giperparametrov, otsev i analiz oshibok, strategii reshenija tipichnykh zadach vo vremja trenirovki glubokikh nejronnykh setej. Opisany prostye aktivatsionnye funktsii s edinstvennym nejronom (ReLu, sigmoida i Swish), linejnaja i logisticheskaja regressii, biblioteka TensorFlow, vybor stoimostnoj funktsii, a takzhe bolee slozhnye nejrosetevye arkhitektury s mnogochislennymi slojami i nejronami. Pokazana otladka i optimizatsija rasshirennykh metodov otseva i reguljarizatsii, nastrojka proektov mashinnogo obuchenija, orientirovannykh na glubokoe obuchenie s ispolzovaniem slozhnykh naborov dannykh. Privedeny rezultaty analiza oshibok nejronnoj seti s primerami reshenija problem, voznikajuschikh iz-za dispersii, smeschenija, perepodgonki ili razroznennykh naborov dannykh. Po kazhdomu tekhnicheskomu resheniju dany primery reshenija prakticheskikh zadach.