В книге описаны инструменты и методы обработки неструктурированных текстов. Прочитав ее, вы научитесь пользоваться полнотекстовым поиском, распознавать имена собственные, производить кластеризацию, пометку, извлечение информации и автореферирование. Знакомство с фундаментальными принципами сопровождается изучением реальных применений. Издание предназначено для читателей без подготовки в области математической статистики и обработки естественных языков. Примеры написаны на Java, но сами идеи могут быть реализованы на любом языке программирования.
V knige opisany instrumenty i metody obrabotki nestrukturirovannykh tekstov. Prochitav ee, vy nauchites polzovatsja polnotekstovym poiskom, raspoznavat imena sobstvennye, proizvodit klasterizatsiju, pometku, izvlechenie informatsii i avtoreferirovanie. Znakomstvo s fundamentalnymi printsipami soprovozhdaetsja izucheniem realnykh primenenij. Izdanie prednaznacheno dlja chitatelej bez podgotovki v oblasti matematicheskoj statistiki i obrabotki estestvennykh jazykov. Primery napisany na Java, no sami idei mogut byt realizovany na ljubom jazyke programmirovanija.