Книга «Python Data Science Handbook» - это подробное руководство по самым разным вычислительным и статистическим методам, без которых немыслима любая интенсивная обработка данных, научные исследования и передовые разработки. Читатели, уже имеющие опыт программирования и желающие эффективно использовать Python в сфере Data Science, найдут в этой книге ответы на всевозможные вопросы, например: 1) как мне считать этот формат данных в мой скрипт? 2) Как преобразовать, очистить эти данные и манипулировать ими? 3) Как визуализировать данные такого типа? Как при помощи этих данных разобраться в ситуации, получить ответы на вопросы, построить статистические модели или реализовать машинное обучение?
Вандер Плас Джейк
Джейк Вандер Плас — инженер-программист в Google Research, работающий над инструментами для анализа и работы с большими объемами данных, среди них такие пакеты как Scikit-Learn, SciPy, AstroPy, Altair, JAX и многие другие. Джейк активно участвует в жизни сообщества специалистов по науке о данных, представляя доклады и исследования на различных конференциях в области науки о данных.
Алексей24.02.2020
Прочитал более десятка книг по Python-у и могу точно сказать, что для тех, кто начинает заниматься анализом данных с использованием библиотек этого языка, однозначно лучший выбор. Поставьте себе какую-нить IDE-шку по iPython и вперед. В книге написано, какую.
Может использоваться в качестве справочного руководства. Основное внимание в ней сосредоточено на использовании NumPy, Pandas, Scikit-Learn и некоторых других. Перевод хороший, проблем с пониманием не возникло, хотя создалось впечатление о скомканности материала ближе к концу книги, когда пошла мат.статистика. Но мне это не мешает, ибо эту область я знаю неплохо.
Мне ее рекомендовали как основной учебник при прохождении интервью на аналитика-математика или по модному - Data Science. Она достаточно абстрактна по отношению к какой-либо области исследования и содержит уйму примеров. Хваленый хелп питона в интернете иногда не так помогает, как примеры из книги.
Жаль, что в мягком переплете, ибо очень часто открываю. Пока вроде переплет еще живой. Жаль, что электронная книга продается отдельно.
Но этой книги недостаточно, чтобы изучить другие библиотеки, которые имеют свою специфику применения. В дополнение к ней я бы рекомендовал несколько книг. Во-первых, это фундаментальная книга трех российских авторов про глубокое погружение в мир нейронных сетей (тут правда мало кода, но много теории). Во-вторых, это книга Ф.Шолле по глубокому обучению на Python. А если занимаетесь анализом текстовых данных, то мне пригодились книга по PyTorch и книга по прикладному анализу тестовых данных.
Чтобы войти в сложную тему Deep Learning-а, очень советую начать с забавной книги Эндрю Траска "Грокаем глубокое обучение" – популяризаторы молодцы и переводчики тоже.
Еще раз очень жаль, что все книги имеют мягкий переплет, хотя это, наверное, существенно сказалось бы на цене. Поэтому храните электронные копии книг, ими полезно пользоваться как справочником при активном кодинге.