Michał Gamrot 🇵🇱
Michał Gamrot 🇵🇱

@gamrot

2 تغريدة 4 قراءة Aug 18, 2024
Minęło właśnie 10 lat odkąd zajmuję się zawodowo data science (jak ten czas szybko leci). Z tej okazji krótki wpis pokazujący 4 najlepsze książki, które polecam od lat każdemu kto che się zainteresować tym tematem.
Data Science for Business (Provost, Fawcett) — najlepsze wprowadzenie do analityki danych, w szczególności jeśli nie macie matematycznego backgroundu. Dobrze tłumaczy np. problemy klasyfikacyjne na przykładach z życia oraz to jaki jest uzysk biznesowy z takich modeli. Polecam w szczególności jeśli od matematycznych podstaw uczenia maszynowego interesuje was bardziej rozwiązywanie problemów biznesowych.
Applied Predictive Analytics (Kuhn, Johnson) — książka dla ludzi którzy chcą zacząć zajmować się analityką predykcyjną w praktyce. Napisana przez Maxa Kuhna, czyli twórcę (historycznego już) pakietu caret w R (cała część modelowania mojego doktoratu jest w nim napisana). Dobrze wytłumaczona walidacja krzyżowa i inne metody przeciwdziałania przeuczeniu modeli. Zawiera fragmenty kodu, ale traktujcie je jako ciekawostkę historyczną (caret został zastąpiony przez tidymodels).
The Elements of Statistical Learning (Hastie, Tibshirani, Friedman) — gdy już poznacie podstawy modelowania, czas dobrze poznać teorię. Ta książka to absolutny TOP jeśli chodzi o matematyczne podstawy data science. Polecam w szczególności rozdziały o regularyzacji oraz metodach oceny modeli predykcyjnych.
Weapons of Math Destruction (O’Neil) — jak już nauczycie się robić te wszystkie modele predykcyjne (chociaż wtedy może być już za późno) to warto zastanowić się jakie konsekwencje będzie miało ich stosowanie. Wśród data scientistów jest za dużo geeków dla których jakość predykcji jest wszystkim i nie patrzą na wpływ algorytmów na ludzi. Cathy O’Neil pokazuje pułapki takiego myślenia, w szczególności w kontekście doboru próby do modelowania.
To tyle ode mnie. A wy co byście dodali do tej listy?
A co @jamesbond6 na to? ☺️

جاري تحميل الاقتراحات...