Spark Zaawansowana analiza danych - Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills

Spark Zaawansowana analiza danych

4.00 Oceń książkę!

Autor: Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills

Wydawnictwo: Helion
ISBN: 9788328314610
EAN: 9788328314610
Format: 169 x 238 x 11
Oprawa: Miękka
Stron: 240
Data wydania: 2015
Gdzie kupić tanią książkę?
książka
40.97
książka
49.00zł
Książka w Twoim domu w ciągu 48h
Analiza ogromnych zbiorów danych nie musi być wolna!
Apache Spark to darmowy, zaawansowany szkielet i silnik pozwalający na szybkie przetwarzanie oraz analizę ogromnych zbiorów danych. Prace nad tym projektem rozpoczęły się w 2009 roku, a już rok później Spark został udostępniony użytkownikom. Jeżeli potrzebujesz najwyższej wydajności w przetwarzaniu informacji, jeżeli chcesz uzyskiwać odpowiedź na trudne pytania niemalże w czasie rzeczywistym, Spark może być odpowiedzią na Twoje oczekiwania.

Sięgnij po tę książkę i przekonaj się, czy tak jest w rzeczywistości. Autor porusza tu zaawansowane kwestie związane z analizą statystyczną danych, wykrywaniem anomalii oraz analizą obrazów. Jednak zanim przejdziesz do tych tematów, zapoznasz się z podstawami — wprowadzeniem do analizy danych za pomocą języka Scala oraz Apache Spark. Nauczysz się też przeprowadzać analizę semantyczną i zobaczysz, jak w praktyce przeprowadzić analizę sieci współwystępowań za pomocą biblioteki GraphX. Na koniec dowiesz się, jak przetwarzać dane geoprzestrzenne i genomiczne, a także oszacujesz ryzyko metodą symulacji Monte Carlo. Książka ta pozwoli Ci na wykorzystanie potencjału Apache Spark i zaprzęgnięcie go do najtrudniejszych zadań!

Przykłady prezetnowane w książce obejmują:

  Rekomendowanie muzyki i dane Audioscrobbler
  Prognozowanie zalesienia za pomocą drzewa decyzyjnego
  Wykrywanie anomalii w ruchu sieciowym metodą grupowania według k-średnich
  Wikipedia i ukryta analiza semantyczna
  Analiza sieci współwystępowań za pomocą biblioteki GraphX
  Geoprzestrzenna i temporalna analiza tras nowojorskich taksówek
  Szacowanie ryzyka finansowego metodą symulacji Monte Carlo
  Analiza danych genomicznych i projekt BDG
  Analiza danych neuroobrazowych za pomocą pakietów PySpark i Thunder

Poznaj potencjał i wydajność Apache Spark!

Książka "Spark Zaawansowana analiza danych"
Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills