Cargando…

Zaawansowana analiza danych w PySpark : metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark /

Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje d...

Descripción completa

Detalles Bibliográficos
Clasificación:Libro Electrónico
Autores principales: Tandon, Akash (Autor), Ryza, Sandy (Autor), Laserson, Uri, 1983- (Autor), Owen, Sean (Autor), Wills, Josh (Autor)
Otros Autores: Watrak, Andrzej (Traductor)
Formato: Electrónico eBook
Idioma:Polaco
Inglés
Publicado: Gliwice : Helion, [2023]
Edición:[First edition].
Temas:
Acceso en línea:Texto completo (Requiere registro previo con correo institucional)

MARC

LEADER 00000cam a22000007i 4500
001 OR_on1382402687
003 OCoLC
005 20231017213018.0
006 m o d
007 cr cnu|||unuuu
008 230614s2023 pl a o 000 0 pol d
040 |a ORMDA  |b eng  |e rda  |e pn  |c ORMDA  |d OCLCF 
020 |a 9788383220703  |q (electronic bk.) 
020 |a 8383220707  |q (electronic bk.) 
035 |a (OCoLC)1382402687 
037 |a 9788383220703  |b O'Reilly Media 
041 1 |a pol  |h eng 
050 4 |a QA76.9.D343 
082 0 4 |a 006.3/12  |2 23/eng/20230614 
049 |a UAMI 
100 1 |a Tandon, Akash,  |e author. 
240 1 0 |a Advanced analytics with PySpark.  |l Polish 
245 1 0 |a Zaawansowana analiza danych w PySpark :  |b metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark /  |c Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills ; tłumaczenie Andrzej Watrak. 
250 |a [First edition]. 
264 1 |a Gliwice :  |b Helion,  |c [2023] 
300 |a 1 online resource (192 pages) :  |b illustrations 
336 |a text  |b txt  |2 rdacontent 
337 |a computer  |b c  |2 rdamedia 
338 |a online resource  |b cr  |2 rdacarrier 
520 |a Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych. Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy. 
590 |a O'Reilly  |b O'Reilly Online Learning: Academic/Public Library Edition 
630 0 0 |a SPARK (Electronic resource) 
630 0 7 |a SPARK (Electronic resource)  |2 fast  |0 (OCoLC)fst01400497 
650 0 |a Data mining. 
650 0 |a Big data. 
650 0 |a Python (Computer program language) 
650 7 |a Big data.  |2 fast  |0 (OCoLC)fst01892965 
650 7 |a Data mining.  |2 fast  |0 (OCoLC)fst00887946 
650 7 |a Python (Computer program language)  |2 fast  |0 (OCoLC)fst01084736 
700 1 |a Ryza, Sandy,  |e author. 
700 1 |a Laserson, Uri,  |d 1983-  |e author. 
700 1 |a Owen, Sean,  |e author. 
700 1 |a Wills, Josh,  |e author. 
700 1 |a Watrak, Andrzej,  |e translator. 
856 4 0 |u https://learning.oreilly.com/library/view/~/9788383220703/?ar  |z Texto completo (Requiere registro previo con correo institucional) 
994 |a 92  |b IZTAP