|
|
|
|
LEADER |
00000cam a22000007 4500 |
001 |
OR_on1181907086 |
003 |
OCoLC |
005 |
20231017213018.0 |
006 |
m o d |
007 |
cr |n||||||||| |
008 |
200712s2019 xx o 000 0 und d |
040 |
|
|
|a VT2
|b eng
|c VT2
|d ERF
|d DST
|d OCLCQ
|
019 |
|
|
|a 1300649228
|a 1303340661
|
020 |
|
|
|a 9781098125295
|
020 |
|
|
|a 1098125290
|
029 |
1 |
|
|a AU@
|b 000071521839
|
035 |
|
|
|a (OCoLC)1181907086
|z (OCoLC)1300649228
|z (OCoLC)1303340661
|
082 |
0 |
4 |
|a 005.13/3
|q OCoLC
|2 23/eng/20220511
|
049 |
|
|
|a UAMI
|
100 |
1 |
|
|a Mitchell, Ryan.
|
245 |
1 |
0 |
|a Ekstrakcja danych z językiem Python
|h [electronic resource] /
|c Ryan Mitchell.
|
260 |
|
|
|a [Place of publication not identified]
|b Helion,
|c 2019.
|
300 |
|
|
|a 1 online resource
|
336 |
|
|
|a text
|b txt
|2 rdacontent
|
337 |
|
|
|a computer
|b c
|2 rdamedia
|
338 |
|
|
|a online resource
|b cr
|2 rdacarrier
|
347 |
|
|
|a text file
|
500 |
|
|
|a Title from content provider.
|
520 |
|
|
|a Ekstrakcję danych (ang. web scraping), zwaną też wydobywaniem danych z zasobów internetu, wiele osób postrzega jako wyższy stopień wtajemniczenia: przy niewielkim wysiłku można uzyskać imponujące wyniki i wykorzystać je w różnoraki sposób. Nie dziwi więc, że wokół tej dziedziny narosło mnóstwo mitów. Wątpliwości jest wiele, począwszy od legalności tego rodzaju praktyk, skończywszy na właściwościach różnych narzędzi. W praktyce na ekstrakcję danych składa się cały szereg zróżnicowanych technik i technologii, takich jak analiza danych, analiza składniowa języka naturalnego, a także zabezpieczenie informacji. Aby w pełni wykorzystać ich zalety, konieczne jest zrozumienie sposobu, w jaki funkcjonują. Ta książka jest znakomitym przewodnikiem po technikach pozyskiwania danych z internetu. Przedstawiono tu również zasady gromadzenia, przekształcania i wykorzystywania danych z różnych zasobów. W kontekście ekstrakcji danych omówiono zagadnienia związane z bazami danych, serwerami sieciowymi, protokołem HTTP, językiem HTML, bezpieczeństwem sieciowym, przetwarzaniem obrazów, analizą danych i wieloma innymi kwestiami. Zaprezentowane tu rozwiązania programistyczne zostały napisane w Pythonie. Nie zabrakło też omówienia bibliotek przydatnych w pracy osób tworzących roboty indeksujące. Dzięki tej książce szybko zaczniesz pozyskiwać i w dowolny sposób wykorzystywać posiadane dane. Już dziś te rozwiązania są stosowane w prognozowaniu rynkowym, tłumaczeniu maszynowym, a nawet w diagnostyce medycznej! Najważniejsze zagadnienia: korzystanie z platformy Scrapy do tworzenia robotów metody odczytu, wydobywania i przechowywania pozyskiwanych danych oczyszczanie i normalizacja danych interfejsy API przetwarzanie obrazów na tekst testowanie witryn za pomocą robotów Wyszukuj dane, gromadź je i korzystaj z nich do woli!
|
590 |
|
|
|a O'Reilly
|b O'Reilly Online Learning: Academic/Public Library Edition
|
776 |
0 |
|
|z 1098125290
|
856 |
4 |
0 |
|u https://learning.oreilly.com/library/view/~/9781098125295/?ar
|z Texto completo (Requiere registro previo con correo institucional)
|
936 |
|
|
|a BATCHLOAD
|
994 |
|
|
|a 92
|b IZTAP
|