-40%

Pobierz fragment (epub)
Pobierz fragment (mobi)

PROMOCJA ABONAMENT

Data Science i uczenie maszynowe

2 oceny

Autor:

Marcin Szeliga

Wydawca:

Wydawnictwo Naukowe PWN

Format:

epub, mobi, ibuk

DODAJ DO ABONAMENTU

TA KSIĄŻKA JEST W ABONAMENCIE

Już od 24,90 zł miesięcznie za 5 ebooków!

WYBIERZ SWÓJ ABONAMENT

Książka przedstawia uczenie maszynowe w ujęciu praktycznym. Przeprowadzając opisane w niej eksperymenty data science poznamy zastosowanie reguł statystycznych i algorytmów uczenia maszynowego do rozwiązywania konkretnych problemów. Takie podejście oznacza, że studenci informatyki oraz specjaliści — analitycy, informatycy i bazodanowcy — zdobędą nie tylko teoretyczną wiedzę, ale również umiejętność jej praktycznego wykorzystania w codziennej pracy.

Rok wydania	2017
Liczba stron	400
Kategoria	Zastosowania informatyki
Wydawca	Wydawnictwo Naukowe PWN
ISBN-13	978-83-01-19324-9
Numer wydania	1
Język publikacji	polski
Informacja o sprzedawcy	ePWN sp. z o.o.

INNE EBOOKI AUTORA

-40%

Praktyczne uczenie maszynowe

Marcin Szeliga

56,40 zł

94,00 zł

epub, mobi, ibuk

-17%

Prosta spółka akcyjna. Komentarz

Rafał Adamus

112,05 zł

135,00 zł

pdf

POLECAMY

Funkcjonalność informatycznych systemów...

Arkadiusz Januszewski

6,92 zł

ibuk

Społeczeństwo informacyjne

Red. Joanna Papińska-Kacperek

6,92 zł

ibuk

-40%

Business Intelligence

Jerzy Surma

32,40 zł

54,00 zł

epub, mobi, ibuk

Systemy wspomagania decyzji

Anna M. Kwiatkowska

6,92 zł

ibuk

Funkcjonalność informatycznych systemów...

Arkadiusz Januszewski

6,92 zł

ibuk

Technologie informatyczne Firmy 2.0

Red. Krzysztof Kania

6,92 zł

ibuk

Multimedia w kształceniu

Józef Bednarek

6,92 zł

ibuk

-40%

Modelowanie systemów informatycznych w...

Andrzej Stasiak

23,40 zł

39,00 zł

epub, mobi, ibuk

Kształcenie na odległość

Józef Bednarek

6,92 zł

ibuk

Informatyka ekonomiczna 18. Systemy...

Red. Iwona Chomiak-Orsa

ibuk

Podstawy statystyki w Excelu

Wiesława Regel

6,92 zł

ibuk

Optymalizacja decyzji w arkuszu kalkulacyjnym

Cezary Dominiak

5,50 zł

ibuk

Projektowanie portali korporacyjnych dla...

Ewa Ziemba

6,92 zł

ibuk

-40%

Cyfrowa przestrzeń biznesowa

Matt Mayewski

17,94 zł

29,90 zł

epub, mobi, ibuk

Ciekawe propozycje

-20%

Data

Krzysztof Lip

Ridero IT Solution

1,14 zł

1,42 zł

epub, mobi

Bohaterem powieści jest Jarosław Góral, dla którego nic nie ma większego znaczenia od pieniędzy. Gdy zostaje ostrzeżony krótką notatką o dziwnej treści, zupełnie to przewraca jego życie do góry nogami. Zaczynają pojawiać się osoby,... więcej >

Data analysis in the maritime domain

Milena Stróżyna

Uniwersytet Ekonomiczny w Poznaniu

ibuk

The book delivers a rich set of foundations, state-of-the-art knowledge, new approaches and methods for the purpose of anomalies detection, maritime traffic analysis as well as risk and reliability assessment. It addresses relevant research problems... więcej >

-20%

Data. Część II

Krzysztof Lip

Ridero IT Solution

3,23 zł

4,04 zł

epub, mobi

Jarosław dostaje z pozoru bardzo proste zadanie — znaleźć przynajmniej sto osób, które się za niego szczerze pomodlą. Jednak dla człowieka, który nie ma żadnych znajomych, od rodziny dawno się odwrócił, a wszyscy ludzie, którzy go... więcej >

-10%

Data Driven Decisions

Red. Michał Jan Lutostański

Wydawnictwo Naukowe PWN

62,10 zł

69,00 zł

epub, mobi, ibuk

Ostatnia dekada wywróciła świat biznesu i marketingu do góry nogami. Technologie, kryzysy, zmiany w polityce i stylu życia sprawiły, że przed decydentami pojawiła się niespotykana wcześniej masa znaków zapytania. Skończyła się, dająca... więcej >

Data science: najseksowniejszy zawód XXI...

Remigiusz Żulicki

Wydawnictwo Uniwersytetu Łódzkiego

ibuk

Czy sztuczna inteligencja pozbawia nas pracy? Algorytmy przejmują władzę nad światem? Czy big data sprawia, że jesteśmy bezustannie inwigilowani, a ogromna ilość danych zastępuje ekspertów i naukowców? Cokolwiek sądzimy na te tematy,... więcej >

-20%

Data Śmierci Jezusa

Czesław Czyż

Ridero IT Solution

4,85 zł

6,06 zł

epub, mobi

Autor prowadzi nas w poszukiwaniu roku śmierci Jezusa, począwszy od panowania władców tamtego czasu, takich jak Herod Wielki, Cezar August, Cezar Tyberiusz, Prokurator Poncjusz Piłat. Najważniejszym elementem układanki jest kalendarz... więcej >

-20%

Bezpieczeństwo państwa w warunkach...

Justyna Kurek

Akademia Sztuki Wojennej

50,80 zł

63,50 zł

epub, mobi, pdf, ibuk

Monografia składa się z dwóch części, z których pierwsza ma przede wszystkim charakter systematyzujący i sygnalizujący problemy, które rozwinięte zostaną w drugiej części - w rozdziałach od trzeciego do szóstego. Autorka odnosi się... więcej >

-24%

Big Data

Dawn E. Holmes

Wydawnictwo Uniwersytetu Łódzkiego

21,20 zł

27,90 zł

epub, mobi, pdf, ibuk

> KRÓTKIE WPROWADZENIE- książki, które zmieniają sposób myślenia!Big data pokazuje, jak postęp technologiczny spowodowany rozwojem Internetu i cyfrowego wszechświata wpłynął na radykalną transformację nauki o danych. Czym są duże... więcej >

-17%

Big Data and the Abuse of a Dominant...

Iga Małobęcka-Szwast

C.H.Beck

181,77 zł

219,00 zł

pdf

Data has become a crucial input of production for many services offered by online platforms and precondition of their competitive success.Since providers of online platforms have become aware of the advantages derived from possessing and processing... więcej >

Spis treści

Wstęp XVII
O czym jest ta książka? XVII
Data science XVIII
Uczenie maszynowe XX
Dla kogo jest ta książka? XXI
Narzędzia XXII
Usługa Azure ML XXIII
Język R XXIV
Microsoft R Open XXV
Przykładowe dane XXVI
Konwencje i oznaczenia XXVI
1. Uczenie maszynowe jako element eksperymentów data science 1
1.1. Eksploracja danych jako technika wspomagania decyzji 2
1.2. Modelowanie 4
1.3. Wiedza i proces uczenia 6
1.4. Hipotezy 9
1.5. Założenia eksperymentu data science 10
1.6. Dwa typy analiz 12
1.7. Data science jako metoda naukowa 12
1.8. Przykładowy eksperyment – optymalizacja kampanii marketingowej 14
1.8.1. Zrozumienie problemu i określenie celów eksperymentu 15
1.8.2. Zrozumienie danych 16
1.8.3. Wstępne przetwarzanie danych 17
1.8.4. Modelowanie 18
1.8.5. Ocena 18
1.8.6. Wdrożenie 20
Podsumowanie 23
2. Ocena przydatności danych 25
2.1. Dane źródłowe 26
2.2. Zmienne 27
2.2.1. Rozkład częstości zmiennych 30
2.2.2. Graficzna prezentacja danych 42
2.2.3. Korelacje (związki między zmiennymi) 44
2.3. Reprezentatywność danych 50
2.4. Duplikaty 54
2.5. Szeregi czasowe 56
Podsumowanie 63
3. Wstępne przetwarzanie danych 65
3.1. Uzupełnianie brakujących danych 66
3.2. Poprawianie błędnych danych 71
3.3. Zmienne numeryczne 71
3.3.1. Instalowanie dodatkowych bibliotek R w Azure ML 72
3.3.2. Wartości nietypowe (odstające) 73
3.3.3. Normalizacja 75
3.3.4. Dyskretyzacja 77
3.4. Zmienne kategoryczne 78
3.4.1. Problem jakości danych tekstowych 79
3.4.2. Uogólnienie (generalizacja) 80
3.4.3. Numerowanie stanów 81
3.4.4. Zmienne porządkowe 83
3.5. Szeregi czasowe 83
3.6. Wyrażenia języka naturalnego 89
3.7. Redukcja wymiarów 94
3.7.1. Usuwanie zmiennych na podstawie ich zdolności predykcyjnych 95
3.7.2. Analiza głównych składowych (PCA) 97
Podsumowanie 99
4. Wzbogacanie danych 101
4.1. Równoważenie danych 102
4.1.1. Usunięcie części przykładów większościowych 103
4.1.2. Nadpróbkowanie 104
4.2. Zmienne wyliczeniowe 106
4.3. Zastąpienie zmiennych wspólnym rozkładem prawdopodobieństwa 108
4.4. Wydzielenie danych testowych 111
4.4.1. Szeregi czasowe 115
4.4.2. Modele rekomendujące 116
4.4.3. Modele wykrywania oszustw 116
4.5. Wzorzec eksperymentu data science 116
Podsumowanie 117
5. Klasyfikacja 119
5.1. Klasyfikacja poprzez indukcję drzew decyzyjnych 121
5.1.1. Drzewa decyzyjne – definicja 121
5.1.2. Pojedyncze drzewa decyzyjne 124
5.1.3. Kombinacje drzew decyzyjnych 126
5.2. Klasyfikacja z użyciem maszyny wektorów nośnych 141
5.2.1. Przetwarzanie języka naturalnego przy użyciu maszyny wektorów nośnych 143
5.2.2. Modele maszyny wektorów nośnych i lokalnie głębokiej maszyny wektorów nośnych 152
5.3. Klasyfikacja probabilistyczna 153
5.3.1. Sieć Bayesa 157
5.3.2. Maszyna punktów Bayesa 159
5.4. Inne klasyfikatory dostępne w Studiu Azure ML 161
5.4.1. Inne klasyfikatory – omówienie 161
5.4.2. Modele eksploracji danych w języku R 163
5.5. Klasyfikatory binarne a klasyfikacja wieloklasowa 164
5.6. Wykrywanie oszustw jako przykład klasyfikacji binarnej 167
5.6.1. Oznaczenie obserwacji 167
5.6.2. Zrównoważenie danych i wydzielenie danych testowych 169
5.6.3. Wzbogacenie danych 169
Podsumowanie 172
6. Regresja 173
6.1. Model regresji wielorakiej 179
6.1.1 Wieloraka regresja liniowa 181
6.1.2. Estymacja bayesowska modelu regresji liniowej 183
6.2. Zmienne kategoryczne w modelach regresji 185
6.2.1. Regresja Poissona 186
6.2.2. Regresja porządkowa 188
6.3. Regresja kwantylowa 188
6.4. Regresja poprzez indukcję drzew decyzyjnych 191
6.5. Sztuczne sieci neuronowe 193
6.5.1. Perceptron 198
6.5.2. Sieci neuronowe a regresja 200
6.5.3. Metody minimalizacji błędu 202
6.5.4. Wsteczna propagacja błędów 203
6.5.5. Regresja z użyciem sieci neuronowej 205
6.5.6. Głębokie sieci neuronowe 209
Podsumowanie 218
7. Grupowanie (analiza skupień) 221
7.1. Na czym polega grupowanie 221
7.2. Algorytmy grupowania 225
7.2.1. Grupowanie hierarchiczne 226
7.2.2. Grupowanie iteracyjno-optymalizacyjne 231
7.3. Grupowanie w celu znajdowania podobnych obiektów 236
7.4. Grupowanie w celu kompresji 239
7.5. Wykrywanie anomalii 240
Podsumowanie 244
8. Rekomendowanie 245
8.1. Systemy rekomendujące 245
8.2. Odkrywanie asocjacji 250
8.3. Model Matchbox Recommender 258
8.3.1. Rekomendowanie przez filtrowanie kolektywne 258
8.3.2. Rekomendowanie przez filtrowanie cech przedmiotów i użytkowników (hybrydowe) 267
Podsumowanie 269
9. Prognozowanie 271
9.1. Szeregi czasowe 272
9.2. Naiwne metody prognozowania 274
9.3. Modele średniej ważonej 274
9.4. Modele ARIMA 283
9.5. Modele nieliniowe 288
9.6. Prognozowanie w Studiu Azure ML 290
Podsumowanie 292
10. Ocena i poprawa jakości modeli 293
10.1. Reguła powrotu do średniej 293
10.2. Kryteria oceny modeli eksploracji danych 295
10.2.1. Łatwość interpretacji 296
10.2.2. Trafność 296
10.2.3. Wiarygodność 297
10.2.4. Wydajność i skalowalność 297
10.2.5. Przydatność 297
10.3. Ocena jakości modeli klasyfikacyjnych 298
10.3.1. Moduł Evaluate Model 298
10.3.2. Macierz pomyłek 299
10.3.3. Krzywa ROC 302
10.3.4. Wykres precyzja w funkcji czułości i wykres zysku 304
10.3.5. Trafność klasyfikacji 305
10.3.6. Klasyfikatory wieloklasowe 307
10.4. Ocena jakości modeli regresyjnych 308
10.4.1. Miary oceny modeli 308
10.4.2. Walidacja krzyżowa 310
10.5. Ocena jakości modeli grupujących 313
10.6. Ocena jakości modeli rekomendujących 315
10.7. Ocena jakości modeli prognozujących 317
10.8. Porównanie jakości modeli 322
10.9. Poprawa jakości modeli 326
10.9.1. Automatyczna poprawa jakości modeli uczenia nadzorowanego 326
10.9.2. Znalezienie optymalnej liczby klastrów 330
10.10. Cykl życia eksperymentu data science 333
Podsumowanie 334
11. Publikacja modeli eksploracji danych jako usług WWW 339
11.1. Wzorcowy eksperyment data science 340
11.2. Predykcyjne usługi WWW 345
11.2.1. Zapytania predykcyjne ad-hoc 348
11.2.2. Wsadowe zapytania predykcyjne 349
Podsumowanie 352
Bibliografia 353
Dodatek A 361
Dodatek B 367

RozwińZwiń