X

  Wstęp XVII
    O czym jest ta książka? XVII
    Data science XVIII
    Uczenie maszynowe XX
    Dla kogo jest ta książka? XXI
    Narzędzia XXII
    Usługa Azure ML XXIII
    Język R XXIV
    Microsoft R Open XXV
    Przykładowe dane XXVI
    Konwencje i oznaczenia XXVI
  1. Uczenie maszynowe jako element eksperymentów data science 1
    1.1. Eksploracja danych jako technika wspomagania decyzji 2
    1.2. Modelowanie 4
    1.3. Wiedza i proces uczenia 6
    1.4. Hipotezy 9
    1.5. Założenia eksperymentu data science 10
    1.6. Dwa typy analiz 12
    1.7. Data science jako metoda naukowa 12
    1.8. Przykładowy eksperyment – optymalizacja kampanii marketingowej 14
      1.8.1. Zrozumienie problemu i określenie celów eksperymentu 15
      1.8.2. Zrozumienie danych 16
      1.8.3. Wstępne przetwarzanie danych 17
      1.8.4. Modelowanie 18
      1.8.5. Ocena 18
      1.8.6. Wdrożenie 20
    Podsumowanie 23
  2. Ocena przydatności danych 25
    2.1. Dane źródłowe 26
    2.2. Zmienne 27
      2.2.1. Rozkład częstości zmiennych 30
      2.2.2. Graficzna prezentacja danych 42
      2.2.3. Korelacje (związki między zmiennymi) 44
    2.3. Reprezentatywność danych 50
    2.4. Duplikaty 54
    2.5. Szeregi czasowe 56
    Podsumowanie 63
  3. Wstępne przetwarzanie danych 65
    3.1. Uzupełnianie brakujących danych 66
    3.2. Poprawianie błędnych danych 71
    3.3. Zmienne numeryczne 71
      3.3.1. Instalowanie dodatkowych bibliotek R w Azure ML 72
      3.3.2. Wartości nietypowe (odstające) 73
      3.3.3. Normalizacja 75
      3.3.4. Dyskretyzacja 77
    3.4. Zmienne kategoryczne 78
      3.4.1. Problem jakości danych tekstowych 79
      3.4.2. Uogólnienie (generalizacja) 80
      3.4.3. Numerowanie stanów 81
      3.4.4. Zmienne porządkowe 83
    3.5. Szeregi czasowe 83
    3.6. Wyrażenia języka naturalnego 89
    3.7. Redukcja wymiarów 94
      3.7.1. Usuwanie zmiennych na podstawie ich zdolności predykcyjnych 95
      3.7.2. Analiza głównych składowych (PCA) 97
    Podsumowanie 99
  4. Wzbogacanie danych 101
    4.1. Równoważenie danych 102
      4.1.1. Usunięcie części przykładów większościowych 103
      4.1.2. Nadpróbkowanie 104
    4.2. Zmienne wyliczeniowe 106
    4.3. Zastąpienie zmiennych wspólnym rozkładem prawdopodobieństwa 108
    4.4. Wydzielenie danych testowych 111
      4.4.1. Szeregi czasowe 115
      4.4.2. Modele rekomendujące 116
      4.4.3. Modele wykrywania oszustw 116
    4.5. Wzorzec eksperymentu data science 116
    Podsumowanie 117
  5. Klasyfikacja 119
    5.1. Klasyfikacja poprzez indukcję drzew decyzyjnych 121
      5.1.1. Drzewa decyzyjne – definicja 121
      5.1.2. Pojedyncze drzewa decyzyjne 124
      5.1.3. Kombinacje drzew decyzyjnych 126
    5.2. Klasyfikacja z użyciem maszyny wektorów nośnych 141
      5.2.1. Przetwarzanie języka naturalnego przy użyciu maszyny wektorów nośnych 143
      5.2.2. Modele maszyny wektorów nośnych i lokalnie głębokiej maszyny wektorów nośnych 152
    5.3. Klasyfikacja probabilistyczna 153
      5.3.1. Sieć Bayesa 157
      5.3.2. Maszyna punktów Bayesa 159
    5.4. Inne klasyfikatory dostępne w Studiu Azure ML 161
      5.4.1. Inne klasyfikatory – omówienie 161
      5.4.2. Modele eksploracji danych w języku R 163
    5.5. Klasyfikatory binarne a klasyfikacja wieloklasowa 164
    5.6. Wykrywanie oszustw jako przykład klasyfikacji binarnej 167
      5.6.1. Oznaczenie obserwacji 167
      5.6.2. Zrównoważenie danych i wydzielenie danych testowych 169
      5.6.3. Wzbogacenie danych 169
    Podsumowanie 172
  6. Regresja 173
    6.1. Model regresji wielorakiej 179
      6.1.1 Wieloraka regresja liniowa 181
      6.1.2. Estymacja bayesowska modelu regresji liniowej 183
    6.2. Zmienne kategoryczne w modelach regresji 185
      6.2.1. Regresja Poissona 186
      6.2.2. Regresja porządkowa 188
    6.3. Regresja kwantylowa 188
    6.4. Regresja poprzez indukcję drzew decyzyjnych 191
    6.5. Sztuczne sieci neuronowe 193
      6.5.1. Perceptron 198
      6.5.2. Sieci neuronowe a regresja 200
      6.5.3. Metody minimalizacji błędu 202
      6.5.4. Wsteczna propagacja błędów 203
      6.5.5. Regresja z użyciem sieci neuronowej 205
      6.5.6. Głębokie sieci neuronowe 209
    Podsumowanie 218
  7. Grupowanie (analiza skupień) 221
    7.1. Na czym polega grupowanie 221
    7.2. Algorytmy grupowania 225
      7.2.1. Grupowanie hierarchiczne 226
      7.2.2. Grupowanie iteracyjno-optymalizacyjne 231
    7.3. Grupowanie w celu znajdowania podobnych obiektów 236
    7.4. Grupowanie w celu kompresji 239
    7.5. Wykrywanie anomalii 240
    Podsumowanie 244
  8. Rekomendowanie 245
    8.1. Systemy rekomendujące 245
    8.2. Odkrywanie asocjacji 250
    8.3. Model Matchbox Recommender 258
      8.3.1. Rekomendowanie przez filtrowanie kolektywne 258
      8.3.2. Rekomendowanie przez filtrowanie cech przedmiotów i użytkowników (hybrydowe) 267
    Podsumowanie 269
  9. Prognozowanie 271
    9.1. Szeregi czasowe 272
    9.2. Naiwne metody prognozowania 274
    9.3. Modele średniej ważonej 274
    9.4. Modele ARIMA 283
    9.5. Modele nieliniowe 288
    9.6. Prognozowanie w Studiu Azure ML 290
    Podsumowanie 292
  10. Ocena i poprawa jakości modeli 293
    10.1. Reguła powrotu do średniej 293
    10.2. Kryteria oceny modeli eksploracji danych 295
      10.2.1. Łatwość interpretacji 296
      10.2.2. Trafność 296
      10.2.3. Wiarygodność 297
      10.2.4. Wydajność i skalowalność 297
      10.2.5. Przydatność 297
    10.3. Ocena jakości modeli klasyfikacyjnych 298
      10.3.1. Moduł Evaluate Model 298
      10.3.2. Macierz pomyłek 299
      10.3.3. Krzywa ROC 302
      10.3.4. Wykres precyzja w funkcji czułości i wykres zysku 304
      10.3.5. Trafność klasyfikacji 305
      10.3.6. Klasyfikatory wieloklasowe 307
    10.4. Ocena jakości modeli regresyjnych 308
      10.4.1. Miary oceny modeli 308
      10.4.2. Walidacja krzyżowa 310
    10.5. Ocena jakości modeli grupujących 313
    10.6. Ocena jakości modeli rekomendujących 315
    10.7. Ocena jakości modeli prognozujących 317
    10.8. Porównanie jakości modeli 322
    10.9. Poprawa jakości modeli 326
      10.9.1. Automatyczna poprawa jakości modeli uczenia nadzorowanego 326
      10.9.2. Znalezienie optymalnej liczby klastrów 330
      10.10. Cykl życia eksperymentu data science 333
    Podsumowanie 334
  11. Publikacja modeli eksploracji danych jako usług WWW 339
    11.1. Wzorcowy eksperyment data science 340
    11.2. Predykcyjne usługi WWW 345
      11.2.1. Zapytania predykcyjne ad-hoc 348
      11.2.2. Wsadowe zapytania predykcyjne 349
  Podsumowanie 352
  Bibliografia 353
  Dodatek A 361
  Dodatek B 367
Data Science i uczenie maszynowe
- 30%

SZCZEGÓŁY WYDANIA

Spis treści

Liczba stron  

400

Kategoria

Zastosowania informatyki

ISBN-13

978-83-01-19324-9

Numer wydania

1

Język publikacji

polski

Rozmiary plików do pobrania

mobi - 16,31 MB
epub - 6,82 MB

Akceptowalne sposoby płatności

Karta kredytowa, przelew elektroniczny, płatny SMS

Informacja o sprzedawcy

Ravelo Sp. z o.o.

0.0 / 5 (0 głosów)
bookPrzeczytaj bezpłatny fragment slide
Wypożyczenie

Dostęp online przez aplikację myIBUK. Formaty plików: ibuk

X Format IBUK - ebook dostępny do wypożyczenia

- format książki elektronicznej
- bez instalowania oprogramowania, wystarczy przeglądarka internetowa oraz dostęp do Internetu,
- książka dostępna na Twojej półce w koncie myIBUK,
- dodatkowe funkcje: dodawanie notatek, tagów, zaznaczania fragmentów i cytatów,
- po pobraniu książka dostępna również bez dostępu do internetu.

Więcej informacji o formacie i wymaganiach technicznych IBUK »


od 4,92

Wypożycz teraz
Szybki zakup
Kup i pobierz. Formaty plików: multiformat
X W jednej cenie wszystkie dostępne formaty plików zabezpieczonych w ten sam sposób. Kup multiformat i nie zastanawiaj się czy plik będzie można otworzyć na Twoim urządzeniu! Szczegółowe informacje o plikach wchodzacych w skład multiformatu znajdują się w nawiasie.
(mobi ,
X Format mobi

Format mobi przeznaczony jest głównie dla urządzeń firmy Amazon typu Kindle Touch, Kindle Paperwhite czy Kindle Fire. Czytanie ebooków w tym formacie możliwe jest również na innych urządzeniach elektronicznych wyposażonych w odpowiednie oprogramowanie firmy Amazon. Kindle mobi jest formatem niestronicowanym co oznacza, że tekst płynnie dostosowuje się do wielkości ekranu dając użytkownikowi możliwość zmiany niektórych parametrów wyświetlania tekstu.

Więcej informacji o formacie i wymaganiach technicznych Kindle mobi
epub
X Format ePub

Format jest oficjalnym standardem International Digital Publishing Forum (IDPF). Jest obsługiwany przez prawie wszystkie typy e-czytników poza czytnikami marki Kindle. Książki w formacie ePub można czytać również na innych urządzeniach elektronicznych wyposażonych w odpowiednie oprogramowanie. ePub jest formatem niestronicowanym co oznacza, że tekst płynnie dostosowuje się do wielkości ekranu dając użytkownikowi możliwość zmiany niektórych parametrów wyświetlania tekstu.

Więcej informacji o formacie i wymaganiach technicznych ePub
)  
X Znak wodny

Zabezpieczenie to zwane również potocznie watermarkiem. Zabezpieczenie nakłada się na pliki indywidualnie i niepowtarzalnie w sposób jawny i ukryty. Każdy zakupiony e-book/audiobook staje się unikatowy i pozwala na jednoznacznie określenie właściciela pliku w przypadku nieuprawnionego użytkowania polegającego np. na umieszczeniu ebooka w internetowych serwisach wymiany plików. Jest to rozwiązanie, które bez względu na system operacyjny nie wymaga od użytkowników zakupu ani instalacji żadnego dodatkowego oprogramowania do odczytywania plików co czyni je bardzo wygodnym i popularnym.

Więcej informacji o zabezpieczeniu znakiem wodnym

71,00

49,70

Kup teraz
Kup na prezent »   

Opis

Książka przedstawia uczenie maszynowe w ujęciu praktycznym. Przeprowadzając opisane w niej eksperymenty data science poznamy zastosowanie reguł statystycznych i algorytmów uczenia maszynowego do rozwiązywania konkretnych problemów. Takie podejście oznacza, że studenci informatyki oraz specjaliści — analitycy, informatycy i bazodanowcy — zdobędą nie tylko teoretyczną wiedzę, ale również umiejętność jej praktycznego wykorzystania w codziennej pracy.


Sprawd? nowy abonament - to si? op?aca!
Ebook dost?pny w abonamencie
Inne ebooki autora Inne ebooki wydawcy Bestsellery w kategorii

Oceny użytkowników

Średnia ocena: ( 0 )
0
0
0
0
0
Oceń:  
Opinie użytkowników
Bądź pierwszy!