-20%

PROMOCJA ABONAMENT

Mining Social-Driven Data

1 opinia

Autor:

Mikołaj Morzy

Wydawca:

Wydawnictwo Politechniki Poznańskiej

Format:

pdf

TA KSIĄŻKA JEST W ABONAMENCIE

Już od 49,00 zł miesięcznie za 5 ebooków!

WYBIERZ SWÓJ ABONAMENT

Abstract

The Web 2.0 revolution spreading over the Internet has dramatically changed the way data is gathered and processed by web applications. The static, authoritarian model of the Web has been abandoned in favor of dynamic, community-driven model of user-generated content. Social networks appear abundantly in all domains of human activity, presenting users with limitless volumes of data, information, and knowledge. Unfortunately, unearthing the knowledge hidden in vast repositories of social applications, such as wikis, Internet forums, or the blogosphere, is a difficult and challenging task. Structural complexity, huge volume of data to be processed, stochastic nature of social processes underlying the data, all contribute to the hardness of this task. Data mining methods developed for relational data repositories cannot be simply adapted to social-driven data. New models and algorithms are required for discovering knowledge in social-driven data. This dissertation introduces a trust-based approach for mining socialdriven data. The author examines different types of social-driven data, including blogs, Internet forums, and online auctions, and utilizes common underlying notions of trust and credibility to develop algorithms for mining social-driven data. Using the notions of trust and credibility allows to discover various important patterns in social-driven data. In the blogosphere, trust manifests itself as the ranking of blogs based on their relative influence on the blogosphere. In the domain of Internet forums, mining the social network of participants unveils true social roles attributed to particular participants. Finally, trust and credibility form the foundation of reputation models for the participants of online auctions. The dissertation presents new models and algorithms for mining socialdriven data. All algorithms have been implemented and their effectiveness has been verified by thorough experiments. The results of the experimental evaluation of models and algorithms allowed to confirm the main thesis of the dissertation, namely, that trust and credibility were the most important and crucial notions used to create relationships in social-driven data. In addition, it has been proven that trust and credibility might be discovered automatically by using data mining methods on the underlying social networks.

Streszczenie

Rewolucja Web 2.0, Której jesteśmy świadkami w ostatnich latach, dramatycznie zmieniła oblicze Internetu oraz zmodyfikowała sposób gromadzenia i przetwarzania danych pozyskiwanych przez aplikacje internetowe. Statyczny model Internetu ustąpił miejsca koncepcji dynamicznej sieci opartej na społecznościach użytkowników. Sieci społecznościowe pojawiają się w niemal wszystkich obszarach ludzkiej działalności, dostarczając niewyczerpanych zasobów danych, informacji i wiedzy. Niestety, odkrycie owej wiedzy ukrytej w przepastnych repozytoriach aplikacji społecznościowych, takich jak zbiory wiki, fora internetowe, czy wreszcie blogosfera, jest trudnym zadaniem. Trudność owa wynika przede wszystkim ze złożoności strukturalnej danych wykorzystywanych przez serwisy społecznościowe, z ogromnych rozmiarów danych gromadzonych przez te serwisy, a także ze stochastycznej natury procesów społecznych rządzących formowaniem się sieci społecznych. Metody eksploracji danych opracowane na potrzeby odkrywania wiedzy w tradycyjnych, relacyjnych repozytoriach danych nie mogą być w prosty sposób zaadaptowane na potrzeby eksploracji danych społecznościowych ze względu na istotne różnice w sposobie przetwarzanych danych. Konieczne jest, zatem opracowanie nowych, dedykowanych modeli i algorytmów służących odkrywaniu wiedzy w danych społecznościowych. W niniejszej rozprawie zaprezentowano nowe podejście do problemu eksploracji danych społecznościowych. Autor przeanalizował rożne rodzaje danych społecznościowych, w tym blogosferę, fora internetowe oraz aukcje internetowe, identyfikując w nich wspólny pierwiastek zaufania i wiarygodności. Odkrycie relacji zaufania i wiarygodności, w rożny sposób manifestujących się w danych społecznościowych, umożliwiło opracowanie nowych algorytmów odkrywania wzorców w danych społecznościowych. W dziedzinie eksploracji blogów przejawem zaufania jest ranking blogów oparty na względnym wpływie każdego z nich na pozostałą blogosferę. W dziedzinie forów internetowych eksploracja sieci powiązań między uczestnikami w poszukiwaniu przejawów zaufania umożliwiła odkrycie ról społecznych użytkowników w ramach społeczności forum internetowego. Wreszcie, zaufanie i wiarygodność stanowią fundamenty wszystkich modeli reputacji uczestników aukcji internetowych. W rozprawie zaprezentowano wiele nowych modeli i algorytmów eksploracji danych społecznościowych. Wszystkie przedstawione algorytmy zostały zaimplementowane, a ich efektywność potwierdzono eksperymentalnie. Wyniki przeprowadzonych eksperymentów pozwoliły autorowi potwierdzić tezę rozprawy, sformułowaną w rozdziale 1, zgodnie, z którą zaufanie i wiarygodność są podstawowymi czynnikami sprzyjającymi tworzeniu się związków w sieciach społecznych. Ponadto przeprowadzone badania dowiodły, że relacje zaufania i wiarygodności mogą być efektywnie odkrywane za pomocą metod eksploracji danych przystosowanych do przetwarzania danych w środowisku sieci społecznych.

Rok wydania	2009
Liczba stron	244
Kategoria	Internet
Wydawca	Wydawnictwo Politechniki Poznańskiej
ISBN-13	978-83-7143-814-1
Numer wydania	1
Język publikacji	angielski
Informacja o sprzedawcy	ePWN sp. z o.o.

POLECAMY

Marketing z Google

Paweł Kobis

ibuk

w abonamencie

wypożycz »

Google AdWords w praktyce

Przemysław Modrzewski

ibuk

w abonamencie

wypożycz »

-10%

Informacja w internecie

Maciej Dutko

epub, mobi

w abonamencie

39,60 zł44,00 zł

do koszyka

-10%

Copywriting internetowy

Maciej Dutko

epub, mobi

w abonamencie

39,60 zł44,00 zł

do koszyka

Podstawy architektury i technologii usług...

Zbigniew Fryźlewicz

ibuk

w abonamencie

wypożycz »

-14%

Internet In Psychological Research

Agata Błachnio

pdf

w abonamencie

13,76 zł16,00 zł

do koszyka

Public Relations bibliotek naukowych w...

Małgorzata Jaskowska

ibuk

w abonamencie

wypożycz »

Symfony

Karol Przystalski

pdf

w abonamencie

59,00 zł

do koszyka

Jak stworzyć najlepszy blog. WordPress 2.0

Łukasz Sosna

ibuk

w abonamencie

wypożycz »

-15%

CeWEBryci sława w sieci

Michał Janczewski

epub

w abonamencie

15,30 zł18,00 zł

do koszyka

-10%

Domeny internetowe

Maciej Dutko

epub, mobi

w abonamencie

35,10 zł39,00 zł

do koszyka

-20%

Podpis cyfrowy i identyfikacja...

Andrzej Grzywak

pdf

w abonamencie

21,60 zł27,00 zł

do koszyka

-5%

Biblioteka. Książka. Informacja. Internet...

Red. Renata Malesa

pdf

w abonamencie

32,30 zł34,00 zł

do koszyka

-10%

Cyfrowy świat 60+. Co słychać na fejsie

Alicja Żarowska-Mazur

epub, mobi

w abonamencie

48,60 zł54,00 zł

do koszyka

Ciekawe propozycje

-15%

Modelowanie dla biznesu. Regresja...

Red. Ewa Frątczak

Szkoła Główna Handlowa

42,84 zł

50,40 zł

pdf

Modelowanie dla biznesu. Regresja...

Red. Ewa Frątczak

pdf

w abonamencie

42,84 zł50,40 zł

do koszyka

"We wstępie do swojej książki"" Czwarta rewolucja przemysłowa"" profesor Klaus Schwab pisze m.in.:""Znajdujemy się na początku przewrotu, który w sposób fundamentalny zmienia sposób, w jaki żyjemy, pracujemy i utrzymujemy kontakty.... więcej >

-10%

Text Mining: metody, narzędzia i...

Mariusz Dzieciątko

Wydawnictwo Naukowe PWN

53,10 zł

59,00 zł

epub, mobi

Text Mining: metody, narzędzia i...

Mariusz Dzieciątko

epub, mobi

w abonamencie

53,10 zł59,00 zł

do koszyka

SAS Text Analytics to uniwersalna platforma zaspokajająca potrzeby informacyjne w organizacji do wydobywania i zarządzania informacją dostępną w różnego rodzaju dokumentach tekstowych.Możliwości omówionych w książce narzędzi i... więcej >

-15%

Web Data Mining z użyciem języka Python

Dr Ranjana Rajnish; Dr Meenakshi Srivastava

Promise

76,49 zł

89,99 zł

epub, pdf

Web Data Mining z użyciem języka Python

Dr Ranjana Rajnish; Dr Meenakshi Srivastava

epub, pdf

76,49 zł89,99 zł

do koszyka

ODKRYWAJ I WYODRĘBNIAJ INFORMACJE ZE STRON INTERNETOWYCH ZA POMOCĄ JĘZYKA PYTHONDanologia to najszybciej rozwijająca się dziedzina na świecie. Przewiduje się, że do roku 2026 stworzy 11,5 mln nowych miejsc pracy, tak więc osoby poszukujące... więcej >

-20%

Data

Krzysztof Lip

Ridero IT Solution

1,14 zł

1,42 zł

epub, mobi

Data

Krzysztof Lip

epub, mobi

1,14 zł1,42 zł

do koszyka

Bohaterem powieści jest Jarosław Góral, dla którego nic nie ma większego znaczenia od pieniędzy. Gdy zostaje ostrzeżony krótką notatką o dziwnej treści, zupełnie to przewraca jego życie do góry nogami. Zaczynają pojawiać się osoby,... więcej >

Data analysis in the maritime domain

Milena Stróżyna

Uniwersytet Ekonomiczny w Poznaniu

ibuk

Data analysis in the maritime domain

Milena Stróżyna

ibuk

Za darmo »

The book delivers a rich set of foundations, state-of-the-art knowledge, new approaches and methods for the purpose of anomalies detection, maritime traffic analysis as well as risk and reliability assessment. It addresses relevant research problems... więcej >

-20%

Data. Część II

Krzysztof Lip

Ridero IT Solution

3,23 zł

4,04 zł

epub, mobi

Data. Część II

Krzysztof Lip

epub, mobi

3,23 zł4,04 zł

do koszyka

Jarosław dostaje z pozoru bardzo proste zadanie — znaleźć przynajmniej sto osób, które się za niego szczerze pomodlą. Jednak dla człowieka, który nie ma żadnych znajomych, od rodziny dawno się odwrócił, a wszyscy ludzie, którzy go... więcej >

-10%

Data Driven Decisions

Red. Michał Jan Lutostański

Wydawnictwo Naukowe PWN

62,10 zł

69,00 zł

epub, mobi

Data Driven Decisions

Red. Michał Jan Lutostański

epub, mobi

w abonamencie

62,10 zł69,00 zł

do koszyka

Ostatnia dekada wywróciła świat biznesu i marketingu do góry nogami. Technologie, kryzysy, zmiany w polityce i stylu życia sprawiły, że przed decydentami pojawiła się niespotykana wcześniej masa znaków zapytania. Skończyła się, dająca... więcej >

-10%

Data Science i uczenie maszynowe

Marcin Szeliga

Wydawnictwo Naukowe PWN

84,60 zł

94,00 zł

epub, mobi

Data Science i uczenie maszynowe

Marcin Szeliga

epub, mobi

w abonamencie

84,60 zł94,00 zł

do koszyka

Książka przedstawia uczenie maszynowe w ujęciu praktycznym. Przeprowadzając opisane w niej eksperymenty data science poznamy zastosowanie reguł statystycznych i algorytmów uczenia maszynowego do rozwiązywania konkretnych problemów. Takie... więcej >

Data science: najseksowniejszy zawód XXI...

Remigiusz Żulicki

Wydawnictwo Uniwersytetu Łódzkiego

ibuk

Data science: najseksowniejszy zawód XXI...

Remigiusz Żulicki

ibuk

Za darmo »

Czy sztuczna inteligencja pozbawia nas pracy? Algorytmy przejmują władzę nad światem? Czy big data sprawia, że jesteśmy bezustannie inwigilowani, a ogromna ilość danych zastępuje ekspertów i naukowców? Cokolwiek sądzimy na te tematy,... więcej >

Spis treści

Abstract	7
Foreword	9
Preface	11

I. The World of the New	15

1. Web 2.0 Revolution	17

1.1 What is Web 2.0?	17
1.2 New forms of participation — push or pull?	21
1.3 New forms of expression — blogs	22
1.4 New forms of conversation — Internet forums	23
1.5 New forms of trade — online auctions	25
1.6 New forms of data — mobile objects	28
1.7 Introduction to data mining	29
1.8 Main thesis of the dissertation	32

2. Social-Driven Data	35

2.1 Introduction	35
2.2 Data from blogs	39
2.3 Data from Internet forums	44
2.4 Data from online auctions	47
2.5 Social implications of the Web 2.0 revolution	52

II. Mining of the New	57

3. Blogosphere	59

3.1 Introduction	59
3.2 Related Work	61
3.3 Basic Definitions	64
3.4 Trendoo Algorithm	67
3.5 Experiments	74
3.6 Conclusions	79

4. Internet Forums	81

4.1 Crawling Internet forums	81
4.2 Statistical analysis	83
4.2.1 Topic statistics	83
4.2.2 Post statistics	86
4.2.3 User statistics	87
4.3 Index analysis	91
4.4 Network analysis	99
4.4.1 Model of Internet forum sociogram	99
4.4.2 Topic analysis	102
4.4.3 User analysis	104
4.4.4 Role analysis	106
4.5 Conclusions	107

5. Online Auctions	109

5.1 Introduction	109
5.2 Related work	113
5.3 Credibility	115
5.3.1 Basic Definitions	116
5.3.2 CredMine Algorithm	117
5.3.3 Experiments	118
5.3.4 Conclusions	121
5.4 Density	123
5.4.1 Basic Definitions	124
5.4.2 Experiments	126
5.4.3 Conclusions	134
5.5 Implicit feedback	135
5.5.1 Existence of Implicit Feedback	135
5.5.2 Simulation	138
5.5.3 Experiments	142
5.5.4 Conclusions	144
5.6 Positive and Negative Reputation	144
5.6.1 Basic Definitions	145
5.6.2 R+ and R- Algorithms	146
5.6.3 Experiments	148
5.6.4 Conclusions	153
5.7 Summary of online auction mining	154

III. Miscellaneous	155

6. Moving Objects	157

6.1 Introduction	158
6.2 Related Work	159
6.3 Basic Definitions	160
6.4 Algorithms	163
6.4.1 AprioriTraj	163
6.4.2 Traj-PrefixSpan	167
6.5 Experiments	169
6.5.1 AprioriTraj	169
6.5.2 Traj-PrefixSpan	171
6.6 Conclusions	176

7. Negative Patterns	179

7.1 Introduction	180
7.2 Related Work	181
7.3 Basic Definitions	182
7.3.1 Frequent Itemsets and Association Rules	182
7.3.2 Dissociation Itemsets and Dissociation Rules	184
7.4 Algorithms	185
7.5 Experiments	189
7.6 Conclusions	192

8. Summary	195

IV. Appendixes	201

A. Trendoo	203

A.1 Introduction	203
A.2 Architecture	204
A.3 User Guide	207

B. Foruminer	209

B.1 Introduction	209
B.2 Architecture	210
B.3 User Guide	211

C. Presto	215

C.1 Presto Simulator	215
C.2 Presto Web	217

D. Moppy	221

D.1 Introduction	221
D.2 General Idea	223
D.3 Architecture, Features, and User Interface	224

Bibliography	227
Afterword	241
Streszczenie	243

RozwińZwiń