EBOOKI WYDAWCY
Autor:
Wydawca:
Format:
ibuk
W monografii przedstawiono opis fleksji i składni języka polskiego przystosowany do automatycznego przetwarzania tekstów. Opis ten stał się podstawą dwóch programów komputerowych: analizatora fleksyjnego Morfeusz i analizatora składniowego Świgra 2.
Wymienione narzędzia posłużyły do budowy korpusu składniowego Składnica, wykorzystanego następnie do opracowania metody statystycznego ujednoznaczniania analiz składniowych. Książka adresowana jest zarówno do informatyków, jak i językoznawców zainteresowanych technikami przetwarzania języka naturalnego.
A description of the inflection and syntax of the Polish language adapted to the automatic processing of texts, which became the fundament of two computer programmes: Morfeusz, an inflectional analyser, and Świgra 2, a constituency parser. The two tools have been used to build the Składnica treebank, later employed to develop a method of statistical disambiguation of constituent analyses.
Liczba stron | 290 |
---|---|
Wydawca | Uniwersytet Warszawski |
ISBN-13 | 978-83-235-3614-7 |
Numer wydania | 1 |
Język publikacji | polski |
Informacja o sprzedawcy | ePWN sp. z o.o. |
EBOOKI WYDAWCY
POLECAMY
Ciekawe propozycje
Spis treści
Wstęp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 9 |
1. Analiza fleksyjna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 15 |
1.1. Podstawowe pojęcia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 16 |
1.2. SGJP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 19 |
1.3. Morfeusz SGJP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 21 |
1.4. Dystrybucyjne podejście do fleksji . . . . . . . . . . . . . . . . . . . . . . . . . . | 23 |
1.5. Segmentacja tekstu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 27 |
1.6. Najważniejsze kategorie gramatyczne . . . . . . . . . . . . . . . . . . . . . . . . | 29 |
1.6.1. Kategoria liczby . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 29 |
1.6.2. Kategoria przypadka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 29 |
1.6.3. Kategoria rodzaju . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 31 |
1.6.4. Kategoria osoby . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 36 |
1.7. Klasy gramatyczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 37 |
1.7.1. Leksemy i fleksemy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 39 |
1.7.2. Czasowniki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 40 |
1.7.3. Rzeczowniki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 51 |
1.7.4. Zaimki osobowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 54 |
1.7.5. Przymiotniki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 55 |
1.7.6. Liczebniki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 58 |
1.7.7. Leksemy nieodmienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 59 |
1.7.8. Skróty . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 61 |
1.8. Nieregularności fleksyjne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 62 |
1.9. Lematyzacja, czyli hasłowanie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 62 |
1.10. Struktura znaczników fleksyjnych . . . . . . . . . . . . . . . . . . . . . . . . . . . | 64 |
1.11. Grafowa reprezentacja interpretacji fleksyjnych . . . . . . . . . . . . . . . . . | 64 |
2. Przyjęta reprezentacja konstrukcji składniowych . . . . . . . | 67 |
2.1. Podstawowe pojęcia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 68 |
2.1.1. Co należy do składni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 68 |
2.1.2. Akomodacja i konotacja składniowa . . . . . . . . . . . . . . . . . . . . . | 71 |
2.1.3. Analiza zależnościowa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 73 |
2.1.4. Analiza składnikowa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 74 |
2.1.5. Dystrybucyjne podejście do składni . . . . . . . . . . . . . . . . . . . . . | 76 |
2.1.6. Podrzędność, współrzędność i nieredukowalność . . . . . . . . . . . . | 76 |
2.1.7. Podrzędniki czasownika . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 78 |
2.2. Niebinarność struktury . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 79 |
2.3. Pokrój ogólny drzew składnikowych . . . . . . . . . . . . . . . . . . . . . . . . . | 83 |
2.4. Hierarchia jednostek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 86 |
5 | |
2.5. Typy fraz składnikowych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 88 |
2.6. Wyróżnianie centrów . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 90 |
2.7. Struktura zdania elementarnego . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 91 |
2.8. Schematy strukturyzacyjne konstrukcji podrzędnych . . . . . . . . . . . . . | 95 |
2.8.1. Typowe konstrukcje podrzędne . . . . . . . . . . . . . . . . . . . . . . . . | 95 |
2.8.2. Konstrukcje apozycyjne i pokrewne . . . . . . . . . . . . . . . . . . . . . | 98 |
2.8.3. Frazy liczebnikowe i nominalne ze składnikiem liczebnikowym . | 100 |
2.8.4. Modyfikatory partykułowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 103 |
2.8.5. Modyfikatory taki, jaki(ś) . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 104 |
2.9. Schematy strukturyzacyjne konstrukcji współrzędnych . . . . . . . . . . . . | 105 |
2.9.1. Konstrukcje równorzędne . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 107 |
2.9.2. Konstrukcje szeregowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 110 |
2.9.3. Nieredukowalne frazy nominalne . . . . . . . . . . . . . . . . . . . . . . . | 113 |
2.9.4. Połączenia współrzędne fraz składnikowych różnych typów . . . . | 115 |
2.9.5. Konstrukcje uwspólniające podrzędniki . . . . . . . . . . . . . . . . . . | 116 |
2.10. Zdania proste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 118 |
2.11. Strona bierna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 125 |
2.12. Zdanioidy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 128 |
2.13. Nieciągłe formy analityczne czasowników . . . . . . . . . . . . . . . . . . . . . | 131 |
2.14. Problem nieciągłości . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 133 |
2.15. Interpunkcja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 135 |
2.16. Podsumowanie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 137 |
3. Słownik walencyjny Walenty . . . . . . . . . . . . . . . . . . . . . . . . . . . | 139 |
3.1. Warstwa składniowa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 141 |
3.1.1. Które podrzędniki notować w słowniku? . . . . . . . . . . . . . . . . . . | 142 |
3.1.2. Typy fraz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 142 |
3.1.3. Pozycje składniowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 144 |
3.1.4. Przypadek strukturalny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 146 |
3.1.5. Wymagane frazy motywowane semantycznie . . . . . . . . . . . . . . . | 148 |
3.1.6. Zwrotność . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 149 |
3.1.7. Specjalne wartości typów fraz . . . . . . . . . . . . . . . . . . . . . . . . . | 150 |
3.1.8. Przyimki złożone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 152 |
3.1.9. Konstrukcje porównawcze . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 154 |
3.1.10. Realizacje niefinitywne schematów czasownikowych . . . . . . . . . | 154 |
3.1.11. Hasła nieczasownikowe w słowniku . . . . . . . . . . . . . . . . . . . . . | 157 |
3.1.12. Kontrola składniowa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 158 |
3.1.13. Argumenty zleksykalizowane . . . . . . . . . . . . . . . . . . . . . . . . . . | 160 |
3.2. Warstwa semantyczna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 162 |
3.2.1. Role semantyczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 164 |
3.2.2. Preferencje selekcyjne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 166 |
3.2.3. Powiązanie warstwy składniowej z semantyczną . . . . . . . . . . . . | 167 |
4. Implementacja gramatyki w analizatorze Świgra 2 . . . . . . . | 171 |
4.1. Zastosowany formalizm gramatyczny . . . . . . . . . . . . . . . . . . . . . . . . | 171 |
4.2. Rozszerzenia formalizmu DCG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 174 |
4.2.1. Elementy opcjonalne reguł . . . . . . . . . . . . . . . . . . . . . . . . . . . | 175 |
4.2.2. Sekwencje nieterminali i warunki iterowane . . . . . . . . . . . . . . . | 176 |
4.2.3. Zalety i wady mechanizmu sekwencji . . . . . . . . . . . . . . . . . . . . | 183 |
4.3. Styl pisania reguł . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 184 |
6 | |
4.4. Parametry jednostek nieterminalnych . . . . . . . . . . . . . . . . . . . . . . . . | 185 |
4.4.1. Predestynacja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 186 |
4.4.2. Negacja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 188 |
4.4.3. Inkorporacja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 193 |
4.4.4. Klasa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 194 |
4.4.5. Przecinkowość . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 195 |
4.4.6. Nadrzędność . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 197 |
4.4.7. Pozycja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 197 |
4.5. Sposób realizacji wymagań . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 198 |
4.5.1. Wypełnianie pozycji składniowych . . . . . . . . . . . . . . . . . . . . . . | 199 |
4.5.2. Specyfikacje argumentów składniowych . . . . . . . . . . . . . . . . . . | 200 |
4.5.3. Przykład realizacji wymagań . . . . . . . . . . . . . . . . . . . . . . . . . . | 200 |
4.5.4. Wymagania a konstrukcje z koordynacją . . . . . . . . . . . . . . . . . . | 202 |
4.5.5. Wyjęcie wymagania poza frazę . . . . . . . . . . . . . . . . . . . . . . . . . | 204 |
4.6. Prezentacja wyników analizy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 207 |
5. Inne formalne opisy składni języka polskiego . . . . . . . . . . . | 209 |
5.1. Opisy składnikowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 209 |
5.1.1. Gramatyka Szpakowicza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 209 |
5.1.2. Gramatyka Świdzińskiego (GFJP) . . . . . . . . . . . . . . . . . . . . . . . | 210 |
5.2. Opis w formalizmie HPSG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 211 |
5.3. Opis w formalizmie LFG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 213 |
5.4. Opisy zależnościowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 217 |
5.5. Pożądane cechy formalizmu składniowego . . . . . . . . . . . . . . . . . . . . . | 219 |
6. Korpus składniowy Składnica . . . . . . . . . . . . . . . . . . . . . . . . . . | 221 |
6.1. Podstawa tekstowa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 223 |
6.2. Zasady znakowania korpusu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 224 |
6.3. Niejednoznaczności analizy składnikowej . . . . . . . . . . . . . . . . . . . . . | 225 |
6.4. Wizualizacja drzew i lasów składniowych . . . . . . . . . . . . . . . . . . . . . . | 228 |
6.5. Dendrarium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 229 |
6.6. Ewaluacja korpusu Składnica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 237 |
6.7. Wyszukiwarka drzew składniowych . . . . . . . . . . . . . . . . . . . . . . . . . . | 241 |
6.8. Przykłady wykorzystania wyszukiwania w Składnicy . . . . . . . . . . . . . . | 248 |
6.9. Przykłady kwantytatywnych zastosowań Składnicy . . . . . . . . . . . . . . . | 250 |
7. Statystyczne ujednoznacznianie analiz składniowych . . . | 255 |
7.1. Sposób oceny jakości modeli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 255 |
7.2. Modelowanie w stylu probabilistycznych gramatyk bezkontekstowych . | 258 |
7.3. Modelowanie maksimum entropii . . . . . . . . . . . . . . . . . . . . . . . . . . . | 264 |
7.4. Podsumowanie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 272 |
Zakończenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 273 |
Bibliografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 277 |