• - Alle Rubriken -
  • Bücher
  • Lernen / Pädagogik
  • E-Books / Audio-Downloads / Reader
  • Hörbücher
  • Software / Games / Hardware
  • Musik / Filme
  • Spiele
  • Kalender
  • Geschenke / Papeterie
  • Karten / Globen
  • Schweiz
  • Englisch und andere Fremdsprachen
  • Lieferbar
  • Neuheit
  • Archiv
  • - Alle Rubriken -
  • Bücher
  • Lernen / Pädagogik
  • E-Books / Audio-Downloads / Reader
  • Hörbücher
  • Software / Games / Hardware
  • Musik / Filme
  • Spiele
  • Kalender
  • Geschenke / Papeterie
  • Karten / Globen
  • Schweiz
  • Englisch und andere Fremdsprachen
  • - Alle -
  • Audio CD
  • Audio MP3
  • Blu-ray
  • CD ROM, DVD-ROM
  • DVD-Video
  • E-Book EPUB
  • E-Book PDF
  • Hardcover, gebunden
  • Taschenbuch, kartoniert
  • - Alle -
  • Aargauer Mundart
  • Abchasisch (apsua)
  • Aceh-sprache (atje-sprache)
  • Acholi-sprache
  • Adangme-sprache
  • Adygei-sprache
  • Aegyptisch
  • Afrihili
  • Afrikaans
  • Ainu
  • Akan-sprache
  • Akkadisch (assyrisch-babylonisch)
  • Albanisch
  • Alemannisch
  • Algonkin-sprachen
  • Altaethiopisch
  • Altaische Sprachen (andere)
  • Altenglisch (ca. 450-1100)
  • Altfranzoesisch (842-ca. 1400)
  • Althochdeutsch (ca. 750-1050)
  • Altirisch (bis 900)
  • Altnorwegisch
  • Altprovenzalisch (bis 1500)
  • Amharisch
  • Appenzellerdeutsch
  • Arabisch
  • Aragonisches Spanisch
  • Aramaeisch
  • Arapaho-sprache
  • Arawak-sprachen
  • Armenisch
  • Aserbaidschanisch (azerbajdzanisch)
  • Assamesisch (asamiya)
  • Asturisch
  • Athapaskische Sprachen
  • Australische Sprachen
  • Austronesische Sprachen
  • Avestisch
  • Aymara-sprache
  • Bahasa Indonesia
  • Baltische Sprachen
  • Bambara-sprache
  • Bamileke-sprache
  • Bantusprachen
  • Basaa-sprache
  • Baschkirisch
  • Baseldeutsch
  • Baskisch
  • Bayrisch
  • Beach-la-mar
  • Bedauye
  • Bemba-sprache
  • Bengali
  • Berbersprachen
  • Berlinerisch
  • Berndeutsch
  • Bhojpuri (bajpuri)
  • Birmanisch
  • Blackfoot-sprache
  • Bokmal
  • Bosnisch
  • Brandenburger Mundart
  • Bretonisch
  • Bulgarisch
  • Caddo-sprachen
  • Cebuano
  • Chamorro-sprache
  • Cherokee-sprache
  • Chinesisch
  • Chinook-jargon
  • Chipewyan
  • Choctaw-sprache
  • Cree-sprache
  • Daenisch
  • Dakota-sprache
  • Danakil-sprache
  • Dari Persisch
  • Delaware-sprache
  • Deutsch
  • Dinka-sprache
  • Dogrib-sprache
  • Drawidische Sprachen
  • Duala-sprachen
  • Dzongkha
  • Efik
  • Elamisch
  • Elsaessisch
  • Emilianisch
  • Englisch
  • Ersjanisch
  • Esperanto
  • Estnisch
  • Ewe-sprache
  • Faeroeisch
  • Fanti-sprache
  • Farsi
  • Fidschi-sprache
  • Filipino
  • Finnisch
  • Finnougrische Sprachen
  • Fon-sprache
  • Fraenkisch
  • Franzoesisch
  • Friulisch
  • Ful
  • Ga
  • Gaelisch-schottisch
  • Galicisch
  • Galla-sprache
  • Ganda-sprache
  • Georgisch
  • Germanische Sprachen
  • Gilbertesisch
  • Glarner Mundart
  • Gotisch
  • Grebo
  • Griechisch (bis 1453)
  • Groenlaendisch
  • Guarani-sprache
  • Gujarati-sprache
  • Haida-sprache
  • Haitisches Creolisch
  • Hamitosemitische Sprachen
  • Haussa-sprache
  • Hawaiisch
  • Hebraeisch
  • Herero-sprache
  • Hessisch
  • Hiligaynon-sprache
  • Himachali
  • Hindi
  • Iban
  • Ibo-sprache
  • Ido
  • Ijo-sprache
  • Ilokano-sprache
  • Indianersprachen (nordamerik.)
  • Indianersprachen (suedamerik.)
  • Indianersprachen / Zentralamerika
  • Indoarische Sprachen
  • Indogermanische Sprachen
  • Ingush-sprache
  • Interlingua (iala)
  • Interlingue
  • Inuktitut
  • Iranische Sprachen
  • Irisch
  • Irokesische Sprachen
  • Islaendisch
  • Italienisch
  • Japanisch
  • Javanisch
  • Jiddisch
  • Judenspanisch
  • Juedisch-arabisch
  • Kabardinisch
  • Kabylisch
  • Kamba
  • Kambodschanisch
  • Kannada
  • Kanuri-sprache
  • Karatschai-balkarisch
  • Karenisch
  • Karibische Sprachen
  • Kasachisch
  • Kaschmiri
  • Katalanisch
  • Kaukasische Sprachen
  • Kein Sprachlicher Inhalt
  • Keltische Sprachen
  • Khasi-sprache
  • Khoisan-sprachen
  • Kikuyu-sprache
  • Kirchenslawisch
  • Kirgisisch
  • Klassisches Syrisch
  • Klingonisch
  • Koelsch
  • Komi-sprachen
  • Kongo
  • Konkani
  • Koptisch
  • Koreanisch
  • Kornisch
  • Korsisch
  • Kpelle-sprache
  • Kreolisch-englisch
  • Kreolisch-franzoesisch
  • Kreolisch-portugiesisch
  • Kreolische Sprachen
  • Kroatisch
  • Kru-sprachen
  • Kurdisch
  • Kurdisch (sorani)
  • Kutchin
  • Laotisch
  • Latein
  • Lettisch
  • Ligurisch
  • Lingala
  • Litauisch
  • Lombardisch
  • Luba-sprache
  • Luiseno-sprache
  • Lulua-sprache
  • Luo-sprache
  • Lushai-sprache
  • Luxemburgisch
  • Luzerner Mundart
  • Maduresisch
  • Maithili
  • Makassarisch
  • Malagassisch
  • Malaiisch
  • Malayalam
  • Maledivisch
  • Malinke-sprache
  • Maltesisch
  • Manchu
  • Mandaresisch
  • Manx
  • Maori-sprache
  • Marathi
  • Marschallesisch
  • Massai-sprache
  • Maya-sprachen
  • Mazedonisch
  • Mbundu-sprache
  • Mbundu-sprache 1
  • Meithei-sprache
  • Miao-sprachen
  • Micmac-sprache
  • Mittelenglisch (1100-1500)
  • Mittelfranzoesisch (ca. 1400-1600)
  • Mittelhochdeutsch (ca. 1050-1500)
  • Mittelirisch (900-1200)
  • Mittelniederlaendisch (ca. 1050-1350)
  • Mohawk-sprache
  • Mon-khmer-sprachen
  • Mongolisch
  • Montenegrinisch
  • Mossi-sprache
  • Mundart
  • Muskogee-sprachen
  • N Ko
  • Nahuatl
  • Navajo-sprache
  • Ndebele-sprache (nord)
  • Ndebele-sprache (sued)
  • Ndonga
  • Neapolitanisch
  • Nepali
  • Neugriechisch (nach 1453)
  • Neumelanesisch
  • Newari
  • Niederdeutsch
  • Niederlaendisch
  • Niedersorbisch
  • Nigerkordofanische Sprachen
  • Nordfriesisch
  • Nordsaamisch
  • Norwegisch (bokmal)
  • Nubische Sprachen
  • Nyanja-sprache
  • Nyankole
  • Nynorsk
  • Nyoro
  • Obersorbisch
  • Obwaldner Mundart
  • Ojibwa-sprache
  • Okzitanisch (nach 1500)
  • Oriya-sprache
  • Osmanisch
  • Ossetisch
  • Ostfriesisch
  • Pali
  • Pandschabi-sprache
  • Pangasinan-sprache
  • Papiamento
  • Papuasprachen
  • Paschtu
  • Pehlewi
  • Persisch
  • Philippinen-austronesisch
  • Phoenikisch
  • Piemontesisch
  • Plattdeutsch
  • Polnisch
  • Polyglott
  • Portugiesisch
  • Prakrit
  • Quechua-sprache
  • Raetoromanisch
  • Rajasthani
  • Rarotonganisch
  • Romani
  • Romanisch
  • Romanische Sprachen
  • Rumaenisch
  • Rundi-sprache
  • Russisch
  • Rwanda-sprache
  • Saamisch
  • Saarlaendisch
  • Saechsisch
  • Salish-sprache
  • Samoanisch
  • Sango-sprache
  • Sanskrit
  • Santali
  • Sardisch
  • Schaffhauser Mundart
  • Schona-sprache
  • Schottisch
  • Schwaebisch
  • Schwedisch
  • Schweizerdeutsch
  • Semitische Sprachen
  • Serbisch
  • Sidamo
  • Sindhi-sprache
  • Singhalesisch
  • Sinotibetische Sprachen
  • Sioux-sprachen
  • Sizilianisch
  • Slave (athapaskische Sprachen)
  • Slawische Sprachen
  • Slowakisch
  • Slowenisch
  • Sogdisch
  • Solothurner Mundart
  • Somali
  • Songhai-sprache
  • Soninke-sprache
  • Sorbisch
  • Sotho-sprache (nord)
  • Sotho-sprache (sued)
  • Spanisch
  • Spanisch (lateinamerika)
  • Sranan Tongo
  • Sumerisch
  • Sundanesisch
  • Swahili
  • Swazi
  • Syrisch
  • Tadschikisch
  • Tagalog
  • Tahitisch
  • Tamaseq
  • Tamil
  • Tatarisch
  • Telugu-sprache
  • Temne
  • Tetum-sprache
  • Thailaendisch
  • Thaisprachen (andere)
  • Tibetisch
  • Tigre-sprache
  • Tigrinya-sprache
  • Tlingit-sprache
  • Tonga (bantusprache, Malawi)
  • Tongaisch (sprache Auf Tonga)
  • Tschagataisch
  • Tschechisch
  • Tschetschenisch
  • Tsonga-sprache
  • Tswana-sprache
  • Tuerkisch
  • Tumbuka
  • Tupi-sprache
  • Turkmenisch
  • Udmurt-sprache
  • Ugaritisch
  • Uigurisch
  • Ukrainisch
  • Unbestimmt
  • Ungarisch
  • Urdu
  • Usbekisch
  • Vai-sprache
  • Valencianisch
  • Venda-sprache
  • Verschiedene Sprachen
  • Vietnamesisch
  • Volapuek
  • Volta-comoe-sprachen
  • Wakashanisch
  • Walamo-sprache
  • Walisisch
  • Walliser Mundart
  • Wallonisch
  • Weissrussisch
  • Welthilfssprache
  • Westfriesisch
  • Wienerisch
  • Wolof-sprache
  • Xhosa-sprache
  • Yao-sprache
  • Yoruba-sprache
  • Yupik-sprache
  • Zapotekisch
  • Zeichensprache
  • Zhuang
  • Zuerichdeutsch
  • Zulu
  • Relevanz
  • Autor
  • Erscheinungsjahr
  • Preis
  • Titel
  • Verlag
Zwischen und
Kriterien zurücksetzen

Fehlerquellen beim Part-of-speech-Tagging am Beispiel verschiedener Textarten (Jung, Jascha Daniló)
Fehlerquellen beim Part-of-speech-Tagging am Beispiel verschiedener Textarten
Autor Jung, Jascha Daniló
Verlag GRIN Verlag
Sprache Deutsch
Mediaform PDF
Erscheinungsjahr 2018
Seiten 25 S.
Artikelnummer 28005975
ISBN 978-3-668-75406-5
Auflage 18001 A. 1. Auflage
Plattform PDF
CHF 17.00
Zusammenfassung
Studienarbeit aus dem Jahr 2017 im Fachbereich Germanistik - Linguistik, Note: 1,7, Technische Universität Darmstadt (Institut für Sprach- und Literaturwissenschaft), Veranstaltung: Forschungsthemen der Korpus- und Computerlinguistik - computervermittelte Interaktion (DH), Sprache: Deutsch, Abstract: Automatische Tagger spielen eine wichtige Rolle bei der Bearbeitung großer Textkorpora. Ohne sie wäre es nicht möglich große Textmengen in kurzen Zeiträumen mit bestimmten linguistischen Merkmalen zu annotieren und somit für die weitere Bearbeitung zugänglich zu machen. Viele dieser Tagger sind als Open-Source Software verfügbar. Das Ziel dieser Arbeit ist es, einen Vergleich zwei solcher Tagger durchzuführen, indem sie auf unterschiedliche deutsche Texte angewandt werden, die von der deutschen Standardvarietät in kleinem bis großem Umfang abweichen. Anschließend können die Textstellen betrachtet werden, bei denen die Tagger unterschiedliche Annotationen erzeugen. Der Fokus liegt dabei auf der Frage, welche Probleme durch die Besonderheiten der deutschen Sprache und seiner Varietäten bei den hier verwendeten Taggern beispielhaft auftreten und den daraus resultierenden falschen oder ambigen Annotationen. Der Aufbau der Arbeit gliedert sich wie folgt: Zunächst werden im Abschnitt 'Methodik' - nach einem kurzen Überblick über den aktuellen Forschungsstand - die verwendeten Part-of-Speech-Tagger (PoS-Tagger) vorgestellt. Anschließend werden deutsche Texte für den Test der Tagger ausgewählt und vorgestellt. Diese Texte sollen sich in ihrer Abweichung von der deutschen Standardvarietät möglichst stark unterscheiden, um eine breite Fläche an möglichen "Stolpersteinen" für die Tagger zu bieten. Anschließend erfolgt die Annotation der ausgewählten Texte mit den ausgewählten Taggern und schließlich eine Auswertung der resultierenden annotierten Token. Zum Schluss werden die Ergebnisse noch einmal kurz zusammengefasst.