Přeskočit na obsah

Diskuse k Wikislovníku:Korpusy

Obsah stránky není podporován v jiných jazycích.
Přidat téma
Z Wikislovníku
Poslední komentář: před 1 rokem od uživatele Dan Polansky v tématu „Zda musí být korpus anotovaný

Zda je Google Books korpus

[editovat]

Z toho se zdá, že se slovo "corpus" užívá v širším i užším slova smyslu. --Dan Polansky (diskuse) 18. 5. 2023, 12:52 (CEST)Odpovědět

Zda jsou korpusy ručně anotované

[editovat]
  • https://wiki.korpus.cz/doku.php/pojmy:anotace
    "Proces, při němž se ručně či automaticky připojují interpretační lingvistické, strukturní údaje a/nebo metatextové údaje k textovým datům korpusu." Italika/kurzíva ode mne.

--Dan Polansky (diskuse) 18. 5. 2023, 12:18 (CEST)Odpovědět

Co je korpus

[editovat]
  • https://wiki.korpus.cz/doku.php/pojmy:korpus
    "Jazykový korpus (z lat. corpus „tělo, těleso“) je rozsáhlý soubor autentických textů (psaných nebo mluvených) převedený do elektronické podoby v jednotném formátu tak, aby v něm bylo možné jednoduše vyhledávat jazykové jevy, zejména slova a slovní spojení (kolokace)."

--Dan Polansky (diskuse) 20. 5. 2023, 08:07 (CEST)Odpovědět

Další odkazy odpovídající na otázku:

--Dan Polansky (diskuse) 20. 5. 2023, 08:18 (CEST)Odpovědět

Zda musí být korpus anotovaný

[editovat]

Korpusy mohou být a) neanotované, b) ručně anotované, a c) automaticky/strojově anotované. --Dan Polansky (diskuse) 20. 5. 2023, 09:29 (CEST)Odpovědět