Diskuse k Wikislovníku:Korpusy

Z Wikislovníku
Skočit na navigaci Skočit na vyhledávání

Zda je Google Books korpus[editovat]

Z toho se zdá, že se slovo "corpus" užívá v širším i užším slova smyslu. --Dan Polansky (diskuse) 18. 5. 2023, 12:52 (CEST)[odpovědět]

Zda jsou korpusy ručně anotované[editovat]

  • https://wiki.korpus.cz/doku.php/pojmy:anotace
    "Proces, při němž se ručně či automaticky připojují interpretační lingvistické, strukturní údaje a/nebo metatextové údaje k textovým datům korpusu." Italika/kurzíva ode mne.

--Dan Polansky (diskuse) 18. 5. 2023, 12:18 (CEST)[odpovědět]

Co je korpus[editovat]

  • https://wiki.korpus.cz/doku.php/pojmy:korpus
    "Jazykový korpus (z lat. corpus „tělo, těleso“) je rozsáhlý soubor autentických textů (psaných nebo mluvených) převedený do elektronické podoby v jednotném formátu tak, aby v něm bylo možné jednoduše vyhledávat jazykové jevy, zejména slova a slovní spojení (kolokace)."

--Dan Polansky (diskuse) 20. 5. 2023, 08:07 (CEST)[odpovědět]

Další odkazy odpovídající na otázku:

--Dan Polansky (diskuse) 20. 5. 2023, 08:18 (CEST)[odpovědět]

Zda musí být korpus anotovaný[editovat]

Korpusy mohou být a) neanotované, b) ručně anotované, a c) automaticky/strojově anotované. --Dan Polansky (diskuse) 20. 5. 2023, 09:29 (CEST)[odpovědět]