Diskuse s uživatelem:Reaperman/Kategorizace

Z Wikislovníku
Skočit na navigaci Skočit na vyhledávání

Jak se bude řešit britská/americká angličtina? --Lenka64 15. 11. 2009, 09:42 (UTC)

To je velice dobrá otázka, která stojí za obsáhlejší zvážení. S kategorizací podle regionálních specifik jazyka tu mnoho zkušeností nemáme. Na en.wikt mají například en:Category:Regional English, která se mi zdá pro naše potřeby až příliš roztříštěná, kdy bychom si momentálně vystačili pouze s asi čtyřmi variantami (UK, US, CA, AUS), ale lze to použít jako zajímavé vodítko. Samozřejmě to není jen věc angličtiny, ale i dalších jazyků, například i v češtině by šla některá slova rozčlenit podle regionální příslušnosti. --Reaperman 15. 11. 2009, 11:01 (UTC)

Možná je to hloupost, ale co kategorii Ostatní pojmenovat jako na fr Lingvistické kuriozity češtiny a zařadit ji do kategorie Čeština a do kategorie Lingvistické kuriozity podle jazyků a tu potom do (vše)? Nebo nějak podobně?

Chci dodat, že tahle iniciativa se mi líbí, díky za ní. Palu 16. 11. 2009, 15:53 (UTC)

Jistě, název ještě bude potřeba vyřešit a rozhodně nebyl myšlen jako konečný, v podstatě se jedná o škatulku pro věci, které nelze zařadit jinam a po vyřešení, co ještě chceme kategorizovat, jak s tím naložíme dále. --Reaperman 16. 11. 2009, 18:14 (UTC)

Podrobnější kategorizace pro slovní druhy[editovat]

Nabízí se otázka, zda kategorizovat zvlášť například zvratná slovesa nebo anglická frázová slovesa, a pokud ano, zda používat vertikální kategorizaci, tedy, že by heslo například bylo zároveň v kategorii Anglická frázová slovesa i v kategorii Anglická slovesa, nebo pouze v jedné. --Reaperman 18. 11. 2009, 23:06 (UTC)

Např. u kategorie Česká slovesa bych nechal stávající začlenění do Sloves i do Češtiny, ale tady si myslím, že bude lepší, když se zařádí kategorie Česká zvratná slovesa do Česká slovesa a hesla samotná se zařadí pouze do jedné z nich. Tedy pokud není něco, kvůli čemu by mělo smysl postupovat jinak, mě ale nic takového nenapadá. Ještě by možná mohla být kategorie Česká zvratná slovesa zařazena do kategorie Zvratná slovesa, ale to už není tak důležité, protože ta potřebnost asi není taková. Pravděpodobně málokdo bude hledat zvratná slovesa podle jazyků, podle mého názoru na rozdíl od sloves jako takových. Navíc takové specializovanější druhy fungují v jednotlivých jazycích asi odlišně, což společnou kategorizaci také ztěžuje.
Jinak obecně proti takovým kategoriím nejsem. Jemnější kategorizace je podle mě ve výsledku asi lepší, pokud něco zásadně nekomplikuje. Palu 19. 11. 2009, 10:18 (UTC)

Dannyho poznámky[editovat]

(nadpis mne "podepisuje" a datovat netřeba - budu připisovat postupně; případné diskusní příspěvky bych prosil pomocí #*)

  1. důsledně používat vědeckou terminologii
    • Jsem proti, ani české slovníky tak nepostupují a znepřehlední to užití pro běžné uživatele (viz příklad Juana, který zprvu nevěděl ani co je plurál). Stávající stav odráží jakousi přípustnost, kam až lze v tomto zajít aniž by se to pro uživatele stalo nepřehledným. Standardizace pouze na jeden typ by byla nejen zbytečná, ale zároveň pojmenování "podstatné jméno" místo "substantivum" není nevědecké (viz ještě mojí odpověď u bodu 2., s kterým tento úzce souvisí). Palu 5. 2. 2010, 10:18 (UTC)
      • Odborná terminologie je ovšem srozumitelnější prakticky pro všechny cizince, neboť vychází ze společného základu. Navíc je logické, že by existovaly nástroje pro laiky, které by jim tu práci zpočátku, než si terminologii osvojí, zjednodušovaly. Kromě toho si myslím, že člověk daný termín použije dvakrát, třikrát a zapamatuje si ho.
        Danny B. ( diskusemail přehled příspěvků ) 5. 2. 2010, 10:54 (UTC)
        • No je otázka, jestli chceme jít s tím projektem naproti cizincům nebo naproti Čechům. Možná, že kdyby se nějaké nástroje udělaly, pak by to šlo. Třeba mě napadá, že by se mohlo po přejetí myši na nadpis "substantivum" zobrazit "podstatné jméno". Pak by to možná bylo natolik neutrální a použitelné pro laiky, že by to šlo zavést. Palu 5. 2. 2010, 11:17 (UTC)
          • Přemýšlel jsem nad tímto problémem a jen jsem se utvrdil, že jsem proti. Jako český projekt bychom měli přednostně užívat česká pojmenování. Abych zjistil, jak se k tomu staví lingvističtí odborníci, prošel jsem Pravidla českého pravopisu a několik slovníků, i jinojazyčných, a všude byla užita zavedená terminologie: podstatné jméno, přídavné jméno, sloveso, příslovce, množné číslo, jednotné číslo, mužský rod, životné, neživotné... Substantivum, adverbium, verbum, maskulinum, inanimatum, apod. se nevyskytovalo nikde. V jediném slovníku se toto vyskytovalo omezeně, a to na příručním slovníku. Můj soud je takový, že pokud má do reality někdo zavádět novoty, tak jistě ne Wikiprojekt. Wikiprojekty mají obecně realitu odrážet, nikoliv spoluvytvářet. Snad kromě Wikiverzity. Je možné, že jsem měl tu "smůlu" a nenarazil ve svém výběru na české slovníky, které latinská pojmenování jinak běžně používají, ale to nevidím jako moc reálnou možnost, vzhledem k tomu, jak různorodé slovníky jsem prošel. Možná, že pár slovníků, ale jak to tak vypadá, většina pravděpodobně užívá až na výjimky českou terminologii. Palu 7. 2. 2010, 12:27 (UTC)
            • Jsme sice český projekt, ale editují i (jako všude jinde) cizinci. A pokud budeme mít co nabídnout, budou český slovník i používat. Je lepší univerzální názvosloví, kterému porozumí všichni, než se nacionalisticky vymezovat. --Lenka64 7. 2. 2010, 12:36 (UTC)
              • Tohle je sice rozumný argument, ale dokud se nezačnou psát slovníky od odborníků s latinskou terminologií, ani my toto podle zásad Wiki nemáme zavádět. Ostatně neznám Wikislovník, který by upřednostnil cizí názvosloví před vlastním, takže ani není komu jít s tou internacionalizací naproti. Palu 7. 2. 2010, 12:41 (UTC)
                • No jestli ono to nebude tím, že v řadě jazyků jsou ta slova odvozena od oněch termínů...
                  Danny B. ( diskusemail přehled příspěvků ) 7. 2. 2010, 12:48 (UTC)
                • Jinak bude asi zábavné mít tu věci jako podstatné jméno, číslo jednotné,... a k tomu synonymum, substantivní vazba, nominativ...
                  Danny B. ( diskusemail přehled příspěvků ) 7. 2. 2010, 12:51 (UTC)
                  • V řadě ano, v řadě ne a řada používá stejně jako čeština obé. Bude dobré si udělat přehled. Mezi ty, co používají obojí a upřednostňují na Wikislovníku latinské názvy patří němčina, holandština a dánština, případně většina románských jazyků, které z latiny vychází. Tudíž jsem neměl úplně pravdu, pardon, to vychází z mé nepřipravenosti. Finský, dolnolužický, hornolužický a norský jazyk používají ppod. pouze latinskou variantu. Zbytek jazyků, mezi něž patří slovanské (kromě jmenovaných dvou), maďarský, keltské, turkické, arabské, některé germánské a ppod. všechny neevropské jazyky používají (ppod.) pouze své národní názvy, a to i na Wikislovníku, pokud jsem se dobře díval. Ppod. budou znát i latinské názvy, ale jen ve velmi odborné sféře, ne ve slovnících a obvyklém užití. Toto zjištění platí pro substantivum. Předpokládám, že další budou obdobné či mírně ve prospěch národního názvosloví, protože substantivum patří mezi ty mezinárodnější slova z lingvistického názvosloví (oproti třeba inanimatum, které třeba čeština skoro nezná, kromě ryze odborné sféry).
                  • Jinak u synonym jde o slovo, které je velmi zažité, jeho česká varianta je spíše zastaralá a slovníky jej běžně užívají. U nominativu je situace taková, že kdybychom to pojmenovali zavedeně 1. pád, vzniknou nejednoznačnosti v cizích jazycích. Tím pádem je toto nutné z technického hlediska. A substantivní vazba je natolik odborný termín, že se v literatuře vyskytuje jen takto a laika navíc moc zajímat nebude. Tudíž možná Vám to přijde, že to bude vypadat špatně, ale mě to přijde celkem v pořádku. Jsou to nenahraditelné výjimky. Takovýto mix prostě slovníky používají. Palu 7. 2. 2010, 13:25 (UTC)
                    • Bych prosil nemíchat dohromady obsah hesel a kategorizaci, zatímco obsah hesel by měl být široce srozumitelný, a tedy dokud nebudou k dispozici určité nástroje tak bych do nich výrazněji nezasahoval, kategorizace slouží především k setřídění obsahu a jakožto taková, odborná terminologie v řadě případů přináší po technické stránce v tomto lepší výsledky. Vůbec, co se týče používání odborné terminologie, tak to není žádný vlastní výzkum, tedy to není nic proti principům wiki. Krom toho znalost celé řady odborných termínů, mezi nimi i názvy sedmi českých pádů, názvy 10 českých slovních druhů a dalších, patří k současnému všeobecnému středoškolskému vzdělání, tudíž by tyto prvky nijak výrazně srozumitelnost snižovat neměly. --Reaperman 7. 2. 2010, 14:01 (UTC)
                      • Asi to není vlastní výzkum, ale když odborníci užívají v obdobných projektech nějaké názvosloví, proč bychom my měli užívat jiné? Z prestižních důvodů? Z důvodu sbližování s ostatními Wikiprojekty asi ne, jak se mi myslím podařilo ukázat. Pokud by to bylo jen v kategoriích, tak mi to nevadí, ale jestli se to zavede i v heslech, tak to pro všechny srozumitelné určitě nebude. Nevím, co jste probírali vy na škole, možná jste byl na gymnáziu a tam se to asi probírá lépe, ale u nás na elektrotechnické průmyslovce a na obchodní akademii jsme tohle nebrali. A pochybuji, že kdo se jazykem nezabývá, si ty názvy zapamatuje i přesto, že to třeba ve škole bral. Možná pár procent svědomitých žáků. Viz případ Juana, který má také střední školu a přesto mu dělají latinské názvy problémy. A to nemluvím o tom, že zdaleka ne všichni mají středoškolské vzdělání. Palu 7. 2. 2010, 14:31 (UTC)
    • Pro, wikislovník to jen pozvedne. --Lenka64 5. 2. 2010, 15:51 (UTC)
    • Velmi rozpačitý - ač mám gymnázium, některé latinské názvy zde vidím poprvé. Má Wikislovník být pro odborníky a roboty, nebo pro běžné čtenáře? Možné provizorí řešení - kategorie Česká substantiva (nebo cs-substatniva) bude mít jako úvodní text uvedeno Česká podstatná jména. JAn Dudík 15. 2. 2010, 21:53 (UTC)
  2. jednotné tvary názvosloví kategorie, v žádném případě nepoužívat adjektivní názvy (ideálně viz i následující bod)
    • Jsem pro sjednocení, ale nijak extrémně. Ale spíše jsem při sjednocení proti tvarům jako "substantivum", i české slovníky hojně používají tvary jako "přídavné jméno", znepřehlední to užití pro běžné uživatele - opět viz příklad Juan. Tedy jestli jste to myslel takhle. Ono je sice hezké, že bychom byli "na úrovni", ale především bych byl raději, kdybychom byli zdrojem informací pro veřejnost, která má ze školy zažité spíše ty české tvary. Tu úroveň pak můžeme nahnat např. kvalitou hesel nebo komplexností podávaných informací (viz ještě mojí odpověď u bodu 1., s kterým tento úzce souvisí). Palu 5. 2. 2010, 10:18 (UTC)
      • "Neextrémní" sjednocení je k ničemu. Čím více výjimek, tím méně nástrojů. Viz následující bod. Celková kvalita Wikislovníku není obsahem této diskuse. Diskusi na toto téma lze založit a vést jinde.
        Danny B. ( diskusemail přehled příspěvků ) 5. 2. 2010, 10:54 (UTC)
    • Pro. --Lenka64 5. 2. 2010, 15:51 (UTC)
  3. důsledně používat kódy jazyka a ne slovní názvy (maximální výjimkou by asi byly kořenové kategorie jazyků, i když ani tam to není třeba)
    • Jsem velmi mírně proti, nebude to ani hezké/příjemné na pohled, ani přehledné pro uživatele/editory, kteří budou jen ztěží odhadovat ten který kód. Stávající stav (Česká substantiva) je v tomto podle mého názoru vyhovující. A pokud by to prošlo, pak bych alespoň kořenovou kategorii jazyků nechal celým názvem pro usnadnění orientace. Palu 5. 2. 2010, 10:18 (UTC)
      • Je třeba si uvědomit, že verbální názvy kategorií jsou příčinou toho, proč neexistuje řada nástrojů, které by značně ulehčily práci s Wikislovníkem, neboť ty jsou právě z většiny závislé na kódu jazyka.
        Danny B. ( diskusemail přehled příspěvků ) 5. 2. 2010, 10:54 (UTC)
        • Pokud by toto byl jediný důvod, pak je tu sice trochu pracná varianta, že udělám tabulku, kde bude v řádku cs=Česká=Čeština atp. a je vyřešeno. Ale když tak nad tím přemýšlím, pokud se zruší sekundární kategorizace, pak se uvolní i tento styl kategorizování a tudíž už proti ani tak nejsem. Hlavně mít ten kořen celým slovem, aby se dalo orientovat mezi jazyky. Palu 5. 2. 2010, 11:17 (UTC)
          • A co by se tou tabulkou vyřešilo? Zrušení tematické kategorizace s tím nemá nic společného. Formátů názvů kategorií je řada, tomu se věnuje bod 6.
            Danny B. ( diskusemail přehled příspěvků ) 5. 2. 2010, 11:35 (UTC)
    • Souhlas. --Lenka64 5. 2. 2010, 15:51 (UTC)
  4. tematickou kategorizaci zrušit
    • A současně zavést sekce "hyperonyma" a "hyponyma". Palu 5. 2. 2010, 10:18 (UTC)
      • To je nesouvisející se systémem kategorizace, tedy je třeba to řešit zvlášť někde jinde.
        Danny B. ( diskusemail přehled příspěvků ) 5. 2. 2010, 10:54 (UTC)
        • To není pravda. Systém hyperonym a hyponym je přesně to, co nám umožňuje kategorizovat a ač to z praktického hlediska funkci kategorizace zcela nenahradí a slouží to k něčemu jinému, jistě to pomůže některým lidem, kteří budou potřebovat právě něco kategorizovat. Když jim vezmeme kategorizaci a nedáme něco podobného, pak se sníží komplexnost dostupných informací, což je zcela zbytečné a spíše kontraproduktivní. Tedy není to úzce související, ale související to je. Palu 5. 2. 2010, 11:17 (UTC)
          • Opakuji, že tady se vede diskuse o kategorizaci. Diskuse o jiných věcech, nechť se vede jinde, jinak tady z toho opět vznikne akorát nepřehledná plkárna, z níž nevzejde žádný výsledek.
            Danny B. ( diskusemail přehled příspěvků ) 5. 2. 2010, 11:35 (UTC)
  5. ne více než dvoukritériové kategorie, a i těm se v rámci možností maximálně vyhýbat
    • Tady přesně nevím, jak to myslíte, tedy co přesně znamená dvoukriteriová kategorie. Palu 5. 2. 2010, 10:18 (UTC)
      • Dvoukritériová kategorie je ta, jak dané adjektivum napovídá, která kategorizuje podle dvou kritérií. Tak nějak mne nenapadá,co k tomu říct více...
        Danny B. ( diskusemail přehled příspěvků ) 5. 2. 2010, 11:35 (UTC)
        • Je hezké, že ze mě umíte vždy tak elegantně udělat blbce :-) ... Tohle rozuzlení mě napadlo, ale nevím jak je to myšleno. Že Česká slovesa nepůjdou do Češtiny a do Sloves, ale jen do Češtiny? Pokud ano, tak k čemu to bude dobré, kromě znepřehlednění? Palu 5. 2. 2010, 14:46 (UTC)
          • Ach jo, pokud kategorizuje, tak není kategorizována, což je váš příklad. Česká verba je dvoukritériová kategorie - patří do ní hesla která jsou verba AND jsou česká. Kategorie Čeština je jednokritériová. Už?
            Danny B. ( diskusemail přehled příspěvků ) 5. 2. 2010, 15:05 (UTC)
            • Už. V tom případě souhlas. Palu 5. 2. 2010, 16:10 (UTC)
    • Jasně. --Lenka64 5. 2. 2010, 15:51 (UTC)
  6. formát názvosloví (vycházeje z bodů především 2, 3 a také 1) by měl být takový, aby umožňoval co největší automatizaci a co nejméně práce s opakovanou činností stejného typu
    • Souhlas, ale nepřijde mi šťastné upřednostnit latinské názvosloví. Ale ani to není velká tragédie. Palu 5. 2. 2010, 14:46 (UTC)
    • Ano. --Lenka64 5. 2. 2010, 15:51 (UTC)
  7. upřednostnit šířku před hloubkou (váže se na bod 5)
    • Ano. --Lenka64 5. 2. 2010, 15:51 (UTC)
      • Lence: <humor>Někdy si kladu otázku, zda nejste Dannyho loutkou :-)</humor> Pravidelná nepodmíněná 100% shoda Vašich názorů je fascinující :-) Palu 5. 2. 2010, 16:10 (UTC)
        • <humor>Palu:to víte, když s někým žijete tak dlouho, už máte i podobné názory....</humor> --Lenka64 5. 2. 2010, 16:17 (UTC)
          • No tak to já jsem nevěděl. Palu 5. 2. 2010, 16:21 (UTC)
  8. Kam symboly? Mít je tu vůbec?
  9. Hesla podle subjektu vs. Subjekt. Dávám přednost variantám Jazyk(y), Slovní druh(y), u Lingvistická/é kategorie bych se pokusil najít jiný název, ale právě teď mne nic nenapadá a mezitím bych zapomněl, že jsem chtěl napsat tuto poznámku.