Diskuse k šabloně:ČNK
K šabloně
[editovat]Díky za šablonu, velmi užitečná. Pár poznámek: proč se nejmenuje "ČNK", což by bylo mnohem intuitivnější? Za další, ČNK má vícero korpusů a každý dává jiné výsledky. Např. korpus syn2020 má pro slovo "čurák" 137 výsledků, korpus syn_v11 jich má 837. Název korpusu by proto rozhodně měl být v odkazu uveden. A poslední otázka, není možné, že ten "písmenkosalát" za čas přestane fungovat? Amsavatar (diskuse) 23. 4. 2023, 17:49 (CEST)
- ČNK jsem zvažoval, ale protože ČNK poskytuje i jiné funkce než vyhledávání via KonText, rozhodl jsem se pro tento název. Na názvu netrvám.
- Ohledně onoho písmenkosalátu, ten je nešťastný, ale nic lepšího v tuto chvíli neumím. Pokud se ukáže, že písmenkosalát vyprší, tak holt nezbyde než odkázat uživatele pouze na vyhledávací formulář a instruovat ho, aby heslo do políčka zadat sám ručně. Co vidím, tak URL transparentně údaje neobsahuje. Existuje ještě toto:
- A toto URL je prima, ale neukazuje tolik nalezených vět, jako KonText. Bylo by ideální, kdyby z této stránky vedl odkaz přímo do KonTextu, ale to nevede. Čili je na zvážení založit šablonu i pro toto slovo v kostce. Mě šlo hlavně o příklady užití, protože jsou pro přemýšlení o definici klíčové.
- Ohledně názvu korpusu: nu dobrá, ten je sice nějak nejspíš kódovaný v písmenkosalátu, ale ideálně by měl být i uveden, a tedy snad zadán ručně via parametr. Moc se mi do toho nechce. Uvidíme, zda ty ídéčka nevyprší, a pak by to bylo stejně marné úsilí.
- Kdyby někoho z ČNK napadlo předělat ta URL na něco přívětivého (slovo=lživý&korpus=syn2020 nebo i korpus=4, vyhledat číslo korpusu už zvládneme), to by bylo velmi dobré. --Dan Polansky (diskuse) 23. 4. 2023, 18:02 (CEST)
- Když v tom "písmenkosalátu" změním pár znaků, tak to dá chybu "Neplatný nebo vypršelý dotaz". Takže to vypadá, že ty dotazy ukládají někde v databázi a jednou za čas to promažou... Jinak mě napadá, že by mohlo fungovat přesměrování na nějaký web, který by jakoby za uživatele vyplnil ten formulář. A nebo případně simulovat odeslání toho formuláře JavaScriptem. --Amsavatar (diskuse) 23. 4. 2023, 18:14 (CEST)
- Obecně ne každý salát je platný, pravděpodobně, a to i kdyby vypršení nehrozilo. Asi bych počkal pár dní a viděl, co se bude dít. Ono slovo "vypršelý" nicméně dává tušit, že vypršení opravdu hrozí.
- Podobné kejkle udělaly turecké slovníky: svého času měly hezké použitelné URL, ale pak to nějak předělaly a bylo po legraci. Nechápu moc proč; že na ně někdo odkazuje by jim přece vadit nemuselo. Možná se bojí nějakých strojových sosačů. Ale proč je tedy URL pro slovo v kostce příčetné?
- Ohledně simulace JavaScriptem nevím; nikdy jsem takovou referenční/odkazovou šablonu nedělal. --Dan Polansky (diskuse) 23. 4. 2023, 18:20 (CEST)
- Když v tom "písmenkosalátu" změním pár znaků, tak to dá chybu "Neplatný nebo vypršelý dotaz". Takže to vypadá, že ty dotazy ukládají někde v databázi a jednou za čas to promažou... Jinak mě napadá, že by mohlo fungovat přesměrování na nějaký web, který by jakoby za uživatele vyplnil ten formulář. A nebo případně simulovat odeslání toho formuláře JavaScriptem. --Amsavatar (diskuse) 23. 4. 2023, 18:14 (CEST)
- Tak jsem našel, že tvorba trvalých odkazů je dokonce zmíněna v manuálu -
Další možností, jak předávat a citovat výsledky, je uložit si odkaz (URL) vedoucí přímo k výsledku. Po zadání tohoto odkazu do prohlížeče může kdokoli, kdo má přístup ke korpusům ČNK (a konkrétně ke korpusu, na němž byly výsledky vytvořeny), vyvolat stejný výsledek hledání.
Vypadá to, že to funguje dobře, ale až po přihlášení. Odkazy jsou buď trvalé a nebo vyprší za 14 dní. Tento odkaz: https://www.korpus.cz/kontext/view?q=~ISyUIsoGA6aq by měl být trvalý :)) --Amsavatar (diskuse) 23. 4. 2023, 18:54 (CEST)- Děkuji. Odkaz výše přesměruje sem:
- Nevím, zda mám předělat URL na to vaše, nicméně to lze provést vždy. Příhlášený do korpusu nejsem a výsledky mi to ukazuje. Odkazy by ideálně měly fungovat pro nepřihlášené. --Dan Polansky (diskuse) 23. 4. 2023, 19:00 (CEST)
- Tak jsem našel, že tvorba trvalých odkazů je dokonce zmíněna v manuálu -
- Přihlášení je vhodné jednak pro snadnější vytváření těch odkazů, ale hlavně tam píšou, že ty odkazy defaultně vyprší za 14 dní, což nejspíš zahrnuje odkazy vytvořené nezaregistrovanými uživateli. Oproti tomu jako zaregistrovanému mi tam výslovně píšou, že odkaz je trvalý, tak nemám důvod tomu nevěřit. Odkazy fungují pro nepřihlášené, pokud to jsou korpusy pro všechny, některé možná jsou viditelné jen přihlášeným, mají tam např. možnost tvorby vlastních subkorpusů, tak ty by asi všem viditelné nebyly. --Amsavatar (diskuse) 23. 4. 2023, 19:09 (CEST)
- To o tom vypršení za 14 dní píšou kde? (Věřím tomu, jen si to chci také přečíst.) --Dan Polansky (diskuse) 23. 4. 2023, 20:09 (CEST)
- Přihlášení je vhodné jednak pro snadnější vytváření těch odkazů, ale hlavně tam píšou, že ty odkazy defaultně vyprší za 14 dní, což nejspíš zahrnuje odkazy vytvořené nezaregistrovanými uživateli. Oproti tomu jako zaregistrovanému mi tam výslovně píšou, že odkaz je trvalý, tak nemám důvod tomu nevěřit. Odkazy fungují pro nepřihlášené, pokud to jsou korpusy pro všechny, některé možná jsou viditelné jen přihlášeným, mají tam např. možnost tvorby vlastních subkorpusů, tak ty by asi všem viditelné nebyly. --Amsavatar (diskuse) 23. 4. 2023, 19:09 (CEST)
- Když přihlášený v ČNK kliknu na Trvalý odkaz, tak ho tam vidím a pod ním je "Zrušit permanentní status". Když na to kliknu, tak to píše následující:
URL odkazy výsledků v KonTextu jsou implicitně platné po dobu 14 dní. Chcete-li odkazovat na konkordanci bez časového omezení (např. v publikovaném článku), použijte tuto funkci.
- Jinak v hesle rigidní už ten odkaz na ČNK nefunguje... --Amsavatar (diskuse) 25. 4. 2023, 20:37 (CEST)
- Děkuju moc. To by chtělo nějak zdokumentovat přímo v šabloně. Přinejhorším se odkáže jen do vyhledávacího formuláře, kde lze přes URL vybrat alespoň korpus, a do textu se napíše něco jako "Heslo nutno do formuláře zadat ručně", nebo co myslíte? Podle mě je užitečné uživatele nakopnout, že má jít do ČNK, i kdyby si musel heslo vyplnit sám, a nakopnout ho, že syn_v11 je v tuto chvíli ten ideální agregovaný korpus. -Dan Polansky (diskuse) 25. 4. 2023, 20:41 (CEST)
- Když přihlášený v ČNK kliknu na Trvalý odkaz, tak ho tam vidím a pod ním je "Zrušit permanentní status". Když na to kliknu, tak to píše následující:
- (zpět) Řeknu to takto: já se tam přihlašovat nehodlám a také si nemyslím, abychom měli chtít po vkladatelích, aby se přihlašovali. Takže by to chtělo nastavit q= jako volitelný: když bude vyplněn někým, kdo se zaregistroval, pak se použije, a když vyplněn nebude, tak se odkáže jen na formulář. --Dan Polansky (diskuse) 25. 4. 2023, 20:55 (CEST)
- Jenže ta šablona sama nemá šanci jak poznat, zda ten kód vložil zaregistrovaný nebo nezaregistrovaný uživatel... To by asi musel pravidelně kontrolovat nějaký bot, jestli ten link funguje nebo ne... Imho nejlepší by bylo, aby ty odkazy nevytvářeli nazaregistrovaní uživatelé, což už jsem do té šablony v neděli psal... --Amsavatar (diskuse) 25. 4. 2023, 21:00 (CEST)
- Pravda. Nicméně tak jak to je, tak přidávání šablony hromadně bude beztak neskutečná piplačka, takže je nakonec otázka, zda spíše na ty kvéčka nevrcichtovat (nevzdát se jich) a nedoporučit uživatelům, aby to hromadně zadávali bez q= per default, a jen když se jim bude hodně chtít, tak ať se zaregistrují a pak zadají q=. --Dan Polansky (diskuse) 25. 4. 2023, 21:03 (CEST)
- Jenže ta šablona sama nemá šanci jak poznat, zda ten kód vložil zaregistrovaný nebo nezaregistrovaný uživatel... To by asi musel pravidelně kontrolovat nějaký bot, jestli ten link funguje nebo ne... Imho nejlepší by bylo, aby ty odkazy nevytvářeli nazaregistrovaní uživatelé, což už jsem do té šablony v neděli psal... --Amsavatar (diskuse) 25. 4. 2023, 21:00 (CEST)
- "Písmenkosaláty" jsou hashované dotazy, takže z nich nelze zpětně nic odvodit. Že obecně vyprchávají, se lze přesvědčit vyzkoušením tří takovýchto kdysi vyrobených odkazů na korpus, vyhledatelných
insource:/q=[~]/
. Ale je to sále lepší než náhodné ID. —Mykhal (diskuse) 29. 4. 2023, 09:49 (CEST)- Jojo, mnou vložené písmenkosaláty vyprchávají, protože jsem nebyl přihlášen do ČNK. Ty co vložil Amsavatar by měly vydržet, neb on se do ČNK přihlásil. Pořád chovám jakousi skomírající naději, že by provozovatel ČNK mohl zprovozni URL ve stylu "korpus=syn_v11&výraz=kočka"; snad někdy v budoucnu. --Dan Polansky (diskuse) 29. 4. 2023, 09:52 (CEST)
Název šablony
[editovat]Šablonu jsem založil na názvu "ČNKKonText" a nikoli "ČNK", protože ČNK poskytuje i jiné funkce než vyhledávání via KonText. Jak jsem vysvětlil. Nemám nejmenší chuť se o to přetahovat. Aby někdo poté, co jsem vysvětlil zdůvodnění pro mnou zvolené jméno šablony, toto přesunul na jméno, jehož menší vhodnost jsem vysvětlil, mi přijde dost neomalené. --Dan Polansky (diskuse) 23. 4. 2023, 19:35 (CEST)
- Troufám si říct, že ta funkce KonText je primární funkcí korpusu a bude lidským editorem používána nejčastěji, tak mu zkrácením názvu šablony ušetříme pár sekund života. Odkazy na "Slovo v kostce" by šly vytvořit roboticky. Jinak se nechci hádat o vlnku v query, ale pokud jste ji odstranil ze šablony, tak je nutné opravit všechny vložení šablony, jinak ty odkazy nebudou fungovat.--Amsavatar (diskuse) 23. 4. 2023, 19:58 (CEST)
- Prvně jde o jednoznačnou identifikaci odkazovaného artefaktu; tu jste pokazil. Dále IJP ze svých hesel odkazuje na https://www.korpus.cz/slovo-v-kostce/search/cs/lživý?pos=A&lemma=kočka, čili oni si myslí, že tento souhrn je primární, a tento souhrn ani nezačíná výpisem vět z korpusu; čili je otázné, zda existuje něco jako na uživatelích nezávislá "primární funkce": --Dan Polansky (diskuse) 23. 4. 2023, 20:01 (CEST)
- K vlnce jsem založil dedikovaný oddíl, tak prosím tam. --Dan Polansky (diskuse) 23. 4. 2023, 20:02 (CEST)
- Název "ČNKKontext" je divný, když už to rozlišovat, tak "ČNK-KonText". Ale já se musím pro dnešek rozloučit. Hezký večer.--Amsavatar (diskuse) 23. 4. 2023, 20:11 (CEST)
- Co kdybyste si po sobě odmazal ty vlnky, co jste tam chvatem a bez diskuze napřidával? Jinak děkuji za spolupráci a za výzkumy. --Dan Polansky (diskuse) 23. 4. 2023, 20:15 (CEST)
- V Kategorie:Šablony:Zdroje dominují názvy šablon bez mínusu a s mezerou, takže spíš "ČNK KonText" s mezerou, ale mínus též může být. Jsou tam však i AfrikaLingea, ColMon či Diderot1999. --Dan Polansky (diskuse) 23. 4. 2023, 20:30 (CEST)
- Hm, asi jsem ovlivněný německým Wikislovníkem, kde se většina šablon jmenuje ve tvaru Ref-něco-něco. Obdobná šablona se jmenuje Ref-DWDS-Korpus, ale je tam třeba též šablona Ref-UniLeipzig. Velmi by se mi líbilo to, kdyby všechny referenční šablony měly jednotný název ve tvaru Ref-kód jazyka-název, ale jednak to není ani důsledně používáno na de.wikt a pak by to byla velká změna, a asi zde je neprosaditelná. Takže když to shrnu, asi mi je nakonec jedno, jak se tato šablona jmenuje.--Amsavatar (diskuse) 25. 4. 2023, 19:32 (CEST)
- Jak vidíte, tak jsem to zatím nechal na ČNK. Čtenáři to poslouží a může mu být více méně jedno, co je ve wiki textu. Zcela špatně to není, jen suboptimální. A že je to suboptimální je vaše odpovědnost. Mohl jste méně zbrkle nejprve diskutovat a pak teprve přesouvat a předělávat, co není vaše iniciativa. Ale jde to i po vašem; někdy moudřejší prostě ustoupí.
- Pojmenovat všechny referenční šablony na "R:" by se mi líbilo, nebo i "Ref-" ale "R:" dělá více projektů, ale když to dám Pod lípu, tak tam přistane od Palu opozice, nekonečná diskuze o ničem a ostatní se nevyjádří, takže to ani nezkouším. --Dan Polansky (diskuse) 25. 4. 2023, 19:38 (CEST)
- Hm, asi jsem ovlivněný německým Wikislovníkem, kde se většina šablon jmenuje ve tvaru Ref-něco-něco. Obdobná šablona se jmenuje Ref-DWDS-Korpus, ale je tam třeba též šablona Ref-UniLeipzig. Velmi by se mi líbilo to, kdyby všechny referenční šablony měly jednotný název ve tvaru Ref-kód jazyka-název, ale jednak to není ani důsledně používáno na de.wikt a pak by to byla velká změna, a asi zde je neprosaditelná. Takže když to shrnu, asi mi je nakonec jedno, jak se tato šablona jmenuje.--Amsavatar (diskuse) 25. 4. 2023, 19:32 (CEST)
- Název "ČNKKontext" je divný, když už to rozlišovat, tak "ČNK-KonText". Ale já se musím pro dnešek rozloučit. Hezký večer.--Amsavatar (diskuse) 23. 4. 2023, 20:11 (CEST)
Vlnka nechť není součást řetězce
[editovat]Tak jsem to založil a tak mi to dává největší smysl. Všechny řetězce začínají vlnkou. --Dan Polansky (diskuse) 23. 4. 2023, 19:54 (CEST)
Dvojité poklepání na ídéčko v URL mi vybere ídéčko bez vlnky, takže tak to taky sedí. --Dan Polansky (diskuse) 23. 4. 2023, 20:07 (CEST)
Ukázaný text
[editovat]Teď to ukazuje toto:
- Český národní korpus, korpus syn_v11, heslo lemra.
Oproti tomu jsem to založil takto:
- Český národní korpus - vyhledávání via KonText. Heslo lemra.
Přidání korpusu do identifikace je v pořádku, ale že tam není psáno, že jde o vyhledávání via KonText, je nešťastné, neb ČNK poskytuje i jiné funkce, např. graf frekvence výrazu v čase. --Dan Polansky (diskuse) 23. 4. 2023, 19:58 (CEST)
- Samotný ČNK by si přál citování v tomto tvaru:
Tomáš Machálek (2014): KonText – aplikace pro práci s jazykovými korpusy. FF UK, Praha. Dostupný z WWW: <http://kontext.korpus.cz>.
, viz wiki ČNK. --Amsavatar (diskuse) 25. 4. 2023, 19:36 (CEST)- Fuj tajbl. Tfumňá. Už mě nestrašte doktore, už toho bylo dost. Přitom však ten formát neříká, jaké heslo hledáme ani v jakém korpusu, a kupodivu tam nemají ani to svaté datum přístupu. Dále transparentně ukazovat URL se pro web nehodí. To jsou zase nějaké ty jejich hrátky s citační normou. Aspoň že to příjmení není nepříčetně verzálkami, jak to dělá Wikipedie; to se taky zase někdo zbláznil. --Dan Polansky (diskuse) 25. 4. 2023, 19:40 (CEST)
Nyní máme:
- Český národní korpus, vyhledávání via KonText. Korpus syn_v11, heslo rigidní.
A to je prima. Lze jen diskutovat, zda má být ". Heslo", ale to mi žíly netrhá. --Dan Polansky (diskuse) 25. 4. 2023, 19:42 (CEST)
- Co něco v tomto smyslu?
Český národní korpus, vyhledávání výrazu "rigidní" v aplikaci KonText; korpus: syn_v11.
a neboČeský národní korpus, vyhledávání výrazu "rigidní" v korpusu syn_v11.
--Amsavatar (diskuse) 25. 4. 2023, 19:52 (CEST)- Ale proč? Spíš by měl být odkaz na text "KonText", vedoucí na jejich stránku, kde se čtenář dočte více. Ale není to nepřijatelné; asi jsem to "via" užil tak, jak se normálně nepoužívá. Za mě stručnost velká ctnost, ale zase když tam údaj má být, tak nechť tam je, např. který je to korpus. --Dan Polansky (diskuse) 25. 4. 2023, 19:54 (CEST)
- Možná to souvisí i s tím, že někdo považuje za zcela normální psát "Z přídavného jména "černý" příponou "-ost", místo úderného "Z černý a -ost"; za mě nesmyslná ukecanost k něčemu naprosto triviální. Úplně si představuji nějakého socialistického pracovníka placeného ne od výsledků, ale od normostran a jiných pochybných metrik. --Dan Polansky (diskuse) 25. 4. 2023, 19:56 (CEST)
Počet výskytů?
[editovat]U uloženého vyhledávání lze v šabloně zobrazit též počet výskytů, případně další data (i.p.m. = výskytů na milion pozic, ARF = Průměrná redukovaná frekvence). Amsavatar (diskuse) 27. 4. 2023, 17:28 (CEST)
- No nevím. Nechci to zbrkle nepodmíněně oponovat, ale moc nadšený z toho nejsem. Jak by ten řádek vypadal; nějaký příklad? Spíš je otázka, zda by šablona neměla dát za sebou odkazy dva, jeden do ČNK-KonText a druhý do toho sumárního reportu, na který odkazuje IJP; ten sumární report tady pochopitelně replikovat nechceme, a tam se na jeden klik čtenář dozví mnoho dalších údajů. --Dan Polansky (diskuse) 27. 4. 2023, 17:32 (CEST)
Toto?
- Český národní korpus, vyhledávání via KonText. Korpus syn_v11, heslo rigidní. Výskytů: 33 178; i.p.m.: 5,47; ARF: 16 300,74
To se mi přinejmenším vizuálně moc nelíbí. Menší:
- Český národní korpus, vyhledávání via KonText. Korpus syn_v11, heslo rigidní. Výskytů: 33 178.
To už vypadá docela dobře a každý rozumí, co údaj vyjadřuje. --Dan Polansky (diskuse) 27. 4. 2023, 17:36 (CEST)
- Asi by se to muselo předělat, aby byl výstup třeba "Vyhledávání výrazu pošahanec v ČNK, korpusu syn_v11, dává 63 výskytů." Amsavatar (diskuse) 27. 4. 2023, 17:44 (CEST)
- Jak by vypadal celý řádek? Ten počet přece nemůžete uvést, dokud jste neuvedl, počet čeho, nebo? --Dan Polansky (diskuse) 27. 4. 2023, 17:47 (CEST)
- ? Myslel jsem to tak, že výstup by byl, jak jsem napsal,
Vyhledávání výrazu pošahanec v ČNK, korpusu syn_v11, dává 63 výskytů
. --Amsavatar (diskuse) 27. 4. 2023, 17:54 (CEST)- Hah, jsem slepýš. Čili by se užila zkratka "ČNK", a z ní odkaz někam? A už by se neřeklo že via "KonText"? Zkratku vám ale Palu beztak vyexpanduje na "Český národní korpus". Pak se mi více líbí identifikovat zdroj hned vlevo, jak to činí ostatní šablony, aby to bylo trochu jednotné. Hlavně by měl být odkaz na heslo někde ke konci, aby všechny odkazy byly někde ke konci. Když se všechno dělá trochu jinak, snižuje to uživatelnost.
- A nebo naprosto ideální všechno předělat po vzoru en wikt, kde je odkaz první položka vlevo, což je neobvyčejně pžívětivé, ale to by byl naprostý odchyl od oné zlonormy a téměř jistě neprojde schválením od "komunity", což je termín koextenzivní s termínem "Palu" sowieso. (To abych si posteskl.) --Dan Polansky (diskuse) 27. 4. 2023, 17:59 (CEST)
- Nevím, byl to jen aktuální nápad. Nijak zvlášť na tom netrvám a už vůbec se mi nechce zase předělávat všechny ty hesla.--Amsavatar (diskuse) 27. 4. 2023, 18:09 (CEST)
- Vždyť je též dlužno vážit si svého času a úsilí. Princip je tento: informace odkázaná na jeden klik je pro praktický účel téměř jako kdyby byla v hesle, s jistým zpožděním, než se nahraje cílová stránka. Čili rozdíl mezi linking a embedding není pro praktický účel zase tak velký, byť jistý je. Kopírovat informaci ze zdroje, který je odkázán na jeden klik, není zase tak moc velká hodnota, a stejně je to jen střípek toho, co zdroj nabízí. Co ale je skvělá hodnota je poskytnout skvělý seznam zdrojů dostupných na jeden klik, a ČNK do takového skvělého seznamu patří. --Dan Polansky (diskuse) 27. 4. 2023, 18:13 (CEST)
- Teď ještě zbývá Pod lípou zabránit tomu, aby Palu zablokoval nasazení GBK, další skvělé korpusové šablony: Wikislovník:Pod_lípou#Odkazy_do_Google_Books_skrze_šablonu_GBK. Tam stačí napsat "Podporuji šablonu dle argumentů Dana Polanského" a je to; rozvedení vlastních myšlenek je pochopitelně ještě přesvědčivější. --Dan Polansky (diskuse) 27. 4. 2023, 18:16 (CEST)
- Nevím, byl to jen aktuální nápad. Nijak zvlášť na tom netrvám a už vůbec se mi nechce zase předělávat všechny ty hesla.--Amsavatar (diskuse) 27. 4. 2023, 18:09 (CEST)
- ? Myslel jsem to tak, že výstup by byl, jak jsem napsal,
- Jak by vypadal celý řádek? Ten počet přece nemůžete uvést, dokud jste neuvedl, počet čeho, nebo? --Dan Polansky (diskuse) 27. 4. 2023, 17:47 (CEST)
Amsavatar: Nevím přesně co je uložené vyhledávání. Fungovalo by to tak, že by ten zobrazený výsledek v hesle vždy odpovídal tomu, co čtenář uvidí po kliknutí v ČNK? Pokud ano, tak jsem pro, pokud ne, tak nevím, jestli by to pak nebylo matení.. ? --Palu (diskuse) 27. 4. 2023, 19:56 (CEST)
- Díky za vstup. Už jsem na něj nedočkavě čekal. --Dan Polansky (diskuse) 27. 4. 2023, 20:02 (CEST)
@Palu: Permalink by měl vždycky vést ke stejným výsledkům. Ovšem permalinky může vytvářet jen přihlášený zaregistrovaný uživatel ČNK, ostatní linky celkem rychle expirují, jak se ukazuje. --Amsavatar (diskuse) 27. 4. 2023, 20:48 (CEST)
- A ten permalink ale tedy asi potom nebude odrážet skutečnost, ale něco, co jsme do něj uložili v době uložení, jestli to dobře chápu. A může se potom měnit ta databáze, nebo ta už je prostě daná a nedoplňuje se? Nebo jinými slovy - ten permalink bude ukazovat nějaký ustrnulý výsledek. Pokud se ta databáze vyvíjí, tak časem ten permalink zastará a my tu budeme zobrazovat zastaralá data. Pokud ne, tak je permalink ok.
- Ale je to vlastně ještě širší, protože se to netýká jen počtu výsledků zobrazených v heslech, ale i samotných zobrazených výsledků po kliknutí na permalink. Zobrazí to výsledek z tehdy, ale je to tehdy stejné jako dnes, zítra, potom, nebo se databáze mění a my tu budeme mít zastaralý odkaz a muset ho pravidelně aktualizovat? --Palu (diskuse) 27. 4. 2023, 20:59 (CEST)
- ČNK se vyvíjí, syn_v11 znamená 11. verze korpusu syn. Další zřejmě bude syn_v12. Jednou zveřejněný korpus (resp. verze) se už ale dále nemění a tak to uložené vyhledávání by odteď mělo vždy dávat stejné výsledky, v tom je ten princip. Perma=trvalý. --Amsavatar (diskuse) 27. 4. 2023, 21:39 (CEST)
- OK, díky za vysvětlení. Tak v takovém případě mi uvádění počtu výskytů dává smysl. --Palu (diskuse) 27. 4. 2023, 21:55 (CEST)
- ČNK se vyvíjí, syn_v11 znamená 11. verze korpusu syn. Další zřejmě bude syn_v12. Jednou zveřejněný korpus (resp. verze) se už ale dále nemění a tak to uložené vyhledávání by odteď mělo vždy dávat stejné výsledky, v tom je ten princip. Perma=trvalý. --Amsavatar (diskuse) 27. 4. 2023, 21:39 (CEST)
(zpět) Mě by se nechtělo hromadně zadávat počty výskytů, ale uvědomil jsem si, že pro některá hesla by to mělo dobrý smysl, např. zcestný a scestný: čtenář by pouhým porovnáním počtů výskytů přímo v hlavním jmenném prostoru získal dojem pro jejich poměr. Přitom než se nahraje ČNK report někdy docela dlouho trvá, čili mít tento údaj přímo v hesle je výživný/podstatný/bílkovinný rozdíl. Proto jsem pro zavedení volitelného parametru "v=" uvádějícího počet výskytů, a coby iniciátor šablony tento nejspíš brzy přidám, tím spíš, že jak Amsavatar tak Palu v tom vidí smysl; nebo to přidá přede mnou někdo jiný. Na konec řádku bych napsal něco po vzoru tohoto příkladu: "Výskytů: 357." Formát výstupu lze ostatně po dohodě, klidně prosté většiny, později upravit. --Dan Polansky (diskuse) 28. 4. 2023, 16:16 (CEST)
Odkazy - jak to funguje?
[editovat]Zkusil jsem si kliknout v hesle sajrajt na link "heslo sajrajt" ale zobrazila se mi jen vyhledávací obrazovka bez žádných výsledků. To musím být přihlášený, nebo to tam zadat ručně nebo? Palu (diskuse) 27. 4. 2023, 21:15 (CEST)
- Pokud byste si přečetl URL, tak byste viděl toto: https://www.korpus.cz/kontext/query?corpname=syn_v11. A tam vidíte, že se předalo pouze jméno korpusu. Pokud byste si přečetl řádek odkazu, viděl byste toto: "Český národní korpus, vyhledávání via KonText. Korpus syn_v11, heslo sajrajt. Heslo nutno do pole zadat ručně." A tam je onen text o nutnosti zadat ručně. Pouhým přečtením stránky šablony by toto však mělo být zřejmé; je to tam zdokumentované. Q= čili permalink je vyplněn např. v hesle artefakt. Dále bych rád poukázal na to, že 2+2=4. To se získá tak, že si vezmeme počet teček .. a .. a ten porovnáme s počtem v ....; no a ono to v součtu pak vyjde. --Dan Polansky (diskuse) 27. 4. 2023, 21:33 (CEST)
- Zajímavé, protože já tam vidím něco jiného: "Český národní korpus, vyhledávání via KonText. Korpus syn_v11, heslo sajrajt." Každopádně i kdybych tam viděl co píšete, tak je to klamání uživatele, který se na heslo sajrajt nedostane - a nějak nechápu smysl takového odkazu. --Palu (diskuse) 27. 4. 2023, 21:53 (CEST)
- Tak historii revizí číst umíte, gel? A tam uvidíte, že mezitím Auvajs do hesla "sajrajt" vložil q=. Nebo?
- I odkaz bez q= je o moc lepší než nic. Trkne uživatele: hele, existuje dobrý korpus a je tam a tam, koukni do něj. Slovo v něm je, jen ho tam musíš zadat ručně, to je ruk cuk. A my za tebe via URL předvyplníme, že se má hledat v syn_v11, protože my víme, že je to ten nejprimovnější, nejšmekrovnější agregovanej korps. To jako fakt, nekecáme. My na tom bócháme fest, koukáme co je dobrý, a pak ti to doporučíme. Je to fakt primovní. Takže tak. Za mě jasná zásadní hodnota. --Dan Polansky (diskuse) 27. 4. 2023, 22:13 (CEST)
- Tak to by asi fungovalo úplně stejně, kdyby to bylo napsáno trochu pravdivěji, ne? Např. "Český národní korpus, vyhledávání via KonText. Korpus syn_v11 obsahuje heslo sajrajt (nutno zadat ručně)." --Palu (diskuse) 27. 4. 2023, 22:25 (CEST)
- Šlo by pro případ nevloženého permalinku dát tento nebo podobný jiný výstup? --Palu (diskuse) 27. 4. 2023, 22:41 (CEST)
- Souhlasím, že aktuální stav jistě není žádoucí, linkované slovo na prázdný formulář je podfuk. Upravil bych to, kdybych věděl, jaký je kýžený tvar. —Mykhal (diskuse) 29. 4. 2023, 10:12 (CEST)
- Žádný podfuk to není, když řádek šablony jasně říká, že uživatel musí slovo zadat ručně. Pletete si pojmy žádoucí a ideální. Rozhodně je žádoucí mít radši něco než nic, i když ideální to není. A pokud navrhnete jiné znění odkazového řádku, aby si to čtenář lépe uvědomil, tak to je pochopitelně možné. Lze si nechat věci napadnout, dát různé návrhy, popsat možné problémy, možná řešení, jejich výhody a nevýhody, analyzovat hodnotu pro uživatele, a zvolit nejlepší řešení. --Dan Polansky (diskuse) 29. 4. 2023, 10:15 (CEST)
- Paluův návrh vložit "(nutno zadat ručně)" jsem zrealizoval, neboť proč ne, a pokud to více lidi trkne, prima. Čili odkaz se umístí například na text "kočka (nutno zadat ručně)". --Dan Polansky (diskuse) 3. 5. 2023, 17:09 (CEST)
- Souhlasím, že aktuální stav jistě není žádoucí, linkované slovo na prázdný formulář je podfuk. Upravil bych to, kdybych věděl, jaký je kýžený tvar. —Mykhal (diskuse) 29. 4. 2023, 10:12 (CEST)
- Zajímavé, protože já tam vidím něco jiného: "Český národní korpus, vyhledávání via KonText. Korpus syn_v11, heslo sajrajt." Každopádně i kdybych tam viděl co píšete, tak je to klamání uživatele, který se na heslo sajrajt nedostane - a nějak nechápu smysl takového odkazu. --Palu (diskuse) 27. 4. 2023, 21:53 (CEST)
Pismenkosalát
[editovat]Dan Polansky neustále vkládá tento termín, Amsavatar při opětovném vložení tvrdí, že jde o náš wikislovníkový slang, já jsem přitom nic takového neslyšel ani na wikiprojektech ani mimo ně. Může mi to někdo prosím vás vysvětlit? To jste se dohodli na tomhle termínu jakožto naše odteď platné označení před týdnem při založení téhle šablony? Fakt chcete říkat místo Identifikátor nebo query Identifikátor nebo čemu tak říkáte písmenkosalát a ještě to učit ostatní? U minimálek to chápu, je to zkrácení a líp se to vyslovuje než minimální heslo, ale písmenkosalát je lépe vyslovitelný než query identifikátor a ještě je to tu zažité? Palu (diskuse) 29. 4. 2023, 20:10 (CEST)
- Vlastně o nic nejde, ale opravdu nestojím o tom, aby vhazeč vidlí, který všechny mé inciativy pouze obstruuje a sám žádnou iniciativu nikam nedotáhl, pokud vím, tady vůbec něco řešil. Pokud si smažeme hanlivinu "minimálka", která uráží minimální hesla, pak můžeme udělat kompromis a smazat i můj novotvar písmenkosalát, kalk z němčiny, který snad každý rychle pochopil. Ale ideální by bylo, kdyby narušitel, který co jsem viděl se tu přetahoval nyní a v minulých letech se mnou, Auvajsem, Kusurijou, Bazim, Lenkou64 a kdoví s kým ještě, a který si vysloužil taková označení, že potom musel žádat na nástěnce o zakrytí, aby už si konečně hleděl svého a neřešil. --Dan Polansky (diskuse) 29. 4. 2023, 20:13 (CEST)
- Takže jste si vymyslel slovo a během pár dní ho Amsavatar přijal a teď teda musíme všichni říkat tohle a ještě to musíme napsat do šablony. Tak jo, to je hodně bizarní. --Palu (diskuse) 29. 4. 2023, 20:15 (CEST)
- Podle mě je to typická D.P.-ovina, kterou jsem se snažil upravit v popisu šablony, v diskusi to asi nějak skousneme. —Mykhal (diskuse) Mykhal (diskuse) 29. 4. 2023, 20:16 (CEST)
- Ano, jde mi právě o popis šablony. --Palu (diskuse) 29. 4. 2023, 20:17 (CEST)
- No tak ano, vy dva tady bazírujete na heslech se skloňováním. Jenom se tu Mykhalovi jaksi nechce skoro vůbec zakládat nová hesla, jako kdyby to bolelo? A když pak jde doplnit skloňování do mého hesla, pak dává do shrnutí nějaké nejapné osobní poznámky? Takže to je co, donutil, dráb, pohůnek, dohlížeč, nebo jak? --Dan Polansky (diskuse) 29. 4. 2023, 20:20 (CEST)
- Ano, jde mi právě o popis šablony. --Palu (diskuse) 29. 4. 2023, 20:17 (CEST)
- .. Jinak ve zdrojovém kódu korpusu je to označováno opKey (operation key), opId, apod… Ale zdaleka to nemám doprostudováno dostatečně. —Mykhal (diskuse) 29. 4. 2023, 20:24 (CEST)
Palu: Amsavatar při opětovném vložení tvrdí, že jde o náš wikislovníkový slang, já jsem přitom nic takového neslyšel ani na wikiprojektech ani mimo ně. Může mi to někdo prosím vás vysvětlit?
- Tak já vám to vysvětlím: nikde netvrdím, že se jedná o wikislovníkový slang, to jste si kompletně vymyslel... --Amsavatar (diskuse) 29. 4. 2023, 20:28 (CEST)
- Tak v tom případě to vaše shrnutí nechápu. --Palu (diskuse) 29. 4. 2023, 20:32 (CEST)
- OK, beru to na vědomí. --Amsavatar (diskuse) 29. 4. 2023, 20:40 (CEST)
- Tak v tom případě to vaše shrnutí nechápu. --Palu (diskuse) 29. 4. 2023, 20:32 (CEST)
- Ten výraz je tam v závorce pro odlehčení. Je výstižnější než "identifikátor", neb "catOnTheMat" je také identifikátor ale není to salát. Je to docela chytré slovo a ostatně není v pricipu moje; naimportoval jsem ho přes hranici od sousedů, a pak jsem použil kalkovací proces. Mě vadí "minimálka", vám vadí "písmenkosalát". --Dan Polansky (diskuse) 29. 4. 2023, 20:31 (CEST)
- Jenže minimálka je náš slang, zatímco tohle je váš výmysl. --Palu (diskuse) 29. 4. 2023, 20:33 (CEST)
Slovo v kostce
[editovat]Chystám se přidat i odkaz na report "Slovo v kostce", na adrese https://www.korpus.cz/slovo-v-kostce/search/cs/slovo. Sice se mi ten výstup moc nelíbí a mají tam jen málo příkladů, i proto, že dnes jdou na syn2015 místo na syn_v11, ale mají tam i dobré věci. Např. pro slovo "pobuřující"[1] tam mají moc pěkný oddíl "Podobně používaná slova", což jsou něco jako kvazisynonyma či významově související. Celkově je stránka formátovaná nehezky roztahaně a nekompaktně, možná pro mobily, takže jeden musí pořád skrolovat a skrolovat, aby se něčeho dočetl, ale co naděláme. --Dan Polansky (diskuse) 16. 5. 2023, 11:35 (CEST)
Viewmode sentence vs. kwic
[editovat]Defaultní mode je jak se zdá kwic, který ukazuje slovo tak, že je zarovnané do sloupce. Lze ale nastavit i viewmode sentence, které ukazuje často citaci na více řádků a slovo není zarovnané do sloupce. Tento sentence mode je pro účely lexikografie lepší, proto jsem ho nastavil do vyhledávání, kdy je znám písmenkosalát; v URL, do kterého nastavuji pouze název korpusu, mi nastavení viewmode nedělá rozdíl. --Dan Polansky (diskuse) 16. 5. 2023, 23:16 (CEST)