Diskuse k šabloně:ČNK

Z Wikislovníku
Poslední komentář: před 1 rokem od uživatele Dan Polansky v tématu „Viewmode sentence vs. kwic
Skočit na navigaci Skočit na vyhledávání

K šabloně

[editovat]

Díky za šablonu, velmi užitečná. Pár poznámek: proč se nejmenuje "ČNK", což by bylo mnohem intuitivnější? Za další, ČNK má vícero korpusů a každý dává jiné výsledky. Např. korpus syn2020 má pro slovo "čurák" 137 výsledků, korpus syn_v11 jich má 837. Název korpusu by proto rozhodně měl být v odkazu uveden. A poslední otázka, není možné, že ten "písmenkosalát" za čas přestane fungovat? Amsavatar (diskuse) 23. 4. 2023, 17:49 (CEST)Odpovědět

ČNK jsem zvažoval, ale protože ČNK poskytuje i jiné funkce než vyhledávání via KonText, rozhodl jsem se pro tento název. Na názvu netrvám.
Ohledně onoho písmenkosalátu, ten je nešťastný, ale nic lepšího v tuto chvíli neumím. Pokud se ukáže, že písmenkosalát vyprší, tak holt nezbyde než odkázat uživatele pouze na vyhledávací formulář a instruovat ho, aby heslo do políčka zadat sám ručně. Co vidím, tak URL transparentně údaje neobsahuje. Existuje ještě toto:
A toto URL je prima, ale neukazuje tolik nalezených vět, jako KonText. Bylo by ideální, kdyby z této stránky vedl odkaz přímo do KonTextu, ale to nevede. Čili je na zvážení založit šablonu i pro toto slovo v kostce. Mě šlo hlavně o příklady užití, protože jsou pro přemýšlení o definici klíčové.
Ohledně názvu korpusu: nu dobrá, ten je sice nějak nejspíš kódovaný v písmenkosalátu, ale ideálně by měl být i uveden, a tedy snad zadán ručně via parametr. Moc se mi do toho nechce. Uvidíme, zda ty ídéčka nevyprší, a pak by to bylo stejně marné úsilí.
Kdyby někoho z ČNK napadlo předělat ta URL na něco přívětivého (slovo=lživý&korpus=syn2020 nebo i korpus=4, vyhledat číslo korpusu už zvládneme), to by bylo velmi dobré. --Dan Polansky (diskuse) 23. 4. 2023, 18:02 (CEST)Odpovědět
Když v tom "písmenkosalátu" změním pár znaků, tak to dá chybu "Neplatný nebo vypršelý dotaz". Takže to vypadá, že ty dotazy ukládají někde v databázi a jednou za čas to promažou... Jinak mě napadá, že by mohlo fungovat přesměrování na nějaký web, který by jakoby za uživatele vyplnil ten formulář. A nebo případně simulovat odeslání toho formuláře JavaScriptem. --Amsavatar (diskuse) 23. 4. 2023, 18:14 (CEST)Odpovědět
Obecně ne každý salát je platný, pravděpodobně, a to i kdyby vypršení nehrozilo. Asi bych počkal pár dní a viděl, co se bude dít. Ono slovo "vypršelý" nicméně dává tušit, že vypršení opravdu hrozí.
Podobné kejkle udělaly turecké slovníky: svého času měly hezké použitelné URL, ale pak to nějak předělaly a bylo po legraci. Nechápu moc proč; že na ně někdo odkazuje by jim přece vadit nemuselo. Možná se bojí nějakých strojových sosačů. Ale proč je tedy URL pro slovo v kostce příčetné?
Ohledně simulace JavaScriptem nevím; nikdy jsem takovou referenční/odkazovou šablonu nedělal. --Dan Polansky (diskuse) 23. 4. 2023, 18:20 (CEST)Odpovědět
Tak jsem našel, že tvorba trvalých odkazů je dokonce zmíněna v manuálu - Další možností, jak předávat a citovat výsledky, je uložit si odkaz (URL) vedoucí přímo k výsledku. Po zadání tohoto odkazu do prohlížeče může kdokoli, kdo má přístup ke korpusům ČNK (a konkrétně ke korpusu, na němž byly výsledky vytvořeny), vyvolat stejný výsledek hledání. Vypadá to, že to funguje dobře, ale až po přihlášení. Odkazy jsou buď trvalé a nebo vyprší za 14 dní. Tento odkaz: https://www.korpus.cz/kontext/view?q=~ISyUIsoGA6aq by měl být trvalý :)) --Amsavatar (diskuse) 23. 4. 2023, 18:54 (CEST)Odpovědět
Děkuji. Odkaz výše přesměruje sem:
https://www.korpus.cz/kontext/view?viewmode=kwic&pagesize=40&attrs=word&attr_vmode=visible-kwic&base_viewattr=word&refs=%3Ddoc.title&q=~ISyUIsoGA6aq&cutoff=0
Nevím, zda mám předělat URL na to vaše, nicméně to lze provést vždy. Příhlášený do korpusu nejsem a výsledky mi to ukazuje. Odkazy by ideálně měly fungovat pro nepřihlášené. --Dan Polansky (diskuse) 23. 4. 2023, 19:00 (CEST)Odpovědět
Přihlášení je vhodné jednak pro snadnější vytváření těch odkazů, ale hlavně tam píšou, že ty odkazy defaultně vyprší za 14 dní, což nejspíš zahrnuje odkazy vytvořené nezaregistrovanými uživateli. Oproti tomu jako zaregistrovanému mi tam výslovně píšou, že odkaz je trvalý, tak nemám důvod tomu nevěřit. Odkazy fungují pro nepřihlášené, pokud to jsou korpusy pro všechny, některé možná jsou viditelné jen přihlášeným, mají tam např. možnost tvorby vlastních subkorpusů, tak ty by asi všem viditelné nebyly. --Amsavatar (diskuse) 23. 4. 2023, 19:09 (CEST)Odpovědět
To o tom vypršení za 14 dní píšou kde? (Věřím tomu, jen si to chci také přečíst.) --Dan Polansky (diskuse) 23. 4. 2023, 20:09 (CEST)Odpovědět
Když přihlášený v ČNK kliknu na Trvalý odkaz, tak ho tam vidím a pod ním je "Zrušit permanentní status". Když na to kliknu, tak to píše následující: URL odkazy výsledků v KonTextu jsou implicitně platné po dobu 14 dní. Chcete-li odkazovat na konkordanci bez časového omezení (např. v publikovaném článku), použijte tuto funkci.
Jinak v hesle rigidní už ten odkaz na ČNK nefunguje... --Amsavatar (diskuse) 25. 4. 2023, 20:37 (CEST)Odpovědět
Děkuju moc. To by chtělo nějak zdokumentovat přímo v šabloně. Přinejhorším se odkáže jen do vyhledávacího formuláře, kde lze přes URL vybrat alespoň korpus, a do textu se napíše něco jako "Heslo nutno do formuláře zadat ručně", nebo co myslíte? Podle mě je užitečné uživatele nakopnout, že má jít do ČNK, i kdyby si musel heslo vyplnit sám, a nakopnout ho, že syn_v11 je v tuto chvíli ten ideální agregovaný korpus. -Dan Polansky (diskuse) 25. 4. 2023, 20:41 (CEST)Odpovědět
(zpět) Řeknu to takto: já se tam přihlašovat nehodlám a také si nemyslím, abychom měli chtít po vkladatelích, aby se přihlašovali. Takže by to chtělo nastavit q= jako volitelný: když bude vyplněn někým, kdo se zaregistroval, pak se použije, a když vyplněn nebude, tak se odkáže jen na formulář. --Dan Polansky (diskuse) 25. 4. 2023, 20:55 (CEST)Odpovědět
Jenže ta šablona sama nemá šanci jak poznat, zda ten kód vložil zaregistrovaný nebo nezaregistrovaný uživatel... To by asi musel pravidelně kontrolovat nějaký bot, jestli ten link funguje nebo ne... Imho nejlepší by bylo, aby ty odkazy nevytvářeli nazaregistrovaní uživatelé, což už jsem do té šablony v neděli psal... --Amsavatar (diskuse) 25. 4. 2023, 21:00 (CEST)Odpovědět
Pravda. Nicméně tak jak to je, tak přidávání šablony hromadně bude beztak neskutečná piplačka, takže je nakonec otázka, zda spíše na ty kvéčka nevrcichtovat (nevzdát se jich) a nedoporučit uživatelům, aby to hromadně zadávali bez q= per default, a jen když se jim bude hodně chtít, tak ať se zaregistrují a pak zadají q=. --Dan Polansky (diskuse) 25. 4. 2023, 21:03 (CEST)Odpovědět
"Písmenkosaláty" jsou hashované dotazy, takže z nich nelze zpětně nic odvodit. Že obecně vyprchávají, se lze přesvědčit vyzkoušením tří takovýchto kdysi vyrobených odkazů na korpus, vyhledatelných insource:/q=[~]/. Ale je to sále lepší než náhodné ID. —Mykhal (diskuse) 29. 4. 2023, 09:49 (CEST)Odpovědět
Jojo, mnou vložené písmenkosaláty vyprchávají, protože jsem nebyl přihlášen do ČNK. Ty co vložil Amsavatar by měly vydržet, neb on se do ČNK přihlásil. Pořád chovám jakousi skomírající naději, že by provozovatel ČNK mohl zprovozni URL ve stylu "korpus=syn_v11&výraz=kočka"; snad někdy v budoucnu. --Dan Polansky (diskuse) 29. 4. 2023, 09:52 (CEST)Odpovědět

Název šablony

[editovat]

Šablonu jsem založil na názvu "ČNKKonText" a nikoli "ČNK", protože ČNK poskytuje i jiné funkce než vyhledávání via KonText. Jak jsem vysvětlil. Nemám nejmenší chuť se o to přetahovat. Aby někdo poté, co jsem vysvětlil zdůvodnění pro mnou zvolené jméno šablony, toto přesunul na jméno, jehož menší vhodnost jsem vysvětlil, mi přijde dost neomalené. --Dan Polansky (diskuse) 23. 4. 2023, 19:35 (CEST)Odpovědět

Troufám si říct, že ta funkce KonText je primární funkcí korpusu a bude lidským editorem používána nejčastěji, tak mu zkrácením názvu šablony ušetříme pár sekund života. Odkazy na "Slovo v kostce" by šly vytvořit roboticky. Jinak se nechci hádat o vlnku v query, ale pokud jste ji odstranil ze šablony, tak je nutné opravit všechny vložení šablony, jinak ty odkazy nebudou fungovat.--Amsavatar (diskuse) 23. 4. 2023, 19:58 (CEST)Odpovědět
Prvně jde o jednoznačnou identifikaci odkazovaného artefaktu; tu jste pokazil. Dále IJP ze svých hesel odkazuje na https://www.korpus.cz/slovo-v-kostce/search/cs/lživý?pos=A&lemma=kočka, čili oni si myslí, že tento souhrn je primární, a tento souhrn ani nezačíná výpisem vět z korpusu; čili je otázné, zda existuje něco jako na uživatelích nezávislá "primární funkce": --Dan Polansky (diskuse) 23. 4. 2023, 20:01 (CEST)Odpovědět
K vlnce jsem založil dedikovaný oddíl, tak prosím tam. --Dan Polansky (diskuse) 23. 4. 2023, 20:02 (CEST)Odpovědět
Název "ČNKKontext" je divný, když už to rozlišovat, tak "ČNK-KonText". Ale já se musím pro dnešek rozloučit. Hezký večer.--Amsavatar (diskuse) 23. 4. 2023, 20:11 (CEST)Odpovědět
Co kdybyste si po sobě odmazal ty vlnky, co jste tam chvatem a bez diskuze napřidával? Jinak děkuji za spolupráci a za výzkumy. --Dan Polansky (diskuse) 23. 4. 2023, 20:15 (CEST)Odpovědět
V Kategorie:Šablony:Zdroje dominují názvy šablon bez mínusu a s mezerou, takže spíš "ČNK KonText" s mezerou, ale mínus též může být. Jsou tam však i AfrikaLingea, ColMon či Diderot1999. --Dan Polansky (diskuse) 23. 4. 2023, 20:30 (CEST)Odpovědět
Hm, asi jsem ovlivněný německým Wikislovníkem, kde se většina šablon jmenuje ve tvaru Ref-něco-něco. Obdobná šablona se jmenuje Ref-DWDS-Korpus, ale je tam třeba též šablona Ref-UniLeipzig. Velmi by se mi líbilo to, kdyby všechny referenční šablony měly jednotný název ve tvaru Ref-kód jazyka-název, ale jednak to není ani důsledně používáno na de.wikt a pak by to byla velká změna, a asi zde je neprosaditelná. Takže když to shrnu, asi mi je nakonec jedno, jak se tato šablona jmenuje.--Amsavatar (diskuse) 25. 4. 2023, 19:32 (CEST)Odpovědět
Jak vidíte, tak jsem to zatím nechal na ČNK. Čtenáři to poslouží a může mu být více méně jedno, co je ve wiki textu. Zcela špatně to není, jen suboptimální. A že je to suboptimální je vaše odpovědnost. Mohl jste méně zbrkle nejprve diskutovat a pak teprve přesouvat a předělávat, co není vaše iniciativa. Ale jde to i po vašem; někdy moudřejší prostě ustoupí.
Pojmenovat všechny referenční šablony na "R:" by se mi líbilo, nebo i "Ref-" ale "R:" dělá více projektů, ale když to dám Pod lípu, tak tam přistane od Palu opozice, nekonečná diskuze o ničem a ostatní se nevyjádří, takže to ani nezkouším. --Dan Polansky (diskuse) 25. 4. 2023, 19:38 (CEST)Odpovědět

Vlnka nechť není součást řetězce

[editovat]

Tak jsem to založil a tak mi to dává největší smysl. Všechny řetězce začínají vlnkou. --Dan Polansky (diskuse) 23. 4. 2023, 19:54 (CEST)Odpovědět

Dvojité poklepání na ídéčko v URL mi vybere ídéčko bez vlnky, takže tak to taky sedí. --Dan Polansky (diskuse) 23. 4. 2023, 20:07 (CEST)Odpovědět

Ukázaný text

[editovat]

Teď to ukazuje toto:

  • Český národní korpus, korpus syn_v11, heslo lemra.

Oproti tomu jsem to založil takto:

  • Český národní korpus - vyhledávání via KonText. Heslo lemra.

Přidání korpusu do identifikace je v pořádku, ale že tam není psáno, že jde o vyhledávání via KonText, je nešťastné, neb ČNK poskytuje i jiné funkce, např. graf frekvence výrazu v čase. --Dan Polansky (diskuse) 23. 4. 2023, 19:58 (CEST)Odpovědět

Samotný ČNK by si přál citování v tomto tvaru: Tomáš Machálek (2014): KonText – aplikace pro práci s jazykovými korpusy. FF UK, Praha. Dostupný z WWW: <http://kontext.korpus.cz>., viz wiki ČNK. --Amsavatar (diskuse) 25. 4. 2023, 19:36 (CEST)Odpovědět
Fuj tajbl. Tfumňá. Už mě nestrašte doktore, už toho bylo dost. Přitom však ten formát neříká, jaké heslo hledáme ani v jakém korpusu, a kupodivu tam nemají ani to svaté datum přístupu. Dále transparentně ukazovat URL se pro web nehodí. To jsou zase nějaké ty jejich hrátky s citační normou. Aspoň že to příjmení není nepříčetně verzálkami, jak to dělá Wikipedie; to se taky zase někdo zbláznil. --Dan Polansky (diskuse) 25. 4. 2023, 19:40 (CEST)Odpovědět

Nyní máme:

  • Český národní korpus, vyhledávání via KonText. Korpus syn_v11, heslo rigidní.

A to je prima. Lze jen diskutovat, zda má být ". Heslo", ale to mi žíly netrhá. --Dan Polansky (diskuse) 25. 4. 2023, 19:42 (CEST)Odpovědět

Co něco v tomto smyslu? Český národní korpus, vyhledávání výrazu "rigidní" v aplikaci KonText; korpus: syn_v11. a nebo Český národní korpus, vyhledávání výrazu "rigidní" v korpusu syn_v11. --Amsavatar (diskuse) 25. 4. 2023, 19:52 (CEST)Odpovědět
Ale proč? Spíš by měl být odkaz na text "KonText", vedoucí na jejich stránku, kde se čtenář dočte více. Ale není to nepřijatelné; asi jsem to "via" užil tak, jak se normálně nepoužívá. Za mě stručnost velká ctnost, ale zase když tam údaj má být, tak nechť tam je, např. který je to korpus. --Dan Polansky (diskuse) 25. 4. 2023, 19:54 (CEST)Odpovědět
Možná to souvisí i s tím, že někdo považuje za zcela normální psát "Z přídavného jména "černý" příponou "-ost", místo úderného "Z černý a -ost"; za mě nesmyslná ukecanost k něčemu naprosto triviální. Úplně si představuji nějakého socialistického pracovníka placeného ne od výsledků, ale od normostran a jiných pochybných metrik. --Dan Polansky (diskuse) 25. 4. 2023, 19:56 (CEST)Odpovědět

Počet výskytů?

[editovat]

U uloženého vyhledávání lze v šabloně zobrazit též počet výskytů, případně další data (i.p.m. = výskytů na milion pozic, ARF = Průměrná redukovaná frekvence). Amsavatar (diskuse) 27. 4. 2023, 17:28 (CEST)Odpovědět

No nevím. Nechci to zbrkle nepodmíněně oponovat, ale moc nadšený z toho nejsem. Jak by ten řádek vypadal; nějaký příklad? Spíš je otázka, zda by šablona neměla dát za sebou odkazy dva, jeden do ČNK-KonText a druhý do toho sumárního reportu, na který odkazuje IJP; ten sumární report tady pochopitelně replikovat nechceme, a tam se na jeden klik čtenář dozví mnoho dalších údajů. --Dan Polansky (diskuse) 27. 4. 2023, 17:32 (CEST)Odpovědět

Toto?

  • Český národní korpus, vyhledávání via KonText. Korpus syn_v11, heslo rigidní. Výskytů: 33 178; i.p.m.: 5,47; ARF: 16 300,74

To se mi přinejmenším vizuálně moc nelíbí. Menší:

  • Český národní korpus, vyhledávání via KonText. Korpus syn_v11, heslo rigidní. Výskytů: 33 178.

To už vypadá docela dobře a každý rozumí, co údaj vyjadřuje. --Dan Polansky (diskuse) 27. 4. 2023, 17:36 (CEST)Odpovědět

Asi by se to muselo předělat, aby byl výstup třeba "Vyhledávání výrazu pošahanec v ČNK, korpusu syn_v11, dává 63 výskytů." Amsavatar (diskuse) 27. 4. 2023, 17:44 (CEST)Odpovědět
Jak by vypadal celý řádek? Ten počet přece nemůžete uvést, dokud jste neuvedl, počet čeho, nebo? --Dan Polansky (diskuse) 27. 4. 2023, 17:47 (CEST)Odpovědět
? Myslel jsem to tak, že výstup by byl, jak jsem napsal, Vyhledávání výrazu pošahanec v ČNK, korpusu syn_v11, dává 63 výskytů. --Amsavatar (diskuse) 27. 4. 2023, 17:54 (CEST)Odpovědět
Hah, jsem slepýš. Čili by se užila zkratka "ČNK", a z ní odkaz někam? A už by se neřeklo že via "KonText"? Zkratku vám ale Palu beztak vyexpanduje na "Český národní korpus". Pak se mi více líbí identifikovat zdroj hned vlevo, jak to činí ostatní šablony, aby to bylo trochu jednotné. Hlavně by měl být odkaz na heslo někde ke konci, aby všechny odkazy byly někde ke konci. Když se všechno dělá trochu jinak, snižuje to uživatelnost.
A nebo naprosto ideální všechno předělat po vzoru en wikt, kde je odkaz první položka vlevo, což je neobvyčejně pžívětivé, ale to by byl naprostý odchyl od oné zlonormy a téměř jistě neprojde schválením od "komunity", což je termín koextenzivní s termínem "Palu" sowieso. (To abych si posteskl.) --Dan Polansky (diskuse) 27. 4. 2023, 17:59 (CEST)Odpovědět
Nevím, byl to jen aktuální nápad. Nijak zvlášť na tom netrvám a už vůbec se mi nechce zase předělávat všechny ty hesla.--Amsavatar (diskuse) 27. 4. 2023, 18:09 (CEST)Odpovědět
Vždyť je též dlužno vážit si svého času a úsilí. Princip je tento: informace odkázaná na jeden klik je pro praktický účel téměř jako kdyby byla v hesle, s jistým zpožděním, než se nahraje cílová stránka. Čili rozdíl mezi linking a embedding není pro praktický účel zase tak velký, byť jistý je. Kopírovat informaci ze zdroje, který je odkázán na jeden klik, není zase tak moc velká hodnota, a stejně je to jen střípek toho, co zdroj nabízí. Co ale je skvělá hodnota je poskytnout skvělý seznam zdrojů dostupných na jeden klik, a ČNK do takového skvělého seznamu patří. --Dan Polansky (diskuse) 27. 4. 2023, 18:13 (CEST)Odpovědět
Teď ještě zbývá Pod lípou zabránit tomu, aby Palu zablokoval nasazení GBK, další skvělé korpusové šablony: Wikislovník:Pod_lípou#Odkazy_do_Google_Books_skrze_šablonu_GBK. Tam stačí napsat "Podporuji šablonu dle argumentů Dana Polanského" a je to; rozvedení vlastních myšlenek je pochopitelně ještě přesvědčivější. --Dan Polansky (diskuse) 27. 4. 2023, 18:16 (CEST)Odpovědět

Amsavatar: Nevím přesně co je uložené vyhledávání. Fungovalo by to tak, že by ten zobrazený výsledek v hesle vždy odpovídal tomu, co čtenář uvidí po kliknutí v ČNK? Pokud ano, tak jsem pro, pokud ne, tak nevím, jestli by to pak nebylo matení.. ? --Palu (diskuse) 27. 4. 2023, 19:56 (CEST)Odpovědět

Díky za vstup. Už jsem na něj nedočkavě čekal. --Dan Polansky (diskuse) 27. 4. 2023, 20:02 (CEST)Odpovědět

@Palu: Permalink by měl vždycky vést ke stejným výsledkům. Ovšem permalinky může vytvářet jen přihlášený zaregistrovaný uživatel ČNK, ostatní linky celkem rychle expirují, jak se ukazuje. --Amsavatar (diskuse) 27. 4. 2023, 20:48 (CEST)Odpovědět

A ten permalink ale tedy asi potom nebude odrážet skutečnost, ale něco, co jsme do něj uložili v době uložení, jestli to dobře chápu. A může se potom měnit ta databáze, nebo ta už je prostě daná a nedoplňuje se? Nebo jinými slovy - ten permalink bude ukazovat nějaký ustrnulý výsledek. Pokud se ta databáze vyvíjí, tak časem ten permalink zastará a my tu budeme zobrazovat zastaralá data. Pokud ne, tak je permalink ok.
Ale je to vlastně ještě širší, protože se to netýká jen počtu výsledků zobrazených v heslech, ale i samotných zobrazených výsledků po kliknutí na permalink. Zobrazí to výsledek z tehdy, ale je to tehdy stejné jako dnes, zítra, potom, nebo se databáze mění a my tu budeme mít zastaralý odkaz a muset ho pravidelně aktualizovat? --Palu (diskuse) 27. 4. 2023, 20:59 (CEST)Odpovědět
ČNK se vyvíjí, syn_v11 znamená 11. verze korpusu syn. Další zřejmě bude syn_v12. Jednou zveřejněný korpus (resp. verze) se už ale dále nemění a tak to uložené vyhledávání by odteď mělo vždy dávat stejné výsledky, v tom je ten princip. Perma=trvalý. --Amsavatar (diskuse) 27. 4. 2023, 21:39 (CEST)Odpovědět
OK, díky za vysvětlení. Tak v takovém případě mi uvádění počtu výskytů dává smysl. --Palu (diskuse) 27. 4. 2023, 21:55 (CEST)Odpovědět

(zpět) Mě by se nechtělo hromadně zadávat počty výskytů, ale uvědomil jsem si, že pro některá hesla by to mělo dobrý smysl, např. zcestný a scestný: čtenář by pouhým porovnáním počtů výskytů přímo v hlavním jmenném prostoru získal dojem pro jejich poměr. Přitom než se nahraje ČNK report někdy docela dlouho trvá, čili mít tento údaj přímo v hesle je výživný/podstatný/bílkovinný rozdíl. Proto jsem pro zavedení volitelného parametru "v=" uvádějícího počet výskytů, a coby iniciátor šablony tento nejspíš brzy přidám, tím spíš, že jak Amsavatar tak Palu v tom vidí smysl; nebo to přidá přede mnou někdo jiný. Na konec řádku bych napsal něco po vzoru tohoto příkladu: "Výskytů: 357." Formát výstupu lze ostatně po dohodě, klidně prosté většiny, později upravit. --Dan Polansky (diskuse) 28. 4. 2023, 16:16 (CEST)Odpovědět

Odkazy - jak to funguje?

[editovat]

Zkusil jsem si kliknout v hesle sajrajt na link "heslo sajrajt" ale zobrazila se mi jen vyhledávací obrazovka bez žádných výsledků. To musím být přihlášený, nebo to tam zadat ručně nebo? Palu (diskuse) 27. 4. 2023, 21:15 (CEST)Odpovědět

Pokud byste si přečetl URL, tak byste viděl toto: https://www.korpus.cz/kontext/query?corpname=syn_v11. A tam vidíte, že se předalo pouze jméno korpusu. Pokud byste si přečetl řádek odkazu, viděl byste toto: "Český národní korpus, vyhledávání via KonText. Korpus syn_v11, heslo sajrajt. Heslo nutno do pole zadat ručně." A tam je onen text o nutnosti zadat ručně. Pouhým přečtením stránky šablony by toto však mělo být zřejmé; je to tam zdokumentované. Q= čili permalink je vyplněn např. v hesle artefakt. Dále bych rád poukázal na to, že 2+2=4. To se získá tak, že si vezmeme počet teček .. a .. a ten porovnáme s počtem v ....; no a ono to v součtu pak vyjde. --Dan Polansky (diskuse) 27. 4. 2023, 21:33 (CEST)Odpovědět
Zajímavé, protože já tam vidím něco jiného: "Český národní korpus, vyhledávání via KonText. Korpus syn_v11, heslo sajrajt." Každopádně i kdybych tam viděl co píšete, tak je to klamání uživatele, který se na heslo sajrajt nedostane - a nějak nechápu smysl takového odkazu. --Palu (diskuse) 27. 4. 2023, 21:53 (CEST)Odpovědět
Tak historii revizí číst umíte, gel? A tam uvidíte, že mezitím Auvajs do hesla "sajrajt" vložil q=. Nebo?
I odkaz bez q= je o moc lepší než nic. Trkne uživatele: hele, existuje dobrý korpus a je tam a tam, koukni do něj. Slovo v něm je, jen ho tam musíš zadat ručně, to je ruk cuk. A my za tebe via URL předvyplníme, že se má hledat v syn_v11, protože my víme, že je to ten nejprimovnější, nejšmekrovnější agregovanej korps. To jako fakt, nekecáme. My na tom bócháme fest, koukáme co je dobrý, a pak ti to doporučíme. Je to fakt primovní. Takže tak. Za mě jasná zásadní hodnota. --Dan Polansky (diskuse) 27. 4. 2023, 22:13 (CEST)Odpovědět
Tak to by asi fungovalo úplně stejně, kdyby to bylo napsáno trochu pravdivěji, ne? Např. "Český národní korpus, vyhledávání via KonText. Korpus syn_v11 obsahuje heslo sajrajt (nutno zadat ručně)." --Palu (diskuse) 27. 4. 2023, 22:25 (CEST)Odpovědět
Šlo by pro případ nevloženého permalinku dát tento nebo podobný jiný výstup? --Palu (diskuse) 27. 4. 2023, 22:41 (CEST)Odpovědět
Souhlasím, že aktuální stav jistě není žádoucí, linkované slovo na prázdný formulář je podfuk. Upravil bych to, kdybych věděl, jaký je kýžený tvar. —Mykhal (diskuse) 29. 4. 2023, 10:12 (CEST)Odpovědět
Žádný podfuk to není, když řádek šablony jasně říká, že uživatel musí slovo zadat ručně. Pletete si pojmy žádoucí a ideální. Rozhodně je žádoucí mít radši něco než nic, i když ideální to není. A pokud navrhnete jiné znění odkazového řádku, aby si to čtenář lépe uvědomil, tak to je pochopitelně možné. Lze si nechat věci napadnout, dát různé návrhy, popsat možné problémy, možná řešení, jejich výhody a nevýhody, analyzovat hodnotu pro uživatele, a zvolit nejlepší řešení. --Dan Polansky (diskuse) 29. 4. 2023, 10:15 (CEST)Odpovědět
Paluův návrh vložit "(nutno zadat ručně)" jsem zrealizoval, neboť proč ne, a pokud to více lidi trkne, prima. Čili odkaz se umístí například na text "kočka (nutno zadat ručně)". --Dan Polansky (diskuse) 3. 5. 2023, 17:09 (CEST)Odpovědět

Pismenkosalát

[editovat]

Dan Polansky neustále vkládá tento termín, Amsavatar při opětovném vložení tvrdí, že jde o náš wikislovníkový slang, já jsem přitom nic takového neslyšel ani na wikiprojektech ani mimo ně. Může mi to někdo prosím vás vysvětlit? To jste se dohodli na tomhle termínu jakožto naše odteď platné označení před týdnem při založení téhle šablony? Fakt chcete říkat místo Identifikátor nebo query Identifikátor nebo čemu tak říkáte písmenkosalát a ještě to učit ostatní? U minimálek to chápu, je to zkrácení a líp se to vyslovuje než minimální heslo, ale písmenkosalát je lépe vyslovitelný než query identifikátor a ještě je to tu zažité? Palu (diskuse) 29. 4. 2023, 20:10 (CEST)Odpovědět

Vlastně o nic nejde, ale opravdu nestojím o tom, aby vhazeč vidlí, který všechny mé inciativy pouze obstruuje a sám žádnou iniciativu nikam nedotáhl, pokud vím, tady vůbec něco řešil. Pokud si smažeme hanlivinu "minimálka", která uráží minimální hesla, pak můžeme udělat kompromis a smazat i můj novotvar písmenkosalát, kalk z němčiny, který snad každý rychle pochopil. Ale ideální by bylo, kdyby narušitel, který co jsem viděl se tu přetahoval nyní a v minulých letech se mnou, Auvajsem, Kusurijou, Bazim, Lenkou64 a kdoví s kým ještě, a který si vysloužil taková označení, že potom musel žádat na nástěnce o zakrytí, aby už si konečně hleděl svého a neřešil. --Dan Polansky (diskuse) 29. 4. 2023, 20:13 (CEST)Odpovědět
Takže jste si vymyslel slovo a během pár dní ho Amsavatar přijal a teď teda musíme všichni říkat tohle a ještě to musíme napsat do šablony. Tak jo, to je hodně bizarní. --Palu (diskuse) 29. 4. 2023, 20:15 (CEST)Odpovědět
Podle mě je to typická D.P.-ovina, kterou jsem se snažil upravit v popisu šablony, v diskusi to asi nějak skousneme. —Mykhal (diskuse) Mykhal (diskuse) 29. 4. 2023, 20:16 (CEST)Odpovědět
Ano, jde mi právě o popis šablony. --Palu (diskuse) 29. 4. 2023, 20:17 (CEST)Odpovědět
No tak ano, vy dva tady bazírujete na heslech se skloňováním. Jenom se tu Mykhalovi jaksi nechce skoro vůbec zakládat nová hesla, jako kdyby to bolelo? A když pak jde doplnit skloňování do mého hesla, pak dává do shrnutí nějaké nejapné osobní poznámky? Takže to je co, donutil, dráb, pohůnek, dohlížeč, nebo jak? --Dan Polansky (diskuse) 29. 4. 2023, 20:20 (CEST)Odpovědět
.. Jinak ve zdrojovém kódu korpusu je to označováno opKey (operation key), opId, apod… Ale zdaleka to nemám doprostudováno dostatečně. —Mykhal (diskuse) 29. 4. 2023, 20:24 (CEST)Odpovědět

Palu: Amsavatar při opětovném vložení tvrdí, že jde o náš wikislovníkový slang, já jsem přitom nic takového neslyšel ani na wikiprojektech ani mimo ně. Může mi to někdo prosím vás vysvětlit?

Tak já vám to vysvětlím: nikde netvrdím, že se jedná o wikislovníkový slang, to jste si kompletně vymyslel... --Amsavatar (diskuse) 29. 4. 2023, 20:28 (CEST)Odpovědět
Tak v tom případě to vaše shrnutí nechápu. --Palu (diskuse) 29. 4. 2023, 20:32 (CEST)Odpovědět
OK, beru to na vědomí. --Amsavatar (diskuse) 29. 4. 2023, 20:40 (CEST)Odpovědět
Ten výraz je tam v závorce pro odlehčení. Je výstižnější než "identifikátor", neb "catOnTheMat" je také identifikátor ale není to salát. Je to docela chytré slovo a ostatně není v pricipu moje; naimportoval jsem ho přes hranici od sousedů, a pak jsem použil kalkovací proces. Mě vadí "minimálka", vám vadí "písmenkosalát". --Dan Polansky (diskuse) 29. 4. 2023, 20:31 (CEST)Odpovědět
Jenže minimálka je náš slang, zatímco tohle je váš výmysl. --Palu (diskuse) 29. 4. 2023, 20:33 (CEST)Odpovědět

Slovo v kostce

[editovat]

Chystám se přidat i odkaz na report "Slovo v kostce", na adrese https://www.korpus.cz/slovo-v-kostce/search/cs/slovo. Sice se mi ten výstup moc nelíbí a mají tam jen málo příkladů, i proto, že dnes jdou na syn2015 místo na syn_v11, ale mají tam i dobré věci. Např. pro slovo "pobuřující"[1] tam mají moc pěkný oddíl "Podobně používaná slova", což jsou něco jako kvazisynonyma či významově související. Celkově je stránka formátovaná nehezky roztahaně a nekompaktně, možná pro mobily, takže jeden musí pořád skrolovat a skrolovat, aby se něčeho dočetl, ale co naděláme. --Dan Polansky (diskuse) 16. 5. 2023, 11:35 (CEST)Odpovědět

Viewmode sentence vs. kwic

[editovat]

Defaultní mode je jak se zdá kwic, který ukazuje slovo tak, že je zarovnané do sloupce. Lze ale nastavit i viewmode sentence, které ukazuje často citaci na více řádků a slovo není zarovnané do sloupce. Tento sentence mode je pro účely lexikografie lepší, proto jsem ho nastavil do vyhledávání, kdy je znám písmenkosalát; v URL, do kterého nastavuji pouze název korpusu, mi nastavení viewmode nedělá rozdíl. --Dan Polansky (diskuse) 16. 5. 2023, 23:16 (CEST)Odpovědět