Wikislovník:Pod lípou: Porovnání verzí

Z Wikislovníku
Skočit na navigaci Skočit na vyhledávání
Smazaný obsah Přidaný obsah
Blahma (diskuse | příspěvky)
→‎Wikislovník jako černá díra na strukturované informace: reakce na jednotlivé podněty, včetně nové nabídky svobodných dat pro češtinu
Řádek 810: Řádek 810:


Ani ten slavný en.wikt to (například v překladech) nemá o moc lepší. Snad akorát díky většímu počtu uživatelů s různou jazykovou základnou jsou překlady lépe pokryty podle jednotlivých významů. Ale jaká hrůza, názvy jazyků tam nejsou šablonou, ale natvrdo vypsány. Co když tam bude v některém jazyku překlep? Na en.wikt si totiž nevystačím se spoléháním se na t+, t-, tø, protože řada překladů dokonce vůbec není šablonovaná. A kdo mi zaručí, že některý ten překlad není zvandalizovaný. Při počtu hesel tam je dost nepravděpodobné, že zrovna někdo znalý zrovna narazí na plíživě zvandalizovaný obsah, takže to tam může přetrvávat roky. --[[Uživatel:Reaperman|Reaperman]] ([[Diskuse s uživatelem:Reaperman|diskuse]]) 28. 9. 2013, 21:28 (UTC)
Ani ten slavný en.wikt to (například v překladech) nemá o moc lepší. Snad akorát díky většímu počtu uživatelů s různou jazykovou základnou jsou překlady lépe pokryty podle jednotlivých významů. Ale jaká hrůza, názvy jazyků tam nejsou šablonou, ale natvrdo vypsány. Co když tam bude v některém jazyku překlep? Na en.wikt si totiž nevystačím se spoléháním se na t+, t-, tø, protože řada překladů dokonce vůbec není šablonovaná. A kdo mi zaručí, že některý ten překlad není zvandalizovaný. Při počtu hesel tam je dost nepravděpodobné, že zrovna někdo znalý zrovna narazí na plíživě zvandalizovaný obsah, takže to tam může přetrvávat roky. --[[Uživatel:Reaperman|Reaperman]] ([[Diskuse s uživatelem:Reaperman|diskuse]]) 28. 9. 2013, 21:28 (UTC)

:Děkuji vám za obsáhlou reakci, která mne jenom utvrdila v nadějích, které vkládám do Wikidat, a pokud to bude v mých silách, rád přispěji k integraci českého Wikislovníku do nich, jakmile to bude aktuální. Prosím pamatujte, že můj text výše nebyl míněn jako kritika Wikislovníku nebo jeho komunity, ale pouze jako reakce na žádost jednoho z editorů o vyjádření, proč ačkoliv aktivní wikipedista a počítačový lingvista nepřispívám do Wikislovníku a mám problémy už i jen s jeho využíváním.
:Děkuji vám i za shrnutí historie Wikislovníku. Pociťovanou nepřízeň tvůrců MediaWiki snad už brzy prolomí právě Wikidata, ale pak mne trochu zaráží, proč je už proti zatím jen plánům na jejich dobrovolné zavedení takový odpor na odkazované diskuzi - jako kdyby někteří wikislovníkáři vlastně žádnou pomoc nechtěli a byli spokojení s tím, na co jsou zvyklí. Trošku na technickou nótu si dovoluji upozornit, že zatímco substování šablony je nezvratný proces, běžně vloženou šablonu si lze nechat expandovat ("substovat") kdykoliv na požádání přes API, takže tabulku všech tvarů lze snadno získat a přitom v kódu mít jen šablonu s parametry a není třeba na straně vývojaře nic parsovat.
:Když píšete o českém Wikislovníku a nedostatku hesel, předpokládám, že máte na mysli především česká hesla. V tom vaši lítost nad nedostatkem zdrojů sdílím. Jinak už je tomu ale u jiných jazyků (které sem - z toho, jak je vystavěn celý projekt Wikislovníku) také patří - a v diskuzi výše šlo právě o příklad latiny, ke které zdroje jsou: minimálně anglický Wikislovník, který dosud jako jediný indexuje všechny tvary slov a o jehož imitaci zde se Martin Kotačka dlouhodobě záslužně snaží. A je podle mne smutné, že Martin musí vše kopírovat ručně (už jsem mu nabídl nějakou robotickou pomoc), že to musí vůbec kopírovat (v budoucnu by to snad mělo jít natahat vlastně jen robotickým založením prostých hesel s šablonou odkazující pro tvary do Wikidat) a že z toho pak po natáhání ještě vznikají ještě ne nejšťastněji strukturované informace (šablona tabulky je substována). Ono to možná nakonec vypadá spíš tak, jako kdybych konkrétně jeho odrazoval od toho, co dělá, ale poukazuje to myslím i obecněji na to, proč je bohužel práce na Wikislovníku dost často tak trochu zbytečná a aspoň z části asi i na to, proč Wikislovník tak obtížně získává nové přispěvatele. V tomto smyslu nelze nepodpořit ty z vás, kteří tady vytvářejí obsah, který jinde není dostupný (nebo není dostupný pod svobodnou licencí), ale i jejich práce by byla lépe zhodnocená, kdyby se už vše připravilo lépe na to, že jednou se jejich data budou dát přetáhnout do nějakého centrálního úložiště a naráz budou moci daty k češtině disponovat všechny Wikislovníky.
:Složitost editace slovníkových hesel je problém, kterého se asi tak snadno nezbavíme, bohužel. Buď vysvětlíte nováčkovi šablonu, nebo ho musíte přesně seznámit se strukturou a formátováním hesla (kde i každá jedna kurzíva nebo tečka může hrát pro další zpracování roli). Druhá cesta má tu nevýhodu, že ji lze nepozorností zkazit (zatímco šablona buď funguje, nebo nefunguje - víceméně).
:Opět připomínám, že mi primárně šlo o latinské vzory (které jsou poměrně dobře vžité a aktivitám Martina Kotačky i podle vyjádření Mildy stačí těch pár základních), ale určitě by šlo něco dělat i s těmi českými. Zmíněná dvojtisícovka vzorů byla minimálě jednou standardizována a k podstatnému jménu vzor snadno zjistíte [http://nlp.fi.muni.cz/projekty/wwwajka/WwwAjkaSkripty/morph-analyser.cgi?jazyk=0&slovo=medv%ECd&akce=3&kodovani=0 přes veřejně dostupnou aplikaci] (např. "medvěd" je vzoru "1363-slon"). Navíc si myslím, že by se šlo s informatiky z FI MU určitě dohodnout i na nějaké další spolupráci, vždyť přece oni mají jako občasní "vycucávači" o kvalitu vašich dat také zájem. Pokud byste s tím skutečně chtěli něco dělat, mohu se dokonce pokusit něco v tomto směru sám vyjednat (mimochodem, čerstvě dokonce nabízejí [http://nlp.fi.muni.cz/ma/free.html na milion slovních tvarů pod CC-BY-SA] - že by výzva pro Wikislovník?). A ty tisíce jsou samozřejmě hlavně podvzory, zatímco základních vzorů zůstává pořád jenom těch pár školních, takže by se daly šablonou třeba i zapisovat/zobrazovat ty informace obě dvě. Popis těchto "brněnských vzorů" (i když ne přímo jejich seznam) najdete v [http://nlp.fi.muni.cz/poc_lingv/pala_zprac.pdf#47] (str. 47).
:I problém plíživého vandalismu by pomohla řešit Wikidata, protože by se všechny tvary svahilských slov zakládaly tam (a tady jenom hesla s voláním příslušné obecné šablony tahající tvary z Wikidat), no a na Wikidatech by se určitě už pár mluvčích svahilštiny ke vzájemné kontrole sešlo, tím spíše, že by stejná data zřejmě jako svá primární používali i přímo redaktoři svahilského Wikisloníku. Znásobování práce nad stejnými daty napříč všemi jazykovými verzemi Wikislovníku mi od začátku připadalo asi jako vůbec největší nelogičnost/zbytečnost tohoto projektu, i když teď po jeho bližším průzkumu už aspoň trochu chápu, že k tomu mohou být i nějaké aspoň trochu legitimní důvody (ale i tak pořád jen k samé existenci jazykových verzí, ale nikoliv už ke znásobování stejných dat).
:Nakonec se ještě zopakuji a poděkuji za podnětné reakce. Snad tahle diskuze nevyzní úplně do prázdna a třeba se nám podaří alespoň se dobře připravit na očekávané budoucí změny nebo třeba i dosáhnout nějakého okamžitějšího užitečného posunu už teď. [[Uživatel:Blahma|Blahma]] ([[Diskuse s uživatelem:Blahma|diskuse]]) 29. 9. 2013, 01:54 (UTC)

Verze z 29. 9. 2013, 02:54

Pod lípou neboli česká hospoda je místo pro setkání všech wikislovníkářů a pro vedení obecných diskusí netýkajících se pouze jednoho hesla. (Název byl inspirován slovinskou wikipedií. Nabízela se také hospoda, což mají i v latině.) Pokud chcete ostatním uživatelům jen něco oznámit, použijte stránku oznámení.

Aby si stránka udržovala zvládnutelný rozsah a aktuálnost, je záhodno starší a vyřešené části přenášet do archivu a přitom je případně i zestručňovat, shrnovat, aj. Může to dělat každý – a uklízet po sobě je přímo chvályhodné! – ale čekejte prosím vždy až do ukončení diskuse, respektive dokud nebudete mít jistotu, že všechny repliky si přečetl ten, komu byly určeny.

Odkaz na přílohu

Všiml jsem si, že ve vyjmenovaných heslech (a možná i v heslech jiných) je odkaz na přílohu umístěn v sekci s názvem odkazy na jiné projekty. To mi v prvé chvíli evokuje odkazy na Wikipedii, Wikizdroje atp., což jsou významy ve zdejším prostředí používaného výrazu projekt. Příloha je pouze součást zdejšího projektu, jímž je Wikislovník. Nestálo by za úvahu přemýšlet o přejmenování? --Martin Kotačka (diskuse) 7. 1. 2013, 16:35 (UTC)

Rozhodně to nepatří do takto pojmenované sekce. Kromě toho to bylo provedeno jen ve čtyřech heslech (s výjimkou těch dvou vámi přidaných), takže by bylo na místě před dalším odkazováním popřemýšlet, kam ty odkazy dávat, a hlavně zda tam jsou vůbec potřeba. Podle mého názoru ne: Uvědomme si, že vyjmenovaná slova jsou zpravidla jen kořeny a odvozených slov (a jejich tvarů) jsou stovky a tisíce, takže pak by ty odkazy byly v alespoň polovině českých substantiv. A to nemá žádnou logiku. A opačně - mít to jen v základních tvarech rovněž nemá logiku, neboť naopak u odvozených je případně třeba zdůvodnit, proč se tak píší. Opravdu zatím nevidím jedinný důvod, proč s tím takto zaplácávat hesla.
Danny B. ( diskusemail přehled příspěvků ) 8. 1. 2013, 01:25 (UTC)
Všiml jsem si včera oné přílohy, kliknul na dvě náhodná vyjmenovaná slova a jak koukám, byla to zrovna tahle dvě. Domníval jsem se tedy, že je to tak u všech vyjmenovanch slov v základních tvarech. Název je zavádějící, o tom asi není sporu. Na druhou stranu pokud zde máme tuto přílohu, je nutné na ni odněkud odkazovat. Děje se tak? --Martin Kotačka (diskuse) 8. 1. 2013, 05:29 (UTC)
Příloh máme více, ale jsou povětšinou nedohledatelné, pro mne osobně je jedinou šancí, jak se na ně dostat to, že jsem si dal odkaz na vlastní uživatelskou stránku, což, jak pevně doufám, nebudete doporučovat běžnému uživateli wikislovníku, který nejčastěji ani není zaregistrován - nemá vlastní uživatelský účet ani diskusní stránku k němu. Myslím, že tento problém (přístupnosti a dohledatelnosti příloh) by měl být již řešen; v době, kdy právě vznikly, byla tato situace ospravedlnitelná, dnes již ne. --Kusurija (diskuse) 8. 1. 2013, 08:03 (UTC)
Proč je nutné na ni odkazovat z hesel?
Danny B. ( diskusemail přehled příspěvků ) 8. 1. 2013, 12:08 (UTC)
Opravdu, nemělo by to být ani žádoucí, natož nutné, byl to jen pokus o suplování absence přístupu do prostoru [[Příloha: XY ]]. Pokud je někdo zrovna na stránce s heslem, zařazeným do přílohy a má zájem se do té přílohy podívat, měl by takovou možnost mít nějakým přívětivým nástrojem a ne "pirátsky" tím, že musím nějak vpravit odkaz do hesla proto, že nemám možnost se tam dostat "normálně", jen s použitím fint, které běžného uživatele nemusí napadnout (viz můj odkaz na mé uživatelské stránce). --Kusurija (diskuse) 8. 1. 2013, 13:29 (UTC)
Zadám-li do vyhedávače "Příloha:" nenalezne vyhledávač vůbec nic - a to ani po rozšíření hledání na "Všechno". U většiny vyjmenovaných slov o existenci Příloha:Vyjmenovaná slova (nefunkční:nezapamatoval jsem si přesné znění: další důkaz nedohledatelnosti schválně ponechávám, dohledatelné: Příloha:Vyjmenovaná slova (čeština))--Kusurija (diskuse) 8. 1. 2013, 13:52 (UTC) nezakopnete ani náhodou. A odkud má běžný uživatel tušit, že daný prostor se jmenuje zrovna "Příloha" a ne třeba "Dodatky" nebo "Doplňky" nebo ..., ... Proklikáváním se po kategoriích se z žádného hesla na tu přílohu taky nedostanete. Čili prostor je pro běžného uživatele nenalezitelný i v případě, že o jeho existenci ví - což naprostá většina uživatelů neví, že od nedávna tu takový prostor máme. Tuto situaci je bezpodmínečně nutno vyřešit, neříkám, že urychleně, pokud několik let tento prostor na cs.wikt neexistoval vůbec, a uživatelé se bez něj obešli, těch několik dní/týdnů/měsíc to ještě taky vydrží, ale nač by tady ten prostor měl vůbec být, když je nepřístupný?... --Kusurija (diskuse) 8. 1. 2013, 13:47 (UTC)

Tato situace mne přivedla k určitému nápadu, jak tohle (a podobné věci) řešit efektivně a přehledně. Zpracuju návrh a pak ho sem postnu.
Danny B. ( diskusemail přehled příspěvků ) 8. 1. 2013, 12:08 (UTC)

Situace zůstává stále stejná, pokud jsem naznačil, že by to tak mohlo zůstat ještě několik dní/týdnů/měsíc, tak jsem rozhodně neměl na mysli mnoho měsíců/roky. Někdo by se tomu měl skutečně (ne jen teoreticky) věnovat.

Be a Wikimedia fundraising "User Experience" volunteer!

Thank you to everyone who volunteered last year on the Wikimedia fundraising 'User Experience' project. We have talked to many different people in different countries and their feedback has helped us immensely in restructuring our pages. If you haven't heard of it yet, the 'User Experience' project has the goal of understanding the donation experience in different countries (outside the USA) and enhancing the localization of our donation pages.

I am (still) searching for volunteers to spend some time on a Skype chat with me, reviewing their own country's donation pages. It will be done on a 'usability' format (I will ask you to read the text and go through the donation flow) and will be asking your feedback in the meanwhile.

The only pre-requisite is for the volunteer to actually live in the country and to have access to at least one donation method that we offer for that country (mainly credit/debit card, but also real time banking like IDEAL, E-wallets, etc...) so we can do a live test and see if the donation goes through. **All volunteers will be reimbursed of the donations that eventually succeed (and they will be very low amounts, like 1-2 dollars)**

By helping us you are actually helping thousands of people to support our mission of free knowledge across the world. If you are interested (or know of anyone who could be) please email ppena@wikimedia.org. All countries needed (excepting USA)!!

Thanks!

Pats Pena
Global Fundraising Operations Manager, Wikimedia Foundation

Sent using Global message delivery, 8. 1. 2013, 20:45 (UTC)

Wikimedia sites to move to primary data center in Ashburn, Virginia. Read-only mode expected.

(Apologies if this message isn't in your language.) Next week, the Wikimedia Foundation will transition its main technical operations to a new data center in Ashburn, Virginia, USA. This is intended to improve the technical performance and reliability of all Wikimedia sites, including this wiki. There will be some times when the site will be in read-only mode, and there may be full outages; the current target windows for the migration are January 22nd, 23rd and 24th, 2013, from 17:00 to 01:00 UTC (see other timezones on timeanddate.com). More information is available in the full announcement.

If you would like to stay informed of future technical upgrades, consider becoming a Tech ambassador and joining the ambassadors mailing list. You will be able to help your fellow Wikimedians have a voice in technical discussions and be notified of important decisions.

Thank you for your help and your understanding.

Guillaume Paumier, via the Global message delivery system (wrong page? You can fix it.). 19. 1. 2013, 15:08 (UTC)

Německá slovesa - pasivní tvary u tranzitivních

Mám naléhavou prosbu na někoho z vás, kdo umíte naprogramovat šablony. U německých sloves, kterým jsem ochoten se občas věnovat, by to chtělo něco podobného jako mají na en.wikt či fr.wikt. Nebo klidně i to přímo z německého.

Jediné, co umím zatím já, je obměňovat Istafeho (?) dávnou tabulku, která ale obsahuje pouze tvary aktivní (což je u sloves přechodných dost nešikovné) a možná se, imho, nadbytečně věnuje konjunktivům a antefuturu.

Bohužel neumím ani rozšířit tu tabulku stávající.

Díky, --Pyprilescu (diskuse) 25. 1. 2013, 16:29 (UTC)

V první řadě zkuste popsat, co konkrétně by šablona měla umět, protože ti, kdo rozumí šablonám, nemusí nutně zároveň rozumět němčině. Dejte příklad slova, jaké má možné tvary, které z nich současná podoba umožňuje a naopak, které neumožňuje, k tomu třeba i odkaz na příslušné slov jinde... JAn Dudík (diskuse) 29. 1. 2013, 09:04 (UTC)

Help turn ideas into grants in the new IdeaLab

I apologize if this message is not in your language. Please help translate it.

  • Do you have an idea for a project to improve this community or website?
  • Do you think you could complete your idea if only you had some funding?
  • Do you want to help other people turn their ideas into project plans or grant proposals?

Please join us in the IdeaLab, an incubator for project ideas and Individual Engagement Grant proposals.

The Wikimedia Foundation is seeking new ideas and proposals for Individual Engagement Grants. These grants fund individuals or small groups to complete projects that help improve this community. If interested, please submit a completed proposal by February 15, 2013. Please visit https://meta.wikimedia.org/wiki/Grants:IEG for more information.

Thanks! --Siko Bouterse, Head of Individual Engagement Grants, Wikimedia Foundation 30. 1. 2013, 20:15 (UTC)

Distributed via Global message delivery. (Wrong page? Correct it here.)

Instalace rozšíření Scribunto naplánována na 18. února

Ahoj, mám tu jedno oznámení, bohužel v angličtině, snad tomu porozumíte, bohužel nemám čas to překládat :( (díky za pochopení):

Wikimedia Foundation has been working on improving performance and adding features to template pages within MediaWiki. As a result of this WMF developed a new Scribunto extension for MediaWiki which enables Lua scripting language for templates. The developers are confident about the extension's maturity and it was decided that Scribunto is going to be deployed to this wiki in the first batch. The deployment will begin on February 18 and will simply add a feature. Please be so kind and spread the word about the deployment on your wiki. If you are interested in converting current templates to Lua, please see more information and submit your feedback to Lua page on Meta. Regards, Kozuch (diskuse) 13. 2. 2013, 18:16 (UTC)

Favicon

Na anglickém Wikislovníku byl zaveden nový favicon.

Před nějakým časem jsem zde udělal udělátko, které umožňuje si favicon změnit, ovšem je to jen pro registrované, resp. ty, co si to zapnou, a používá to jinou ikonku .

Navrhuji buď adoptovat tu anglickou, nebo vytvořit český ekvivalent (to bych nedoporučoval, vzhledem k tomu, že výslovnost začíná na v, ale jméno projektu na W), a nasadit ji globálně všem.

Danny B. ( diskusemail přehled příspěvků ) 15. 2. 2013, 02:32 (UTC)

Jsem pro anglickou verzi faviconu (pro všechny), na rozdíl od současného nebo výše zmiňovaného scrabble tento nový aspoň připomíná logo projektu. --Hellooo (diskuse) 16. 2. 2013, 07:56 (UTC)
Nevadí mi ani jedna z možností. --Tchoř (diskuse) 16. 2. 2013, 13:05 (UTC)
Pokud se bude logo lišit od Wikipedie, zvyknu si na libovolné :-) JAn Dudík (diskuse) 17. 2. 2013, 22:00 (UTC)
Aah, whatever. --Reaperman (diskuse) 17. 2. 2013, 22:06 (UTC)

Nastaveno a udělátko zrušeno.
Danny B. ( diskusemail přehled příspěvků ) 25. 2. 2013, 21:58 (UTC)

Co se šablonami příznaků?

Převedl jsem šablony {{Příznaky}} a {{Příznak2}} na skriptované verze, čímž se šablony jednotlivých příznaků staly vzhledem k zavedení cetrálního úložiště příznaků nepoužívané.

Měl by pro ně někdo ještě nějaké využití, nebo se mohou smazat?

Danny B. ( diskusemail přehled příspěvků ) 10. 3. 2013, 01:03 (UTC)

Smazal jsem.
Danny B. ( diskusemail přehled příspěvků ) 18. 3. 2013, 23:38 (UTC)

Nastavení možnosti zobrazení jiného nadpisu, než je název stránky

Bylo by vhodné tu nastavit možnost zobrazení jiného nadpisu, než je název stránky. Mimo jiné to umožní pracovat s kódy jazyků (což je výhodné pro různé automatizace a strojová zpracování) tak, aby zároveň názvy byly srozumitelné i pro čtenáře, který ty kódy nezná.

Danny B. ( diskusemail přehled příspěvků ) 18. 3. 2013, 23:43 (UTC)

Mohl byste uvést jeden příklad, co tím máte na mysli? Existují přece přesměrování, možnost odkazování [[heslo|jiné heslo]]. U jazyků, zapisovaných jinak, než latinkou, lze vytvořit hesla s výslovností v latince, odkazující na příslušné heslo (jinde to tak mají)... Ale pravděpodobně Vám šlo o jiný problém? --Kusurija (diskuse) 19. 3. 2013, 05:44 (UTC)
Klidně. --Dubicko (diskuse) 19. 3. 2013, 13:00 (UTC)
Momentálně nevidím důvod tu tu možnost nemít. --Reaperman (diskuse) 19. 3. 2013, 20:48 (UTC)
Proč ne, ale byly by podrobnosti? (jde o rozšíření? jaké? jaké je praktické využití?...) JAn Dudík (diskuse) 19. 3. 2013, 21:26 (UTC)
Nakolik to chápu, jsem pro. Ale také bych prosil o nějaký konkrétní příklad. --Pyprilescu (diskuse) 20. 3. 2013, 01:40 (UTC)

Nastaveno.
Danny B. ( diskusemail přehled příspěvků ) 7. 5. 2013, 10:29 (UTC)

Hledal jsem etymologii francouzského argotického slova binz a jsem se myslel, ze souvisi s binec a, ze maji spolecny nemecky radikal. Nikoliv, 'binz' je apokopa od 'cabinet' podle me reserse.

Nekdo vi odkud je 'binec'? Dle jednoho zdroju je z roku 1780. Argotické ale dost staré slovo... od babinec?

--Diligent (diskuse) 20. 3. 2013, 17:22 (UTC)

Rejzek píše, že je patrně onomastického původu. --Mormegil (diskuse) 9. 4. 2013, 08:33 (UTC)

Které jazyky akceptovat do překladů?

Při pohledu do voda#překlady je vidět, že některé jazyky nemají svůj Wikislovník. Navrhuji v překladech akceptovat pouze ty jazyky, které jej mají - tím se i zvýší verifikovatelnost příslušných překladů.

Danny B. ( diskusemail přehled příspěvků ) 20. 3. 2013, 20:43 (UTC)

Neomezoval bych to na Wikislovníky, když už, tak na Wikipedie. A jsou jistě některé ověřitelné jazyky, které nemají vlastní ani to, ani ono (například starořečtina - grc). JAn Dudík (diskuse) 20. 3. 2013, 21:04 (UTC)
Připojuji se k argumentu JAna Dudíka. Mimoto, momentálně neexistující mohou ještě vzniknout - co potom? --Kusurija (diskuse) 21. 3. 2013, 07:12 (UTC)
Coby potom? Pokud pravidlo bude říkat, že se přijímají jazyky, kde existuje příslušný Wikislovník / Wikipedie, pak je nasnadě, že od okamžiku, kdy bude založen nový jazyk toho projektu, se mohou přidávat i překlady z příslušného jazyka.
Danny B. ( diskusemail přehled příspěvků ) 21. 3. 2013, 10:21 (UTC)
@Danny B.:To bych rád viděl toho, kdo by po vzniku nového wikt'u nadšeně procházel ty tisíce hesel a přidával tam překlady, které v době, kdy editoval, znal/měl je nalezené/asi už zase zapomněl jen proto, že tehdy to bylo byrokraticky zakázané z "důvodu momentální neexistence příslušného wikt'u". Na to by se asi většina vykašlala. Myslím, že víc vadí chybění hesel samých, než to, že v okamžiku editace odkazy zatím nikam nevedou. V současné podobě to podle mně funguje uspokojině: až tam někdo heslo vytvoří, odkaz začne fungovat, aniž by se někdo musel zpětně o něco starat. I tak dobrovolníci obětují zdarma dost času na tvorbě wp a jejích podprojektů, místo, co byste jim za to byli vděční, házíte zbytečně klacky pod nohy. Řknete: ale jde také o kvalitu. Myslím, že je mnoho jiných oblastí, kde úroveň kvality nebo/a/i kvantity vadí podstatně více. Nahoře rozebíraný problém nezpůsobuje to, že by byl čtenář mystifikován, uváděn v omyl: dostane informaci o správném překladu (pokud ho tam edeitor svědomitě vložil správný), chtěje si to ověřit na daném odkazu, celkem snadno pochopí, že na daném místě dané heslo dosud nebylo vytvořeno a k žádným jiným mylným interpretacím to nevede. Proč tedy znehodnocovat to, co celkem uspokojivě funguje?? --Kusurija (diskuse) 21. 3. 2013, 12:30 (UTC)
Opět jste mimo. Nejedná se vůbec o odkazy na hesla neexistující lokálně - ty jsou jasně vyznačeny červeně, takže čtenář , že neexistují. Jedná se o odkazy na cizí Wikislovníky, které nejsou rozlišené, a uživatel tak neví, jestli odkaz vede na existující nebo neexistující stránku, takže nemá jinou možnost, než kliknout.
Níže jsem založil podsekci, protože tato debata ztratila vzhledem k novému nápadu na relevanci, přesto sem píšete elaboráty. Zbytečně. Nemá cenu to dál rozebírat, neboť je to dále zcela irelevantní.
Danny B. ( diskusemail přehled příspěvků ) 21. 3. 2013, 12:48 (UTC)
Omlouvám se za nedostatečně jasné vyjádření, samozřejmě, že jsem měl na mysli pouze odkazy (nevedoucí nikam - ev.) na jinojazyčné (cizí) wikislovníky a vůbec ne na lokální. Čili v tomto vláknu končím. --Kusurija (diskuse) 21. 3. 2013, 13:35 (UTC)
Souhlasím s tímtéž. --JOtt (diskuse) 21. 3. 2013, 10:17 (UTC)

Obecná otázka byla zúžena na konkrétnější: #Odkazování na další Wikislovníky v překladech.
Danny B. ( diskusemail přehled příspěvků ) 21. 3. 2013, 12:48 (UTC)

Odkazování na další Wikislovníky v překladech

Tu výše uvedenou diskusi jsem začal proto, že současný výstup šablony {{P}} přidává odkazy do Wikislovníků v daném jazyce. To je ale značně problematické: 1) řada z těch Wikislovníků ani neexistuje - hence můj návrh na akceptaci pouze těch s existujícím -, takže dané odkazy se falešně připojují na seznam chybějících stránek, protože jsou vyhodnoceny jako lokální odkazy 2) většina odkazů vede na neexistující stránky. To je především značně neslušné vůči čtenáři, ale má to například i signifikantní vliv na to, že se Wikislovník ve vyhledávačích objevuje značně bídně. Takže po diskusi na IRC předkládám návrh JAna Dudíka, aby ty odkazy byly odebrány a přidávaly se pouze via volitelně zapnuté udělátko.
Danny B. ( diskusemail přehled příspěvků ) 21. 3. 2013, 10:29 (UTC)

A co to udělat jako např. na en:wikt, kde používají + a -: odkaz je/není. Ale to by muselo být propojeno i s aktivitou bota, který by ta znaménka měnil po vzniku příslušného hesla. V případě, že byste to udělali tak, jak jsem to pochopil, bylo by nutné neustále někoho nutit, aby po vytvoření nějakého hesla na nějakém cizím wikislovníku ta odkazovatelná hesla všude aktivoval (existují totiž slova s různými významy), jeboť jinak by nastala situace ještě neslušnější k uživateli: že by neměl informaci o existenci odkazov(atelného) hesla na cizích wikislovnících a ztratil možnost porovnávat + získat širší informace. A může mi někdo vysvětlit mechanizmus jak (a zda vůbec) má právě tento jev "vliv na to, že se Wikislovník ve vyhledávačích objevuje značně bídně"? (Omlouvám se za moje podezření z neznalosti, že se jedná o argument vycucaný z prstu). --Kusurija (diskuse) 21. 3. 2013, 12:05 (UTC)
Ne, to jste tedy nepochopil. Kdo chce, zapne si udělátko, které mu bude zobrazovat všechny odkazy tak, jak jsou zobrazovány nyní. Žádný bot k tomu třeba není. Kromě toho, je neslušnější předstírat, že někde něco existuje, a posílat tak čtenáře do černé díry, než pouze případnou existenci neoznámit - zvláště, když si ji může dotyčný v případě zájmu sám ověřit.
Danny B. ( diskusemail přehled příspěvků ) 21. 3. 2013, 12:36 (UTC)
Pokud jsem to nyní, po dodatečném vysvětlení pochopil tak, že ve skrytém stavu to bude ukazovat jen ty funkčí odkazy na cizí wikislovníky a tam existující hesla a po "odkrytí" tam budou všechny, včetně těch zatím neexistujících + jako editor tam budu mít právo přidat další (existující i dosud neexistující) odkazy do jiných wikislovníků s tím, že budu moci podle momentální situace (nejen přidání, ale i odebrání dotyčných hesel) to zviditelnění editovat, nebo dokonce by se to upravilo automaticky, pak bych byl samozřejmě pro (jednoznačně). Pokud by ale bylo třeba při dodávání překladů čekat, až/zda dotyčné heslo na cizím wikislovníku bude/nebude, potom bych byl proti. Jste si ale jistý, že by to závažně ovlivnilo to, nakolik bude/nebude wikislovník upřednostňován ve vyhledávačích (google a pod.)? Třeba je to více ovlivněno tím, jak často je celkově vůbec wikislovník navštěvován a ne jen touto +-maličkostí? --Kusurija (diskuse) 21. 3. 2013, 13:27 (UTC)
BTW, mnou odkazované značky + nebo - na en:wikt'u fungují tak, že pokud napíšete + odkaz na cizí wikt je modrý, pokud napíšete -, odkaz na cizí wikt je červený; na en:wikt'u bohužel bez ohledu na skutečnost, takže pokud editor udělal chybu, nebo došlo ke změně, na kterou žádný editor nezareagoval, tato funkce ukazuje špatně: červený přesto dovede na existující heslo (bylo mezitím přidáno nebo chyba editora) a modrý někdy nevede nikam ("vede do černé díry", pokud bylo příslušné heslo smazáno nebo chyba editora). (v našich dosavadních šablonách to tak nefunguje: neexistuje parametr +/- a všechny odkazy (na cizí wikt'y) ukazují modře, bez ohledu na existenci tamějšího hesla). Váš návrh by tedy byl lepší, pokud jsem dobře pochopil komentář. --Kusurija (diskuse) 21. 3. 2013, 13:49 (UTC)

Stále nepochopil... Zkusím to tedy napsat jinými slovy:

Ve výchozím stavu se nebudou žádné odkazy na ostatní Wikislovníky zobrazovat. Když si zapnete udělátko, budou se vám zobrazovat tak jako teď.

Jinak udělátko už mám naprogramované, takže není problém ho okamžitě nasadit.

PS: Vyhledávače celkem logicky nemohou zjistit návštěvnost webů, takže opravdu ne. A odkazování na neexistující stránky pro ně právě není maličkost, ale celkem závažné kritérium.

Danny B. ( diskusemail přehled příspěvků ) 23. 3. 2013, 14:02 (UTC)

Ad odkazování na neexistující stránky: wikipedie jich má šílené množství, zcela určitě podstatně více, než naprostá většina jiných sajtů, přesto je ve vyhledávačích nalezitelná docela slušně. To, že je na vyhledávačích wikislovník mizerně nalezitelný bude spíš tím, že má ještě chudý slovník: tím pádem o něj vyhledávač méně často "zavadí". Rovněž na něj je málo odkazováno od jinud, bohužel i z té samé wikipedie, což je podle mne dost závažný nedostatek, podle mého skromného názoru dost podstatnější, než co naznačujete výše. A i opačně, odkazování na wikipedii nebo další její projekty z wikislovníku je také podstatně slabší, než by bylo záhodno. A věřte tomu, že běžný uživatel nějaká udělátka bude ignorovat, nevyužije je.

Ad udělátko: píšete: "...Když si zapnete udělátko, budou se vám (cizí wikt.) zobrazovat tak jako teď..." - ptám se, 1. zdali to znamená, že se tam budou moci přidávat i nadále překlady a to i do jazyků, které nemají "svůj" wikislovník? (starořečtina, vymřelé jazyky, málo známé/málo uznávané jazyky (žemaitština))? 2. znamená to, že to udělátko má "za úkol" "oblafnout" ty vyhledávače a skrýt před jejich dosahem odkazy, které nikam nevedou? 3. Pokud ano, jste si jistý, že se to tomu udělátku dostatečně účinně podaří (např. pokud by třeba návštěvník nechal po sobě udělátko "odkryté") před nimi skrýt? --Kusurija (diskuse) 23. 3. 2013, 20:43 (UTC)

Danny B.: zprovozni to udělátko...at to vidíme v praxi... zrušit se to dá vždycky...ne? --Dubicko (diskuse) 23. 3. 2013, 21:41 (UTC)

Tak jsem se na to podíval: dobře odvedená práce. Šlo to vysvětlit jednodušeji: po zapnutí udělátka odkazy na kódy neexistujících wikislovníků "zčervenají". Čímž by odpadly jalové diskuse nahoře. Děkuji za názorné předvedení a jsem všemi deseti pro. Je to podstatně lepší, než to bylo dosud na en:wictionary. --Kusurija (diskuse) 24. 3. 2013, 06:39 (UTC)

Co se šablonami jazyků?

Převedl jsem relevantní šablony na skriptované verze, čímž se šablony jednotlivých jazyků staly vzhledem k zavedení cetrálního úložiště jazyků nepoužívané.

Měl by pro ně někdo ještě nějaké využití, nebo se mohou smazat?

Danny B. ( diskusemail přehled příspěvků ) 21. 3. 2013, 01:57 (UTC)

Proposal of a pronunciation recording tool

Hello, Rahul21, a developer, offers to develop a pronunciation recording tool for Wiktionary, helped by Michael Dale as part of GSoC. The tool would allow to record and add audio pronunciations to Wiktionary entries while browsing them (see background discussion on Wiktionary-l). Please read and comment the proposal! Regards, Nemo 9. 4. 2013, 22:36 (UTC)

Zobrazování záznamů editačního filtru na IRC

Ve výchozím nastavení se záznamy editačního filtru nezobrazují na IRC posledních změn. Všiml jsem si, že některé zásahy zůstaly nepovšimnuty, potažmo neopraveny, u jiných to trvalo dlouho. Navrhuji proto, aby tyto záznamy byly zobrazovány, a to i včetně filtrů tajných (zobrazuje se jen záznam události s číslem filtru bez jakýchkoliv podrobností - ty jsou v logu), což pomůže zefektivnit údržbu, lépe předcházet reagovat na experimenty a vandalismy atd.

Danny B. ( diskusemail přehled příspěvků ) 14. 4. 2013, 16:06 (UTC)

Jasně, proč ne. --G3ron1mo (diskuse) 14. 4. 2013, 21:14 (UTC)
--Dubicko (diskuse) 14. 4. 2013, 22:43 (UTC)
Nemám námitky. --Tchoř (diskuse) 15. 4. 2013, 06:02 (UTC)
Když to někomu pomůže... --Reaperman (diskuse) 15. 4. 2013, 23:49 (UTC)
Já rc irc nesleduju, takže pokud to někomu pomůže, nejsem proti. JAn Dudík (diskuse) 16. 4. 2013, 05:56 (UTC)

Nastaveno.
Danny B. ( diskusemail přehled příspěvků ) 17. 4. 2013, 00:38 (UTC)

chyba

Heslo bonus ve svém anglickém významu odkazuje na chybu neznámého příznaku. Možná to souvisí s nynějším hromadným smazáním nepoužívaných šablon (nevím?). Každopádně kdyby se na to někdo technicky zdatnější podíval, bylo by to fajn. Díky. --Martin Kotačka (diskuse) 16. 4. 2013, 09:34 (UTC)

Díky. Víme o tom. Jde o to, že se zatím nevymyslelo, jak přesně nakládat s místními variantami jazyků (en-GB, en-US apod.), které tu jsou nekonzistentně uváděny na různých místech v různých kontextech (jedním z nich pak je, že byly dávány jako příznaky). Pokud vás něco napadne, tak se podělte...
Danny B. ( diskusemail přehled příspěvků ) 16. 4. 2013, 10:50 (UTC)
Osobně bych s tím nakládal stejně jako s příznaky – ve své podstatě je to téměř totéž jako příznak nářečně, jen specifičtější. --Reaperman (diskuse) 16. 4. 2013, 20:04 (UTC)
Tak jsem to zatím tedy přidal do příznaků, ale jsem toho názoru, že by se s tím mělo zacházet odlišně.
Danny B. ( diskusemail přehled příspěvků ) 17. 4. 2013, 15:13 (UTC)
Napadá mě možnost udělat nějaké zvláštní regionální příznaky, jak pro výslovnost tak pro samotná slova. Např. němčina má specifické výrazy používané v Rakousku, Švýcarsku, dokonce i dialekty místní (bavorský, saský atd.), i u mnoha českých nářečních slov je už "ručně" připsáno např. hantec, moravsky atd. Regionální výslovnost je součástí specifik jazyka, tak třeba by to šlo nějak sloučit? Zjevnou výhodou by byla možnost automatické kategorizace. --JOtt (diskuse) 18. 4. 2013, 07:38 (UTC)
Příznakem by mohlo být nářečně, ale pak se to musí ještě dále specifikovat. A nebo udělat po vzoru příznaků {{Varianta|hantec}}, {{Varianta|en-gb}} etc. JAn Dudík (diskuse) 18. 4. 2013, 18:19 (UTC)

(Please consider translating this message for the benefit of your fellow Wikimedians. Please also consider translating the proposal.)

Read this message in English / Lleer esti mensaxe n'asturianu / বাংলায় এই বার্তাটি পড়ুন / Llegiu aquest missatge en català / Læs denne besked på dansk / Lies diese Nachricht auf Deutsch / Leś cal mesag' chè in Emiliàn / Leer este mensaje en español / Lue tämä viesti suomeksi / Lire ce message en français / Ler esta mensaxe en galego / हिन्दी / Pročitajte ovu poruku na hrvatskom / Baca pesan ini dalam Bahasa Indonesia / Leggi questo messaggio in italiano / ಈ ಸಂದೇಶವನ್ನು ಕನ್ನಡದಲ್ಲಿ ಓದಿ / Aqra dan il-messaġġ bil-Malti / norsk (bokmål) / Lees dit bericht in het Nederlands / Przeczytaj tę wiadomość po polsku / Citiți acest mesaj în română / Прочитать это сообщение на русском / Farriintaan ku aqri Af-Soomaali / Pročitaj ovu poruku na srpskom (Прочитај ову поруку на српском) / อ่านข้อความนี้ในภาษาไทย / Прочитати це повідомлення українською мовою / Đọc thông báo bằng tiếng Việt / 使用中文阅读本信息。

Hello!

There is a new request for comment on Meta-Wiki concerning the removal of administrative rights from long-term inactive Wikimedians. Generally, this proposal from stewards would apply to wikis without an administrators' review process.

We are also compiling a list of projects with procedures for removing inactive administrators on the talk page of the request for comment. Feel free to add your project(s) to the list if you have a policy on administrator inactivity.

All input is appreciated. The discussion may close as soon as 21 May 2013 (2013-05-21), but this will be extended if needed.

Thanks, Billinghurst (thanks to all the translators!) 24. 4. 2013, 04:28 (UTC)

Distributed via Global message delivery (Wrong page? You can fix it.)

Související

Je zvykem psát související výrazy pod sebe. Nicméně v německých heslech, které podléhají v německé gramatice častému skládání a vzniku mnoha různorodých složenin, však často dochází k tomu, že je jich neúměrné množství a dlouhý seznam celkově hyzdí stránku. Příkladem budiž heslo Pferd nebo v tomto ohledu ještě mnohem horší Haus (a lze najít jistě mnohá další i s jejich vznikem v budoucnu počítat). Nebylo by lepší se domluvit a psát je do jednoho řádku za sebou, jak je tomu například právě na německém Wikislovníku? --Martin Kotačka (diskuse) 24. 4. 2013, 05:51 (UTC)

Nemyslím, že by to bylo zrovna nejvhodnější řešení, mít to jako html seznam je v mnoha ohledech výhodnější. Ale mohl bych dát dohromady udělátko, které by to zobrazovalo vedle sebe. I když co jsem koukal na ten Haus, tak to není žádná sláva ani tak. --Reaperman (diskuse) 24. 4. 2013, 21:15 (UTC)
Podobný problém mám s finštinou – stejně jako němčina totiž slova hojně skládá. Na anglické wiki to mají hezky vyřešeno, odvozená slova se vypíšou normálně, ale složeniny uzavřou do jakési „buňky“. Její obsah se zobrazí až po rozkliknutí (viz např. en:tuuli, coumpounds), navíc jsou slova roztříděná do více sloupců, takže to není ani tolik dlouhé. Vlastně podobný problém, který by se dal tímto rolovátkem řešit, je i šablona pro finská slovesa (Šablona:Sloveso (fi)). Upřímně si nedokážu představit délku hesla, až tam to časování vložím, a zkracovat šablonu o informace se mi také nechce. Mohly by se takto dlouhé údaje prostě jen zabalit? Zvýšilo by to přehlednost některých hesel. --Hellooo (diskuse) 25. 4. 2013, 04:11 (UTC)
Skrývání částí textu se mi moc nelíbí - například na cizích wikislovnících mi to u českých hesel vadí, u ostatních jazyků už méně. Nese to i další problémy, například na starším mobilu, který neměl javascript se mi kvůli rozbalení načítala znovu stránka. Ani na Wikipedii se v článcích neskrývá. Když už skrývat, tak jen pro ty, kteří si o nastaví.
Sloupce u souvisejících by určitě byly dobrý nápad.
JAn Dudík (diskuse) 25. 4. 2013, 05:40 (UTC)
I na Wikipedii se skrývá, např. navigační šablony. Myslím, že by se případně dalo pro to zhotovit nějaké udělátko, které by vám vše nechalo v rozbaleném stavu. Naopak mně by se víc hodil zabalený stav, protože jinak si nedokážu představit plně doplněné finské heslo. --Hellooo (diskuse) 25. 4. 2013, 06:54 (UTC)

Byla bych radši, aby to zůstalo tak, jak to je a řešilo se to udělátky pro zájemce. --Dubicko (diskuse) 25. 4. 2013, 07:11 (UTC)

Co se týče vlastního zaznamenání dat, tak ze sémantického hlediska je třeba, aby to bylo skutečně označeno jako seznam, tj * nebo #. To, jak to bude formátované, je už věcí jinou. IE8+ a další prohlížeče už to zformátovat do jedné řádky umějí, takže lze eventuálně vytvořit udělátko pro ty, kteří by tak chtěli (to samé pro případnou sloupcovou sazbu jako mají překlady - tu ovšem umí až IE10).
Z hlediska místního vývoje bych preferoval nejprve odchytat všechny chyby a nejednotnosti (teď při převádění na skriptování se řada neobjevených a neoznačených objevila a zdaleka nejsme u konce) a až teprve pak řešit formátování. Nehledě na to, že při řešení této sekce bude rovněž třeba přihlédnout k dříve zmiňované záležitosti jejího obsahu.
Danny B. ( diskusemail přehled příspěvků ) 25. 4. 2013, 09:12 (UTC)

Jen bych poznamenal, že aby mělo sloupcování u souvisejících smysl, mělo by platit, že jedna odrážka seznamu rovná se jednomu odkazovanému heslu (respektive "hnízdu" ekvivalentních variant), což bohužel stále ani zdaleka není pravidlem. --Reaperman (diskuse) 25. 4. 2013, 18:41 (UTC)

[en] Change to wiki account system and account renaming

Some accounts will soon be renamed due to a technical change that the developer team at Wikimedia are making. More details on Meta.

(Distributed via global message delivery 30. 4. 2013, 03:26 (UTC). Wrong page? Correct it here.)

[en] Change to section edit links

The default position of the "edit" link in page section headers is going to change soon. The "edit" link will be positioned adjacent to the page header text rather than floating opposite it.

Section edit links will be to the immediate right of section titles, instead of on the far right. If you're an editor of one of the wikis which already implemented this change, nothing will substantially change for you; however, scripts and gadgets depending on the previous implementation of section edit links will have to be adjusted to continue working; however, nothing else should break even if they are not updated in time.

Detailed information and a timeline is available on meta.

Ideas to do this all the way to 2009 at least. It is often difficult to track which of several potential section edit links on the far right is associated with the correct section, and many readers and anonymous or new editors may even be failing to notice section edit links at all, since they read section titles, which are far away from the links.

(Distributed via global message delivery 30. 4. 2013, 18:16 (UTC). Wrong page? Correct it here.)

Mírně odlišné skloňování křestního jména versus příjmení

Některá křestní jména se používají též jako příjmení, viz například Havel nebo Řehoř. Přitom podle IJP se skloňování křestních jmen a příjmení liší v dativu a lokálu singuláru, u křestních jmen jsou možné oba tvary končící -u/-ovi, u příjmení jen -ovi. Nabízejí se dvě možnosti, jak k tomu přistupovat:

  1. považovat za dvě různá slova s různým skloňováním, tak jak jsem před časem upravil heslo Havel;
  2. považovat za jedno slovo a informaci o užití zmíněných tvarů dativu a lokálu uvést pouze poznámkou pod skloňovací tabulkou.

Jak se na to díváte ostatní?

Pro úplnost ještě dodávám, že dalším případem odlišného skloňování dvou významů vlastních jmen je příslušník národa versus příjmení, zde k rozdílnému dativu a lokálu singuláru přistupuje i nominativ a vokativ plurálu, viz například Němec: národnost -ci (Němci, Poláci, Slováci…) versus příjmení -ové (Němcové, Polákové, Slovákové…). --Milda (diskuse) 5. 5. 2013, 09:18 (UTC)

Časté dotazy do jazykové poradny

Dovoluji si upozornit, že na inovovaném webu Ústavu pro jazyk český již nejsou dostupné odkazy na časté dotazy, několikrát je přitom máme v různých verzích použité (viz [1], [2]) a nedaří se mi vygooglovat tento dokument na webu ujc.cas.cz na jiném URL. Našel by někdo v archivu? --Milda (diskuse) 5. 5. 2013, 09:18 (UTC)

Já mám u sebe publikaci Na co se nás často ptáte, což je v podstatě výběr z těch dotazů, takže se dá případně něco přezdrojovat tím. Bohužel tam ale není všechno. --Reaperman (diskuse) 5. 5. 2013, 10:31 (UTC)

Prohlížeč slovníků DEBDict

Prosím, neuvádějte v referencích jako zdroj prohlížeč slovníků DEBDict (seznam odkazů s URL, lze vygooglovat i odkazy bez URL) provozovaný Fakultou informatiky Masarykovy univerzity. Není pro naše účelý dostatečně svobodný: přístup k němu je až po písemné registraci, kde se zavazujete nevyužívat získané informace ke komerčním účelům, přitom naše licence CC-BY-SA komerční užití umožňuje. Elektronické verze {{PSJČ}} a {{SSJČ}} jsou volně dostupné na webu ÚJČ, lze tedy odkazovat přímo na ně s využitím připravených šablon (s omezením, že na SSJČ nejde URL na konkrétní heslo), u ostatních slovníků nezbývá než odkazovat na knižní vydání. Pokud máte k dispozici ony tištěné slovníky, například SSČ, pomozte prosím tato hesla dozdrojovat (výskyt hesel ve slovnících lze hledat na adrese http://lexiko.ujc.cas.cz/heslare/, ve většině slovníků však konkrétní heslo zobrazit nejde). Díky. --Milda (diskuse) 5. 5. 2013, 09:18 (UTC)

Norština

Reaperman mne včera informoval, že se objevuje u norských překladů chybové hlášení. Po jeho opravě odkaz nesměřuje na norský wikislovník, ale do inkubátoru. Domnívám se, že by se spíš nemělo objevovat chybové hlášení. Pro úplnost uvádím, že aktivní projekt je na http://no.wiktionary.org. -xfi- (diskuse) 7. 5. 2013, 19:51 (UTC)

To je problém toho, že se tam zobrazují ty odkazy. Řešil jsem to o kousek výše. Pokud je něco v nynorsku nebo bokmålu, je třeba to mít tak označeno (= příslušné slovo musí mít označení daným kódem). Další důvod, proč tam ty odkazy nemít...
Danny B. ( diskusemail přehled příspěvků ) 7. 5. 2013, 19:58 (UTC)
A je kontrola v modulu správně vloženého kódu nezbytná? Šlo by stanovit výjimky? Šel by nadefinovat přepínač? Třeba i pro kódy en-US → en, pt-BR → pt, nb → no? Případně zaslepit neexistující… Já osobně mám odkazy do cizích wikislovníků, zvláště ten norský, rád. -xfi- (diskuse) 7. 5. 2013, 20:55 (UTC)

Tech newsletter: Subscribe to receive the next editions

Tech news prepared by tech ambassadors and posted by Global message deliveryContributeTranslateGet helpGive feedbackUnsubscribe • 20. 5. 2013, 20:23 (UTC)
Important note: This is the first edition of the Tech News weekly summaries, which help you monitor recent software changes likely to impact you and your fellow Wikimedians.

If you want to continue to receive the next issues every week, please subscribe to the newsletter. You can subscribe your personal talk page and a community page like this one. The newsletter can be translated into your language.

You can also become a tech ambassador, help us write the next newsletter and tell us what to improve. Your feedback is greatly appreciated. guillom 20. 5. 2013, 20:23 (UTC)

Mají tu místo takovéto typy kategorií (Kategorie:Germanismy v češtině), když podobná kategorie byla smazána? Pokud ano, tento název nebo jiný (České germanismy...)?--Zdenekk2 (diskuse) 28. 5. 2013, 13:48 (UTC)

Ne. K tomu slouží přílohy.
Danny B. ( diskusemail přehled příspěvků ) 28. 5. 2013, 13:56 (UTC)
Nerozumím. Čemu taková kategorie překáží? Není to spíše tak, že Wikislovník obohacuje? Děkuji předem za nějakou obšírnější argumentaci, proč by tato musela být přemístěna do Příloh. *Btw. diskusi k tomu, proč byla smazána zmiňovaná, Kusurijou zavedená kategorie, nelze (nebo minim. pro mne je obtížné) dohledat. --Pyprilescu (diskuse) 28. 5. 2013, 14:26 (UTC)
Kategorie tohoto typu mi zde nijak zvlášť nechybí. Navíc autorova definice „Česká slova snadno rozpoznatelná jakožto výpůjčky z němčiny, často stylově zabarvená“ je značně subjektivní. Toto je projekt, kde jsou prvořadé věrohodné zdroje, nikoli to, jak je pro koho snadné nebo obtížné rozpoznat původ slova z němčiny. --Milda (diskuse) 29. 5. 2013, 14:34 (UTC)
Dobře, nenavrhl byste tedy pozměnění definice (je-li nějaká vůbec nutná), tak, aby nebyla podle Vašeho názoru příliš subjektivní? Děkuju za dobrou vůli, --Pyprilescu (diskuse) 30. 5. 2013, 10:17 (UTC)
Seznam (příloha) germanismů s řádnými zroji určitě ano. Kategorizace možná, není to náhodou na příznak? ale musí být na základě zdrojů, né subjektivního názoru. JAn Dudík (diskuse) 29. 5. 2013, 19:45 (UTC)

Trademark discussion

Hi, apologies for posting this in English, but I wanted to alert your community to a discussion on Meta about potential changes to the Wikimedia Trademark Policy. Please translate this statement if you can. We hope that you will all participate in the discussion; we also welcome translations of the legal team’s statement into as many languages as possible and encourage you to voice your thoughts there. Please see the Trademark practices discussion (on Meta-Wiki) for more information. Thank you! --Mdennis (WMF) (talk)

Podpora projektů ze strany Wikimedia Česká republika

Dobrý den, ahoj.

jako jeden z řadových členů občanského sdružení http://cs.wikipedia.org/wiki/Wikimedia_Czech_Republic#Wikimedia_.C4.8Cesk.C3.A1_republika se obracím na zájemce o jednotlivé "malé" či chcete-li "sesterské projekty" nejznámější Wikipedie. Máte-li zajímavý nápad či konkrétní myšlenky na formy podpory ze strany Wikimedia ČR, budu rád, když zde zanecháte své komentáře. Zároveň vás zvu na pravidelné "Wikipivo" (setkání Pod reálnou lípou) - http://cs.wikipedia.org/wiki/Wikipedie:Pod_re%C3%A1lnou_l%C3%ADpou/Praha,_17._%C4%8Dervna_2013 , kde bych o možné podpoře malých projektů rád diskutoval s přítomnými. Pokud se účastnit nechcete, nemůžete, či chcete-li, aby tam zazněl váš názor, pište komentáře níže do pátku 14. června 2013. Díky za zpětnou vazbu. Pěkný den. --Krvesaj (diskuse) 6. 6. 2013, 13:08 (UTC)

Jak už jsem dříve zmiňoval na jiném místě, nejen projektům, ale i samotnému sdružení, by pomohla větší otevřenost a lepší komunikace. Tedy aktivně informovat o tom, co se ve sdružení děje, co se chystá, k čemu se mohou uživatelé jednotlivých projektů připojit. Na Wikipedii se člověk po nějakém hledání dozví občas něco málo, na metě bývají zprávy o tom, že něco už proběhlo a ještě odkazují na neveřejnou wiki sdružení, na sesterských projektech povětšinou vůbec nic. Nějaké výstupy z pravidelného Wikipiva pro běžné uživatele jsou taky vzácné. --Reaperman (diskuse) 8. 6. 2013, 11:27 (UTC)
Věřím, že aktuální nabídka prostoru na Wikikonferenci a ve Wikimedie (viz níže) je vstřícným gestem. Souhlasím s vámi, že písemné reporty z Wikipiv by nebyly ke škodě. Třeba tentokrát něco vznikne. Pěkný den. --Krvesaj (diskuse) 9. 6. 2013, 09:20 (UTC)

Prostor ve Wikimediu

Dobrý den.

Blíží se vydání časopisu Wikimedium (http://www.wikimedia.cz/web/Wikimedium). Uzávěrka materiálů nejbližšího čísla je 25. června. Jestli máte nějaké téma za Wikislovník, obraťte se na wikipedistu Okina, prostor ještě je. Dále je možné už nyní nabídnout téma za Wikislovník pro podzimní číslo. Pěkný den. --Krvesaj (diskuse) 7. 6. 2013, 15:24 (UTC)

Prostor na Wikikonferenci

Dobrý den, ahoj.

Rád oznamuji, že na letošní podzimní Wikikonferenci letos bude prostor pro "malé projekty". Každý z projektů nadace má předběžně vyhrazeno cca 10 minut (v případě důležitého či zajímavého tématu lze po domluvě samozřejmě pozměnit). Má-li komunita tohoto projektu zájem, je třeba dát vědět předsedovi Wikimedia ČR - Limojoe, který má organizaci letošní konference na starosti. Časový program se uzavírá 31. srpna 2013, po tomto datu již nelze přijímat témata ani přednášející. Díky a těším se na Wikikonferenci na viděnou. --Krvesaj (diskuse) 9. 6. 2013, 09:20 (UTC)

Předpokládají pořadatelé nějaké tematické zaměření na letošní Wikikonferenci, podobně jako na té loňské, na které by měli přednášející své příspěvky cílit? Jaký je předběžný termín konání? --Reaperman (diskuse) 9. 6. 2013, 19:16 (UTC)
Poptal jsem u Limojoea (organizačně zajišťuje) s odkazem na tuto diskusi. Věřím, že se brzy ozve. --Krvesaj (diskuse) 9. 6. 2013, 19:54 (UTC)
Zatím konkrétní zaměření není, byl bych rád, aby zaznělo něco o nových projektech např. Wikidata, mobilních projektech, nějaké nápady na digitalizaci v praxi (vlastní knižní skener?). Určitě se mnoho věcí vejde i do jedné vyčleněné sekce tzv. minipřednášek "lightning talks"--Limojoe (diskuse) 10. 6. 2013, 13:45 (UTC)
Z vlastní zkušenosti je 10 minut na smysluplné představení projektu málo. Na 1. konferenci jsem přednášel o Wikizdrojích, z tehdy nabízených 20 nebo 40 minut jsem si vybral kratší prostor 20 minut a ještě jsem trochu přetáhl – a to bychom měli, dle zvyklostí z dosavadních ročníků, počítat i s prostorem na dotazy. --Milda (diskuse) 10. 6. 2013, 21:12 (UTC)
Předpokládám, že ne všechny malé projekty budou požadovat 20 nebo 40 minut, takže je jistě šanci zeptat se Limojoea o větší prostor. Nevím, jestli tuto diskusi čte pravidelně, ale ve vlastním zájmu ti doporučuji oslovit jej individuálně. Těším se na zajímavou přednášku. --Krvesaj (diskuse) 11. 6. 2013, 10:28 (UTC)

Lidi z menších projektů = trollové?

Tak ruku na srdce, Krvesaji, tvá snaha získat náměty od menších projektů je myšlena vážně, nebo je to jen kvůli tomu, aby se umlčela kritika? Protože zatímco ty se tady o něco snažíš, tak jeden z funkcionářů WM ČR, který „sedí na penězích“ z Mediagrantu, píše v uzavřeném maillistu WM ČR (wikimediacz-l@lists.wikimedia.org) o lidech, kteří v minulosti pobočku kritizovali, jako o trollech a o jejich příspěvcích jako o plcích. Viz dnešní vlákno Otevřená wiki sdružení. --Milda (diskuse) 10. 6. 2013, 20:52 (UTC)

Má snaha je míněna vážně a zároveň doufám, že umlčí v kritiku v tom, že WM ČR nic malým projektům nenabízí. Tedy bych to neviděl tak, nebo onak. Co se týká zmiňovaného vlákna, nechápu přesně souvislost mezi názory jednoho z funkcionářů a názory jiných členů sdružení. Zkus přijít s konkrétním projektem a uvidíme, jestli bude průchozí. Věřím, že kvalitně napsaný projekt projde. Přinejhorším se vrátí s připomínkami. --Krvesaj (diskuse) 11. 6. 2013, 10:28 (UTC)

Inspirativní projekt z Wikimedia Srbsko

Dobrý den, ahoj.

V posledních měsících probíhá v prostředí komunity české Wikimedie poměrně zajímavá diskuze na téma rozvoje malých projektů. Pro český Wikislovník by šlo uvažovat o projektu postaveném na modelu spolupráce "Studenti píší Wikipedii" známém z prostředí české Wikipedie.

Kolega Aktron nás nedávno informoval o aktivitě na Filologické fakultě Bělehradské univerzity - šest tamních studentů arabistiky ve spolupráci s Wikimedií Srbska pracuje intenzivně na rozvoji prvního online arabsko-srbského slovníku. Před několika týdny již dosáhli mety 101. slova v arabštině. Záznam o každém slově jim trvá vytvořit cca 20 - 40 minut. Do budoucna chtějí přidat i vizuální příklady (fotografie, videa), a také zvukový záznam, jak se každé slovo správně vyslovuje. Projekt nese příznačný název "1000 a jedno arabské slovo".

O obdobné aktivitě by šlo uvažovat i v prostředí českého Wikislovníku. Pokud někoho myšlenka zaujala, ozvěte se Aktronovi pro podrobnosti. Pěkný den. --Krvesaj (diskuse) 9. 6. 2013, 19:54 (UTC)

Homografy

Prosím komunitu o radu či návod, jak postupovat, pokud v nějakém (jednom a témže) jazyce (v mém okruhu zájmu konkrétně japonštině) se vyskytuje slovo totožně zapsané, ale různě vyslovované, podle souvislosti a použití. Tento problém nenadnáším poprvé, ale dosud jsem omezoval přidávání takových výrazů, dále bych je již omezovat nechtěl, aby můj přínos nebyl neodpustitelně jednostranný. Jde o to, že pokud by chtěl někdo vyhledat tu variantu (ty varianty) výslovnosti, pod kterou/-ými slova nejsou zařazena do kategorie (dvojité zařazení nedává výsledek), tak nemá šanci. Navíc např. v kategorii japonská substantiva je momentálně přes 800 položek, tudíž slovo, zařazené jen podle jedné z variant výslovnosti podle těch dalších výslovností nemá šanci nalézt a ani náhodou o ně pohledem zavadit někde v blízkosti. Dokud bylo těch substantiv jen kolem 200, ještě šance byla, s přibývajícím množstvím přidávaných lemmat ta šance silně klesá. (příklad: 風車 [fúša](větrný mlýn)/[kazaguruma](větrník)). Pokud vím, podobý problém vyvstává i u čínštiny. Přitom nejde o nějaké výjimečné záležitosti, aby se nad tím dalo mávnout rukou... Díky za pochopení a případnou odezvu. --Kusurija (diskuse) 29. 6. 2013, 14:52 (UTC)

Dobrý den, vážený kolego, nevím, nakolik je to řešení využitelné pro Vaši japonštinu, ale zkuste mrknout na tohle. Ačkoliv je možné, že i toto bude záhy rozneseno na kopytech, pardon, chci říci: "nějakým způsobem umravněno", resp. srovnáno do latě

Srdečně, --Pyprilescu (diskuse) 29. 6. 2013, 15:47 (UTC) takyčlen komunity

Velmi děkuji za odezvu, milý kolego. Vámi uvedený odkaz má nedostatek v tom, že do kategorie/kategorií je řazen podle anglického pravopisu (což je pro hesla v latince vpořádku) a bez ohledu na výslovnost (která se až tak dalekosáhle neliší, začíná tímtéž písmenem, narozdél od ふ (fu)/か (ka), mezi kterými leží: ga, ki, gi, ku, gu, ko, go, sa, za, ši, dži, su, zu, se, ze, so, zo, ta, da, či, dži, cu, zu, te, de, to, do, na, ni, nu, ne, no, ha, ba, pa, hi, bi, pi. Což je víc, jak půl jejich "abecedy". T. j. v současnosti více než 470 slovíček (a to je kategorie zaplněna nerovnoměrně, protože jsem přidával více slovíček ze začátku abecedy, které nezasahují do té mezery. Tedy, pokud zařadím 風車 abecedně do kategorie pod kazaguruma, v okolí slovíček abecedně blízkých fúša nebude zařazeno a ani v blízkosti nebude spatřitelné. Čili termín budu moci najít pouze pokud budu znát výslovnost (nebo ji odhadnu jako) kazaguruma, ale nijak jej nenajdu pod srovnatelně stejně významnou výslovností fúša, neboť slovo do téže kategorie (podstatné jméno) lze zařadit pouze jednou a ani pokus o zařazení dvakrát jej podruhé nezobrazí. Navíc by bylo výhodné, kdyby čtenář měl ještě třetí možnost, a to vyhledávání podle kandži, nezávislé na výslovnosti. To dobře funguje u čínštiny, ale jen proto, že tam jsou slovíčka tímto jediným systémem zařazována. --Kusurija (diskuse) 29. 6. 2013, 16:22 (UTC)
Z principu se ve slovnících musí hledat podle písma, nikoliv podle výslovnosti (triviální young v angličtině nelze hledat pod j). Pokud by se mělo hledat podle výslovnosti, tak jedině pomocí nástroje Hledat (zakládat nějaké „výslovnostní“ kategorie je asi nesmysl).--Zdenekk2 (diskuse) 1. 7. 2013, 09:53 (UTC)
Potom tedy kategorie Japonská substantiva byla založena (nikoliv mnou) hned zpočátku chybně (skutečně?). A podle téhož principu i další japonské kategorie? No, o chybnosti takového postupu pro japonštinu bych si dovolil pochybovat už jen vzhledem k tomu, že převážná část papírových japonských slovníků je řazena právě na principu výslovnosti a ne podle toho, jakým znakem začíná. Takové slovníky samozřejmě také existují, ale i v Japonsku jsou v menšině (přesto hrají naprosto nezastupitelnou úlohu) a jinde jsou spíš vyjímečné nebo, ještě spíše, jako přílohy k "abecedně" podle výslovnosti řazeným. Tudíž zavádět minoritní princip by bylo pro český wikislovník nepřijatelným vlastním výzkumem. Nehledě na to, že i jinojazyčné wikislovníky řadí také japonská hesla podle výslovnosti. (Můj názor, kde došlo k logickému omylu: angličtina, narozdíl od japonštiny, používá totožný systém písma - totiž latinku - tudíž logicky musí být hesla řazena abecedně podle toho, jak se píší a ne podle výslovnosti). --Kusurija (diskuse) 1. 7. 2013, 11:32 (UTC)
Jakožto neznalec bych se ráda zeptala na pár otázek: 1) "Převážná část papírových slovníků je řazena podle výslovnosti" – Jak v nich potom řeší tento problém? Píšou dané heslo dvakrát? 2) Vím, že existují česko-japonské/japonsko-české slovníky, podle jakého systému jsou řazeny? Podle znaku nebo výslovnosti? Nebylo by zrovna na škodu tohle vzít v potaz. 3) Pokud i ostatní wikislovníky používají výslovnostní řazení, budou mít pravděpodobně stejný problém. Jak to mají vyřešeno (pokud to mají vyřešeno)? --Hellooo (diskuse) 1. 7. 2013, 18:58 (UTC)
  1. Ano, heslo (tedy stejně psaný tvar, v podstatě jsou to ale dvě (nebo více) hesla: s různou výslovností a různým (byť více či méně podobným) významem) píší na dvou (nebo více) místech. Zpravidla se odkazy na alternativní výslovnost neuvádějí. U příslušné výslovnosti (hesla) je uváděn jen příslušný význam - tedy neuvádí se význam podle alternativní výslovnosti. Tedy: ve slovnících řazených abecedně/podle godžúon. To je spíše nevýhoda papírových slovníků. Tedy kromě těch, které mají připojenu i část podle znaků: tam jsou uvedeny obě (všechny) pouze výslovnosti. Heslo potom dohledáte v části abecední.
  2. Česko-japonské (ani opačnosměrné) já osobně nepoužívám. Ty, co jsem kdysi dávno viděl, měly pro mne nevyhovující kvalitu, jaká je situace v současnosti, mi není známo, takže nemohu sloužit odpovědí. Ty, co jsem kdysi dávno viděl si matně vzpomínám, že byly řazeny abecedně.
    • Aby nedošlo k mýlce: používám i slovník(y), řazený(é) podle znaků (znaky jsou řazeny podle 214 radikálů) a to jak papírový, tak elektronický. A googlím převážně podle znaků, ne podle výslovnosti (z praktických důvodů: podle výslovnosti bych dostal mnohem méně výsledků a ty samé mnohem méně relevantní).
  3. A tady jste mě dostala, nemohu najít žádný wikislovník (ještě jsem neprošel ty, které používám méně často), kde by to měli nějak uspokojivě vyřešené. Navíc ve většině kategorizaci provádí automaticky nějaká šablona. Například na ja:wiktu 風車 nemají vůbec (respektive mají tam červené odkazy) jiná slova s uvedeným dvojím (či vícerým) čtením sice na en,fr,ja:wiktu mají, do kategorií je zařazují automaticky šablony, ale v kategorii podle slovního druhu zařazeny nejsou vůbec (procházel jsem jen podstatná jména). Ale například jsou dobře nalezitelná podle klíče: obsahují znak (např. 風) a nezáleží na tom, na které pozici ve slově ten znak obsahují. Nebo v kategorii: obsahuje 2 znaky (nebo: obsahuje 3 znaky). Obecně bych řekl, že v tom mají mnohde dost nepořádek. Nejspíš je to způsobeno tím, že se stroji takové věci dost těžko vysvětlují. ;-). --Kusurija (diskuse) 2. 7. 2013, 13:12 (UTC)
Mno, z pohledu laika se mi zdá nejrozumnější řadit zde na Wikislovníku slova v kategorii podle znaku – později by se snad mohl vymyslet nějaký nástroj/příloha, která by uživatelům pomohla slova hledat podle výslovnosti (i když ještě nemám páru, jakým způsobem by přesně fungoval). Tím pádem by tu mohly existovat obě varianty používané ve slovnících a uživatel by si vybral, podle čeho chce hledat (přičemž varianta schůdnější pro kategorie by byla přenechána kategoriím; v kategorii by pak bylo napsáno, jakým systémem jsou slova řazeny a případně by se přidal i odkaz na nástroj pro hledání přes výslovnost). Ty kategorie jsou celkově nějak nešťastné a z technického hlediska asi s nimi nic moc nevymyslíme (mám na mysli to dvojí zařazování slov do kat.). Stačí už jen to, že jsme jazykový slovník, ale české kategorie neumí řadit podle české abecedy (a tak tomu je u všech jazyků, které mají trochu jinou abecedu).
To je asi tak jediné řešení, které mě v tento moment napadá. Ale je to jen návrh. Konečné slovo je podle mě na vás, ostatně vy se v tom vyznáte a vám to ovlivní práci zde. --Hellooo (diskuse) 9. 7. 2013, 06:28 (UTC)
Tak "abecední" nebo spíše "godžúonové" řazení pro japonské výrazy by mělo mít přednost. A došel jsem k závěru, že ten anglický styl dalšího řazení podle "obsahuje znak tenanten" je jen z nouze ctnost, a to veliká ctnost (výborná pomůcka, na míle překonává možnosti papírového slovníku) - zřejmě způsobená nemožností to technicky řešit jinak. Totiž umožňuje vyhledat i slova, kde první znak neumíme nalézt (protože třeba je zařazen pod jiný radikál, než bychom očekávali). Ještě by se dalo uvažovat o založení duplicitní kategorie třeba Kategorie:Japonská substantiva (druhé čtení) nebo nějak podobně. Ale k tomu bych chtěl souhlas komunity, aby mi to po vložení nemalé práce někdo nezačal mazat. --Kusurija (diskuse) 9. 7. 2013, 09:37 (UTC)
Pokud zduplikujete jednu kategorii, pak byste musel všechny (adjektiva, slovesa, fráze...) a vznikne chaos. Navíc by se uživatel asi uklikal: vjede do jedné kategorie, nenajde heslo, půjde do kategorie s druhým čtením, nenajde, pak možná i třetí čtení (☺) a nakonec zjistí, že zde to heslo ani není založeno – ono tohle asi nikdo dělat nebude a prostě si to heslo, které hledá, napíše do hledacího řádku. Podle mě je zbytečné něco takového zavádět.
Jinak kdybyste potřeboval hromadně upravit všechna japonská hesla kvůli změně řazení, zkuste požádat někoho (Danny B.?) o robota, pokud by to ten robot zvládl. --Hellooo (diskuse) 9. 7. 2013, 10:34 (UTC)

Tak mě napadlo... na finském wikislovníku mají jednak kategorie kandži, hiragana a katakana (které máme), ale i rómadži (kterou nemáme; finská kategorie se ale od anglické liší – v anglické jsou hesla v přepisu, ale ve finské jsou třeba v katakaně a navíc přidány sem – tudíž v kategorii jsou hesla v katakaně, ale hledají se podle rómadži). Pokud jsem zjistila správně, rómadži je přepis do latinky, tudíž by zachytil i výslovnost (soudě z příkladu s větrným mlýnem, který jste uvedl výše). Mohly by tedy existovat dvě kategorie: jedna po vzoru anglické (Kategorie:Rómadži, by fungovala pro normální rómadži), druhá po vzoru finském (např. Kategorie:Japonská slova podle rómadži??? (nevím jak pojmenovat), pro vyhledávání dle výslovnosti). A v ostatních kategoriích by se hledalo podle znaku. Bohužel, aby to nevyhazovalo stejnou chybu jako teď (že to nechce zařadit 2x do stejné kategorie), musel by se přesně okopírovat finský systém, kde mají slova v kategorii rozdělena do dalších kategorií „Slova na f“, „Slova na fu“ (max. 2 úrovně). U téhle jedné kategorie by to nevadilo. Ale možná by stačila jen ta jedna kategorie Rómadži. Mohlo by to fungovat? --Hellooo (diskuse) 9. 7. 2013, 11:04 (UTC)

Tak já osobně se domnívám, že slova nejsou do kategorií zařazována jen kvůli absolutnímu (t.j. první písmeno: a, 2. c, 3. k, 4. n..., k tomu je opravdu vhodnější to vyhledávací okénko vpravo nahoře), ale k vyhledávání podobností, souvislostí atd., podle nějakého klíče, který, pokud jej uživatel najde, tak jej využije snáze, než přímým vyhledáváním. Alespoň já to tak používám. Z téhož důvodu je řazení podle godžúon daleko vhodnější, než abecední podle rómadži. Například つつく a つづく jsou si mnohem blíže podle godžúon (i na poslech) nežli abecedně podle latinky: cucuku vs cuzuku. Navíc godžúon řazení umožňuje naopak rozlišit stejně znějící, ale gramaticky odlišné "slabiky" づ vs ず (rómadži obojí zu), ぢ vs じ (rómadži obojí dži), おお vs おう (rómadži obojí ó) atd., podobně, jako v češtině rozlišujeme plot a plod, ačkoliv se vyslovují totožně. Takže řazení abecedně podle latinky v rómadži jen v případě krajní nouze. A za druhé, pokud odmítá kategorie dvakrát zařadit stejně psané slovo (t.j. název hesla - sic!) podle různých variant výslovnosti, vyjádřených v godžúon, stejně dobře jej odmítne zařadit dvakrát podle různých variant výslovnosti, vyjádřených v rómadži, v tom nevidím rozdíl. A pro taková hesla používat rozlišovač jako na wikipedii nevidím jako schůdné, jednak pro odpor komunity, ale především proto, že bych v tom viděl znesnadnění vyhledávání, překážku ve vnímání souvislostí a problémy s interwiki (nikde jinde to tak nemají).


A co komunita na možnost zařazovat do kategorií typu: Kategorie:Obsahuje 車 (příp. Kategorie:Japonský výraz obsahujující 車, která by umožňovala snadno vyhledávat podle znaků, nezávisle na umístění ve slově a i nezávisle na slovním druhu? (podobně, jako na en:wikt) --Kusurija (diskuse) 9. 7. 2013, 14:08 (UTC)

Klidně, jsem pro. --Hellooo (diskuse) 9. 7. 2013, 16:54 (UTC)
Já jsem proti. Nepořádku v systému a zbytečných kategorií jste tu už vytvořil dost, dalších několik tisíc takových opravdu raději ne. Pro hledání hesel, podle obsažených znaků jsou lepší automatické nástroje než manuální kategorizace, například yanker a seznam hesel, které obsahují znak 山 (samozřejmě i tenhle nástroj by mohl být lepší). --Reaperman (diskuse) 9. 7. 2013, 19:54 (UTC)
Kategorizace na základě složení/obsahu slova se eventuálně dá dělat automaticky, pokud by na ní byla shoda, to není třeba dělat ručně. Každopádně v žádném případě takové kategorie nevkládat jednotlivě, to by bylo zadělání si na značný nepořádek a následný velký úklid (anebo přerůst onoho nepořádku přes hlavu).
Každopádně toto by se mělo řešit v jiné sekci a ne zde, kde je téma jiné.
Danny B. ( diskusemail přehled příspěvků ) 9. 7. 2013, 22:13 (UTC)
Mně osobně je to jedno (už proto, že tomu pramálo rozumím). Na druhou stranu, v čem má spočívat onen zmiňovaný nepořádek v systému? Dá se k tomu někde najít něco konkrétnějšího? Např. v archivovaných diskusích? Kde? Děkuju, --Pyprilescu (diskuse) 10. 7. 2013, 09:08 (UTC)

Kategorizace přejatých slov

Tak například v japonštině je to nemalá část dnešní slovní zásoby (do této kategorizace bych nechtěl zařazovat slova, přejatá z čínštiny, to by byla většina slovní zásoby), která je přejatá ponejvíce z angličtiny a tím ovlivňuje i gramatiku japonštiny, různá (přejatá) slova dostávají stejný tvar. Myslím, že to dobře koresponduje i s totožným problémem i v jiných jazycích, češtinu nevyjímaje. To, že se projevil protest proti snahám takto kategorizovat způsobilo, že jsem opět upustil od zařazování takových slov a u již existujících jsem tu kategorii nepřidával, což m.j. vedlo ke smazání kategorie (viz diskuse výše). Podle mého, výrazy tak markantně (přejetím) ovlivňující jazyk by takto kategorizovány být měly. --Kusurija (diskuse) 29. 6. 2013, 14:52 (UTC)

1) Je řada slov, která v různých příbuzných (a někdy i nepříbuzných) jazycích vypadají stejně nebo velmi podobně. Podle čeho pak určíte, ze kterého jazyka to bylo fakticky přebráno?
2) Je řada slov, která byla přebírána z jazyka do jazyka a pak do dalšího a dalšího. Podle čeho pak určíte, ze kterého jazyka to bylo fakticky přebráno?
3) Co vám brání založit přílohu se seznamem takových slov?
Danny B. ( diskusemail přehled příspěvků ) 30. 6. 2013, 10:51 (UTC)
Jak se mi líbí takovéto zasvěcené připomínky:
  • ad 1) (částečně i 2)): Je řada slov, o kterých je to známo. Dokonce je někdy známo i jméno osoby, která jako první začala "razit" jeho používání. U slov, kde vyjádřená obava se může jevit jako velmi oprávněná, je jednoduché řešení - prostě ho nezařadit do nějaké příslušné kategorie.
  • ad 2) - z velké části viz ad 1). Slova, odpovídající naznačené situaci, by bylo možné řadit do kategorie "mezinárodní slova" (třeba; pokud by někdo pociťoval takovou potřebu).
  • ad 3) To myslíte vážně, založit nikdy nedokončitelnou přílohu se stovkami tisíc položek?? Cui bono? Jak by to pomohlo projektu? (Mám na mysli situaci, kdy obrovské množství daleko potřebnějších příloh zatím neexistuje a nejsou příliš zřejmé známky toho, že by v blízké době byly vytvořeny (a přitom nebyly smeteny se stolu či jinak srovnány do latě) - snad bych měl někdy na toto téma založit nový odstavec?). --Kusurija (diskuse) 1. 7. 2013, 11:07 (UTC)
  • ad Kusurija 2) Tady by se mohl narazit na problém "definice mezinárodnosti". Někomu by se tak mohla jevit slova, která se vyskytují ve stejné nebo v podobné formě ve většině jazyků (tím mám na mysli slova typu telefon, filozofie, atd.) a u těchto slov je původní jazyk celkem jasný. Ten název je matoucí, navíc by se ztratila původní myšlenka kategorizace podle konkrétního jazyka. Nějakou speciální kategorii se vším bych nezaváděla, přijde mi to zbytečné. Pro tento problém spíš vidím dvě řešení: buď to dělat jako na anglické wiki a zkategorizovat všechny jazyky (tedy např. heslo škola by bylo kategorizováno jako ze starořečtiny i z latiny), anebo bych prostě ignorovala jazyky, které sloužily jako prostředník pro přesun do jiného jazyka a kategorizovala bych je jen podle prvního jazyka, odkud se to slovo začalo šířit dál (škola by tedy byla kategorizována jen jako ze starořečtiny a ne z latiny; ostatně na podrobný popis tu je heslo). U druhé varianty by se jen muselo domyslet, jak moc daleko by ten řetězec šel (mám tím na mysli, aby někdo nešel až na kategorizaci podle prajazyků – např. raná finština, pozdní finština, praugrofinština, až k různým sporným praprajazykům).
  • ad Danny 3) Tady musím s Kusurijou souhlasit, v tomto ohledu příloha opravdu vhodná není: buď bude seznam moc dlouhý, nebo moc krátký. O těch dlouhých už pohovořil Kusurija. U krátkých to nemá smysl a byli by to jen adepti na smazání. To chcete zavádět např. přílohu "Finská slova z češtiny", která budou obsahovat tři slova? V případě kildinské sámštiny to bude zřejmě i jen jedno slovo. Jedině zavézt přílohu společnou pro určitou jazykovou skupinu, což bychom tu ale pak měli přílohy na různých stupních jazykových větví a rodin (což je dost chaotické). Nicméně už kvůli těm dlouhým o příloze nemá smysl uvažovat. --Hellooo (diskuse) 1. 7. 2013, 18:45 (UTC)

Kategorizace (odborných termínů) podle oboru

Na většině jiných wikislovníků je tento způsob kategorizace hojně využíván. Prosím komunitu, aby znovu zvážila, zda by takováto kategorizace nebyla užitečná. Přikláněl bych se k nepodrobné kategorizaci, v počtu kategorií na prstech spočítatelných. To, že na cs:wikt taková kategorizace chybí, citelně vadí: pokud mě zajímají slovíčka v určitém oboru, musím se probírat tisíci ve všech oborech. Vyhledávání na cs:wikt'u je snad nejobtížnější ze všech wikislovníků, kterými jsem se probíral. --Kusurija (diskuse) 29. 6. 2013, 14:52 (UTC)

P.S.: ...-ské/-cké palindromy jsou snad pro český wikislovík daleko přínosnější kategorie, než mnou navrhované oborové?? --Kusurija (diskuse) 29. 6. 2013, 14:58 (UTC)
Jsem pro. Myslím, že k tomu by šlo využít šablonu Příznaky, pomocí které se je už řada hesel oborově rozlišena. Stačilo by tedy do jen do šablony zadat nějaký příkaz ke kategorizaci hesla, ve kterém se vyskytuje, podobně jako u příznaků označující zastaralé, knižní, a jiné výrazy. Hlavně by se tím ušetřila ruční práce s procházením tisíců hesel, kterou nikdo dělat nebude. --Hellooo (diskuse) 29. 6. 2013, 16:05 (UTC)
Dodatek ke Kusurijově P.S., který Pyprilescu chytře smáznul (☺): Kategorii palindromů neberte prosím zle, navrhla jsem ji v dobré víře Wikislovník o něco málo obohatit, byť je to jen malý detail. --Hellooo (diskuse) 29. 6. 2013, 16:05 (UTC)
To v žádném případě neberu zle, omlouvám se, jen jsem si to zvolil jako kontrast (☺). Neberte si to osobně, to jsem neměl v úmyslu... --Kusurija (diskuse) 29. 6. 2013, 16:39 (UTC)

Universal Language Selector will be enabled on 2013-07-09

Nové číslo časopisu Wikimedium

Právě vyšlo v elektronické podobě ve formátu PDF nové číslo bulletinu Wikimedium. Dnes např. o Wikiprojektu Chráněná území, o odcházející Sue Gardnerové nebo o tom, jak Studenti píšou Wikipedii. A také s výzvou, aby lidé posílali své náměty třeba už do příštího, nejspíš pozdně podzimního čísla. Stáhnout si ho můžete na http://www.wikimedium.cz Okino (diskuse) 12. 7. 2013, 17:18 (UTC)

mezijazykové

Formát hesla o této sekci nic neříká, ačkoliv je velmi často používána (u zkratek a značek) jako označení "jazyka". Problém je, že se pokaždé nachází někde jinde: 1) na začátku stránky, před češtinou (např. v hesle ha), 2) na začátku stránky, za češtinou (např. h), 3) je řazena abecedně jako každý jiný jazyk (např. I). Kam by správně patřit měla? --Hellooo (diskuse) 22. 7. 2013, 07:27 (UTC)

1) (ha) je správně.
Danny B. ( diskusemail přehled příspěvků ) 22. 7. 2013, 07:32 (UTC)
Díky za odpověď. Pokud by měl někdo čas, budu ráda za dopsání do Formátu hesla. --Hellooo (diskuse) 22. 7. 2013, 07:56 (UTC)

zkratka/zkratky

Další sekce, o které Formát hesla nic neříká (nejedná se mi o rozlišení slovního druhu, ale o odkaz na zkratku určitého slova). V různých případech s nadpisem "zkratka" (např. v hesle miliarda) nebo "zkratky" (např. Afghánistán) se vyskytuje někde za sekcí význam. Je uvádění zkratek zvlášť OK, nebo to patří do synonym (jak jsem to doposud uváděla (nejen) já, např. ampér)? Pokud zvlášť, kam / v jakém pořadí vzhledem k ostatním sekcím? --Hellooo (diskuse) 22. 7. 2013, 07:50 (UTC)

Podle mého skromného názoru by zkratky měky být samostatná sekce hned za synonymy. --Kusurija (diskuse) 22. 7. 2013, 08:23 (UTC)
Taky jsem to přidával do sekce synonym s tím, že jsem před to dával ještě označení „(zkratka)“, tj. formátované stejně jako stylové příznaky. Uvádění v samostatné sekci by totiž mohlo být zavádějící v případech, kdy by se používala jako zkratka jen pro některý z uvedených významů, např. pro sekundu: zkratka jednotky času ano, ale hudebního intervalu nebo třídy víceletého gymnázia ne. Tedy jsem pro tuto variantu. --Milda (diskuse) 22. 7. 2013, 08:46 (UTC)

Pywikipedia is migrating to git

Hello, Sorry for English but It's very important for bot operators so I hope someone translates this. Pywikipedia is migrating to Git so after July 26, SVN checkouts won't be updated If you're using Pywikipedia you have to switch to git, otherwise you will use out-dated framework and your bot might not work properly. There is a manual for doing that and a blog post explaining about this change in non-technical language. If you have question feel free to ask in mw:Manual talk:Pywikipediabot/Gerrit, mailing list, or in the IRC channel. Best Amir (via Global message delivery). 23. 7. 2013, 13:02 (UTC)

Wikipedie chce učit

Sice opožděně, ale přece bych chtěl informovat o ŽoKu na Wikipedii. Wikislovníkářů by se to mohlo týkat v tom smyslu, že možná by se dalo uvažovat i o možnosti výpomoci studentů podobně, jako již existující program w:Wikipedie:Studenti píší Wikipedii. Viz w:Wikipedie:Žádost o komentář/Rozšíření pro Education Project. Děkuji předem za případné ohlasy. --Kusurija (diskuse) 24. 7. 2013, 10:11 (UTC)

Zajímavé to je - ale řekla bych, že hlavně pro pedagogické pracovníky jako možnost pestřejší výuky. Zatím jsem neviděla žádnou analýzu prokazující získání nějakých stálejších editorů wikiprojektů touhle cestou. Osobně jsem proti vynucování eitací od studentů tímto způsobem a nejsem si jista návratností vložených investic. Pokud se tomu někdo chce věnovat, nic mu nebrání, ale jsem spíš pro získávání editorů napříč generacemi. --Dubicko (diskuse) 24. 7. 2013, 11:15 (UTC)
Bože, jaké vynucování? Podle mne pouhé rozšíření možností: jestliže doposud k získání zápočtu z předmětu A bylo třeba to a to (+ a/nebo to), odnynějška to a to (+ a/nebo to, + a/nebo účast na wikiprojektu Studenti píší wikipedii). Pokud to je někde jinak, potom to wikipedisté vyučujícím buď špatně vysvětlili, nebo to vyučující pochopili po svém. Jinak jsem ale to upozornění psal především kvůli odkazu w:Wikipedie:Žádost o komentář/Rozšíření pro Education Project a vše ostatní pouze pro uvedení souvislostí... --Kusurija (diskuse) 24. 7. 2013, 11:41 (UTC)
Navrhuji počkat, jaké výsledky bude mít nasazení tohoto rozšíření na Wikipedii. Na našem úzce zaměřeném projektu – Wikislovníku – momentálně ani žádnou spolupráci s vysokou školou nemáme (i ohledně spolupráce s VŠ by bylo dobré znát podrobnější výsledky z Wikipedie, a to nejen kolik škol a studentů se do psaní článků zapojilo a kolik článků vzniklo, ale jak kvalitní články vznikaly v situaci, kdy zapojení studentů do psaní článků nebylo zcela dobrovolné, a kolik studentů v psaní pro Wikipedii pokračovalo i po udělení zápočtu). --Milda (diskuse) 25. 7. 2013, 20:51 (UTC)

IPA: Ligatury vs. spojovací oblouček

Podle Handbook of the International Phonetic Association (což je v podstatě norma) je používání ligatur (existuje jich šest pro nejobvyklejší afrikáty) zastaralé. Měl by se používat spojovací oblouček jako u ostatních.

Udělal jsem si statistiku dvou u nás asi nejběžnějších kombinací v heslech:

kombinace t+s t+ʃ
nic 1791 1145
ligatura 435 166
oblouček správně 26 57
oblouček chybně 0 0
tečka 298 159
  • Nic = znaky přímo vedle sebe → nutno opravit na správný zápis.
  • Oblouček chybně = chybně vložený spojovací oblouček až za spojované znaky, nikoliv mezi. Vzhledem k tomu, že jde o mrtvý znak, není zcela jisté, jestli jde takové kombinace vyhledat obecně regulárním výrazem, tj. je nutné brát tu nulu s rezervou.
  • Tečka = hranice slabik. (pro úplnost přehledu)

Jsem toho názoru, že bychom měli IPA zapisovat tak, jak Handbook praví, tj. s vázacím obloučkem.

Přidal jsem do editačních znaků pod editačním oknem spojovací oblouček - např. k napsání sekvence t͡s je třeba napsat "t", kliknout na oblouček a napsat "s". Oblouček se tedy vkládá mezi spojovaná písmena. Je známo, že písmo Arial s tím má problémy a někteří se proto snaží to obcházet pomocí chybného vložení ts͡, tj. obloučku až za "s" - to, prosím, nedělejme.

Ligatury může opravit bot automaticky, náhrady spojení bez obloučku či tečky vzhledem k tomu, že nejde automaticky rozhodnout, zda jde o vázanou či oddělenou výslovnost, bude třeba provést ručně. Seznam bych sem pověsil.

Následně bych zjistil četnost výskytů i dalších kombinací, které bude třeba ověřit.

Máte někdo připomínky k tomuto přechodu?

Danny B. ( diskusemail přehled příspěvků ) 4. 8. 2013, 16:27 (UTC)

Žádné připomínky mě momentálně nenapadají. --Reaperman (diskuse) 4. 8. 2013, 19:19 (UTC)
Nemám. --Dubicko (diskuse) 4. 8. 2013, 19:32 (UTC)
Připomínka/dotaz: jak byste zapsali v IPA slova odsun a ocún. (prosím, neopisovat z hesel či výskytů jinde, jde mi o Váš názor). Můj osobní názor je, že kvalita "ts" se v obou případech liší, narozdíl od (nejmenovaného) kolegy. Jinak jsem pro sjednocení tam, kde je znění skutečně stejné/natolik podobné, že by rozlišení činilo potíže, ale pro zachování rozdílů tam, kde skutečně rozdíly jsou a existují (+/-) nástroje, jak je odlišit. – Tento nepodepsaný komentář přidal uživatel Kusurija (diskusepříspěvky).
Jestli vám to pomůže, proč ne? Pro mě je to asi na stejné úrovni, jako diskuse, zda používat znaky z tradiční nebo zjednodušené čínštiny. JAn Dudík (diskuse) 4. 8. 2013, 19:50 (UTC)
Oops ;-) "díky editkonfliktu (který jsem nechtěl zmiňovat) jsem se zapomněl podepsat... A co se týče těch znaků, tak samozřejmě obojí (totiž: někdy je i více variant, někdy dokonce japonština modifikovala jinak, než čínština a někdy i jinak, než předchozí dva jazyky modifikovala korejština či vietnamština či různé "dialekty" čínštiny). Takže jednoznačně: všechny formy znaku (kandži. Takto se totiž dá (v nepříliš krátkém textu) na první pohled odlišit japonština od čínštiny (kromě dalších atributů).--Kusurija (diskuse) 4. 8. 2013, 20:05 (UTC)
Bude se tohle opravovat jen u češtiny, nebo u všech jazyků? U finštiny je IPA přepis jiný, i ostatní jazyky to můžou mít jinak. --Hellooo (diskuse) 5. 8. 2013, 09:08 (UTC)
Nenašel jsem, že by finština měla tyto afrikáty, resp. kombinaci. Máte nějaký příklad, prosím?
Danny B. ( diskusemail přehled příspěvků ) 5. 8. 2013, 13:16 (UTC)
Ve finštině to není až tak častý jev, ale pro příklad: [ts] – tsaari, tsunami, tseta, jätski, pitsa, zoologia (a snad vše, co začíná na z), aj.; [tʃ] – tšekki, tshetsheeni, aj.; dokonce i [dʒ] – Kambodža, maharadža, atd. Oproti češtině se tyto kombinace vyslovují zvlášť (jako [ts][tš]), ne současně (jako [c][č]) – ani to nejde, většinou se nejedná o původní finská slova a výslovnost je pro mluvčí trochu obtížnější. Zároveň v mnoha případech nejsou kombinace ts/tš ani na hranicích slabik, proto zde nebude ani tečka. Psaní [ts][tʃ] (případně s t̪) je ve finštině jediné správné. --Hellooo (diskuse) 5. 8. 2013, 14:12 (UTC)
Jenže tam jde o kombinaci [t̪s] nikoliv [ts] (resp [t̪ʃ] vs. [tʃ], tj. dentální t. Samostatné čisté ts/tʃ jsem nikde neobjevil.
Danny B. ( diskusemail přehled příspěvků ) 5. 8. 2013, 14:34 (UTC)

Odmazávání nezdrojovaných tvrzení

Pro označování pochybných a nezdrojovaných tvrzení zde máme dvě šablony: {{Ověřit}} označující celé heslo a {{Doplňte zdroj}} označující zpochybňované tvrzení.

Zatímco první má lhůtu 30 dní k mazání, druhá nemá lhůtu žádnou, ač jde v principu o stejný prohřešek.

Navrhuji proto, aby se tato lhůta aplikovala i zde a neověřená tvrzení se průběžně odmazávala.

Danny B. ( diskusemail přehled příspěvků ) 6. 8. 2013, 08:53 (UTC)

Souhlasím a jsem klidně i pro zkrácení lhůty. --Dubicko (diskuse) 6. 8. 2013, 09:32 (UTC)
Souhlas, já myslím, že 30 dnů je v pořádku. Problém vidím spíše v tom, že není vždy jasné, co se má ověřovat resp. k čemu ten zdroj chybí; příklad: heslo lame s neexistující diskusní stránkou. --JOtt (diskuse) 6. 8. 2013, 09:41 (UTC)
{{Doplňte zdroj}} se dává k jednotlivému zpochybněnému tvrzení. {{Ověřit}} tam, kde je těch zpochybněných tvrzení více (takže by heslo pak vypadalo jako vánoční stromeček ověšený {{Doplňte zdroj}}) nebo heslo jako celek.
Danny B. ( diskusemail přehled příspěvků ) 6. 8. 2013, 15:56 (UTC)
Souhlasím. --Tchoř (diskuse) 6. 8. 2013, 20:25 (UTC)
--Reaperman (diskuse) 6. 8. 2013, 21:05 (UTC)

Zatím jsem šablonu upravil tak, že podobně jako {{subst:Ověřit}} vkládá časové razítko, aktuálně bez lhůty.
Danny B. ( diskusemail přehled příspěvků ) 11. 8. 2013, 08:20 (UTC)

Reference v bublinové nápovědě

Přidal jsem nové udělátko, které zobrazuje reference v bublinové nápovědě - není tak nutné odskakovat/odrolovávat do sekce referencí. Je zapnuté jako výchozí všem, ale každý si ho může eventuálně vypnout v sekci Udělátka na stránce Nastavení.

Danny B. ( diskusemail přehled příspěvků ) 18. 8. 2013, 14:07 (UTC)

Nedostupné zdroje

V rámci postupné konsolidace zdrojů citací jsem narazil na některé online zdroje, které již nejsou přístupné. V minulosti toto potkalo např. i sekci častých dotazů Jazykové poradny ÚJČ. Máme pro označování takových URL šablonu {{Nedostupný zdroj}}. Upravil jsem ji tak, aby příslušné záznamy řadila chronologicky. Teď mě zajímá, jak se k takovým nedostupným zdrojům chovat, pokud se nenajdou náhradní. Zda je po nějaké době (jaké?) odstraňovat, nebo co jiného s nimi dělat… Jaký na to máte názor?

Danny B. ( diskusemail přehled příspěvků ) 19. 8. 2013, 00:34 (UTC)

Zachovejte tvář: pokud wikipedie a její "odnože" neoblomně stojí za nutností ozdrojovat informace, tím, že z internetu někdo odstranil informaci, odstranil i možnost zdrojování její pomocí a nejsou-li k dispozici další jiné zdroje, je nutno článek/heslo odstranit. To je přece nyní hlavní leitmotiv wikipedií: nepřipustit, aby se někdo dozvěděl něco, co nelze doložit. Jakákoliv taková informace by trestuhodně poškodila autoritu a pověst wikipedie. Přes tento zákon žádný vlak nejede. Pokud něco dříve existovalo, ztrátou či znehodnocením informace o tom to existovat přestává. Není, nebylo a už nikdy nebude. Dřívější paliči knih mohou teď jásat nad novými možnostmi: kvanta informací, která lze odstranit jsou nyní nesrovnatelně větší, než dříve: kopie knih si dříve mohl někdo nezodpovědně někde zazdít, informaci z internetu lze odstranit nenávratně. Tomu nahrává i nynější konzumní přístup lidí k informaci: jsou snáze přístupní zákonu, že co není psáno, není dáno. Howgh. --Kusurija (diskuse) 19. 8. 2013, 06:59 (UTC)
Paralen nebo ibalgin by mohl pomoci. --Milda (diskuse) 19. 8. 2013, 07:37 (UTC)
Vycházel bych z toho, jak moc ta informace vypadá, „uvěřitelně“ a jakou věrohodnost ten nedostupný zdroj má. Čím věrohodnější původní nedostupný zdroj byl, tím je větší šance, že to někdo časem dohledá v jiném věrohodném zdroji a do té doby nechť to tam je patřičně olepené. Málo věrohodné zdroje jako blogy, diskusní fóra, osobní weby apod. neuznáváme jako zdroj už teď, takže pokud jimi někdo v minulosti zdrojoval, klidně lze po čase smazat nebo přeznačit jako požadavek na zdroj. I na Wikipedii, tuším, platí, že s nedostupností online zdroje není nutné dříve ozdrojovanou informaci odstranit, i kvůli tomu (hlavně ale kvůli nezaručené neměnnosti informací) je v citačních šablonách online (elektronických) zdrojů parametr datum přístupu, ale náhrada nedostupného či těžko dostupného (placeného, v obskurním jazyce…) zdroje dostupným (volně přístupným, v běžnějším jazyce) je vždy vítána. --Milda (diskuse) 19. 8. 2013, 07:37 (UTC)

50 000

Patrně nikdo si nevšiml, že jsme již (včera) překročili kulatou hranici 50 000 hesel. Patrně jsou mnozí zaujati většími problémy, že nevidí důvody k oslavě? A těm, kterých se ty světobolné problémy netýkají, gratuluji. A to zejména těm, kteří se nejvíce přičinili. P.S. Ani na wikipedii jsem zmínku o překročení této mety nenašel... --Kusurija (diskuse) 19. 8. 2013, 08:16 (UTC)

:), wikipedie se to přece netýká... --Dubicko (diskuse) 19. 8. 2013, 08:37 (UTC)
Nikdo si nevšiml? A toho loga jste si asi nevšiml vy? ;-) Jinak na patřičná místa na Metu jsem to samozřejmě ihned dal.
Danny B. ( diskusemail přehled příspěvků ) 19. 8. 2013, 10:57 (UTC)
No, já bych si toho loga taky nejraději nevšimnul, ale stalo se… :-x --Mormegil (diskuse) 22. 8. 2013, 07:36 (UTC)
A mohli byste mi dát odkaz na to Vámi zmiňované logo, mně se dosud nepodařilo jej najít? Díky. --Kusurija (diskuse) 23. 8. 2013, 12:01 (UTC)
Možná bude stačit pomocí tlačítka F5 aktualizovat stránku. Případně zkusit přijít sem přes jiný prohlížeč. Také se mi pozměněné logo samo od sebe nezobrazilo. --Martin Kotačka (diskuse) 23. 8. 2013, 15:34 (UTC)

Převzatá slova z latiny v jiných jazycích

Na anglickém Wikislovníku mají v mnohých latinských heslech dle mého názoru zajímavou sekci Descendants, ve které uvádějí tato slova v podobách, jak je převzaly jiné evropské jazyky (viz např. armatura. Jelikož je latina základem významných evropských románských jazyků a jelikož obecně v latině není mnoho jiných možných informací k uvedení, napadlo mne, že by se tato sekce mohla zavést na českém Wikislovníku také. Jste pro? Případně nějaké jiné návrhy či připomínky? Jak případně tutu sekci pojmenovat, rozhodneme-li se pro její zavedení? --Martin Kotačka (diskuse) 20. 8. 2013, 06:45 (UTC)

Nebyl by to ale v podstatě překlad?--Zdenekk2 (diskuse) 21. 8. 2013, 22:26 (UTC)
U většiny slov patrně ano. Ale zde by šlo o tu etymologickou příbuznost vycházející právě z toho, že latina je jakousi pramatkou velké části významných evropských jazyků. --Martin Kotačka (diskuse) 22. 8. 2013, 05:38 (UTC)
Jsem pro všemi deseti. Myslím, že by to bylo vhodné i u jiných jazyků, jako třeba staroslověnština, stará řečtina a podobně. Jen by bylo vhodné s komunitou dohodnout vhodný název sekce. --Kusurija (diskuse) 22. 8. 2013, 09:09 (UTC)
@Zdenekk2: To by sice v podstatě překlad byl, ale z latiny. To by se křížilo s pravidlem, že překlady uvádíme jen v českých heslech. Takže tím myšlenka traktovat to jako překlad není vhodná. Myslím, že toto byl i smysl nadhozené diskuse. --Kusurija (diskuse) 22. 8. 2013, 09:15 (UTC)
Klidně pro. Co se týče krytí s překladem: možná se to z velké části krýt bude, ale existuje i řada případů, kdy "potomek" neodpovídá úplně svému "předkovi", co se významové stránky týče (např. latinské absentia a italské en:senza) – i z tohoto důvodu bude sekce přínosná, protože půjde tato slova dohledat. Pro název sekce mě napadá jen slovo "navazující" (s umístěním třeba na konci hesla, nebo jako podsekce etymologie), ale možná někdo vymyslí něco lepšího. --Hellooo (diskuse) 22. 8. 2013, 17:26 (UTC)
Technická poznámka: Do etymologie to určitě nepatří, ta je o tom, jak, odkud a z čeho vzniklo příslušné slovo, a nikoliv co následně vzniklo z něj. Z čehož mj. plyne, že pokud se v etymologii následně vzniknuvších slov zmíní příslušné latinské i s odkazem, bude se krásně moci využít praktický nástroj.
Danny B. ( diskusemail přehled příspěvků ) 22. 8. 2013, 19:39 (UTC)
A s etymologií souvisí dotaz, který se sem chystám asi půl dne napsat: budou se ta převzatá slova v jiných jazycích řádkově zdrojovat? Protože nezjevnou etymologii obvykle zdrojujeme důsledněji než jiné informace. --Milda (diskuse) 22. 8. 2013, 19:53 (UTC)
Samozřejmě, pokud se bude jednat o nezjevnou etymologii, pak je užití citace samozřejmě vhodné a nutné. Jinak obrátil jsem se s dotazem a obráceného principu etymologie a případného odborného termínu pro tento jev na některé profesionální osoby, resp. byla mi doporučena nějaká literatura, tak bych dal případně vědět, zda pro tuto věc existuje nějaký vhodý odborný termín, který by se dal použít jako název sekce. --Martin Kotačka (diskuse) 23. 8. 2013, 05:29 (UTC)

HTTPS for users with an account

Greetings. Starting on August 21 (tomorrow), all users with an account will be using HTTPS to access Wikimedia sites. HTTPS brings better security and improves your privacy. More information is available at m:HTTPS.

If HTTPS causes problems for you, tell us on bugzilla, on IRC (in the #wikimedia-operations channel) or on meta. If you can't use the other methods, you can also send an e-mail to https@wikimedia.org.

Greg Grossmeier (via the Global message delivery system). 20. 8. 2013, 18:54 (UTC) (wrong page? You can fix it.)

Rozdělení hesel na podstránky podle jazyků

Před rokem jsem představil nový koncept stránek hesel. Tehdy byly nějaké požadavky, které se nedaly vůbec, nebo složitě vyřešit, nyní díky zavedení Luy by měla většina jít.

Zde je aktuální přehled jednotlivých bodů provedení:

  1. Kořenová stránka bude řadit jazyky abecedně podle české abecedy s češtinou jako první.
    • Řešitelné via Lua. Zbývá určit, kde v pořadí bude "mezijazykové".
  2. Podstránky budou mít název kód jazyka, ale budou zobrazovat název jazyka.
    • Řešitelné. Stránka Foo/cs může mít třeba titulek Foo (čeština). Stačí se jen dohodnout, kterou podobu zvolit.
  3. Kořenová stránka nebude v kategoriích. Kategorizovány budou jen podstránky s daným jazykem.
    • Řešitelné několika způsoby via MW i Lua.
  4. (v případě, že kořenová stránka bude vypadat jako nyní) Správná hierarchie nadpisů (tzn. snížit nadpisy podstránek při vložení do kořenové stránky o jednu úroveň).
    • Řešitelné via Lua. Vyžaduje ovšem dodržování formátu hesla (lze do jisté míry vynutit editačním filtrem).
  5. Kořenová stránka by měla vypadat co nejvíce jako nyní.
    • Řešitelné via Lua.
    • Osobní poznámka - V takovém případě ovšem do značné míry ztrácí smysl to, proč se to dělá - rozdělení podle jazyků. Lze to ovšem vyřešit kompromisně ke spokojenosti všech pomocí volitelného načítání jednotlivých jazyků.
  6. Bude-li kořenová stránka vypadat jako nyní, umožnit eventuálně sbalování jednotlivých jazyků a při odkazu na konkrétní jazyk pomocí odkazu na sekci tento jazyk rozbalit zatímco ostatní sbalit.
    • Mělo by být řešitelné via JS & CSS. (Nezkoušeno, ale zároveň nejsou v tuto chvíli známy žádné překážky.)
    • Je otázkou, zda to bude zapotřebí, když se bude odkazovat přímo na podstránky.

Výhody:

  1. Jasný přehled o (ne)existenci hesel v daném jazyce, jsou-li stejná s jiným jazykem.
  2. Zjednodušení zadávání některých šablon - odpadne nutnost vyplňovat kód jazyka.
  3. Kontextová kategorizace (= již nikdy samostatně vložené kategorie, vždy pouze kontextově, čímž se zajistí synchronizace obsahu a kategorií - bude to vždy ve všech potřebných kategoriích a zároveň tam nebude nějaká zapomenutá navíc).
  4. Jednodušší zakládání hesel via předdefinované kostry nebo formuláře.
  5. přidáno 26. 8. 2013, 09:14 (UTC) Související data u sebe, tedy možnost editovat po sekcích. To v případě např. referencí nebo kategorizace na stránkách s více jazyky najednou nejde.
  6. přidáno 29. 8. 2013, 20:09 (UTC) Možnost automatického přidávání dat či jejich úpravy roboty. Na stránce s vícero jazyky značně obtížné až nemožné.

Jsou ještě nějaké požadavky, připomínky či dotazy k funkcionalitě nebo je možné začít pracovat na implementaci?

Danny B. ( diskusemail přehled příspěvků ) 25. 8. 2013, 23:14 (UTC), aktualizováno 26. 8. 2013, 09:14 (UTC) & 29. 8. 2013, 20:09 (UTC)

Myslím, že tenhle návrh vypadá dobře. --Tchoř (diskuse) 25. 8. 2013, 23:31 (UTC)

Jen abychom to jednou s nasazením Wikidat zase nemuseli zase celé předělávat. A do té doby by se hodil nějaký hack, který by zamezil interwiki robotovi dohledávat odkazy na hesla s lomítkem.
Jo, a mezijazykové navrhuji dávat hned za češtinu. Název jazyka v závorce je zavedený standard rozlišovačů, ponechal bych.
Za předpokladu, že mne odkaz hodí na podstránku konkrétního jazyka, by mělo být co nejjednodušší se dostat na stejné heslov jiných jazycích, tedy ze stránky Foo/cs se snadno dostat na Foo/en či Foo/tuv. A jak se pak zachovat k šabloně {{Viz}}? JAn Dudík (diskuse) 26. 8. 2013, 05:53 (UTC)
Díky za dotazy a připomínky.
Co se Wikidat týče, tak k nim mám informaci, že Wikislovník přijde na řadu až jako poslední a že to bude chvíli trvat, protože má dosti specifickou strukturu. Naopak se domnívám, že tímto rozdělením se tamnímu vývoji napomůže, neboť odpadne právě jedna z věcí, které to zesložiťují, což je několik jazyků na jedné stránce.
To s interwiki jsem poněkud nepochopil, můžeš to, prosím, nějak rozvést? Díky.
K mezijazykovým viz níže diskusi s Hellooo.
Rozlišování jazyka bude centrálně šablonou, takže když by se chtěl změnit formát třeba ze slovo (jazyk) na slovo – jazyk, nebude to problém, neboť se to změní na jednom místě, ale aplikuje všude.
Ad navigace mezi jazyky: Za předpokladu, že na kořenové stránce budou všechny jazyky vypsány, tak je to na jedno kliknutí pod nadpisem na odkaz vedoucí na kořenovou stránku. Za předpokladu, že tam bude jen jejich seznam, je to o jedno kliknutí navíc.
Šablona {{Viz}} je zajímavý bod, díky za jeho připomenutí. Můj osobní náhled na věc je ten, že se bude dávat do kořenové stránky - tam lidé přicházejí přes vyhledávání. Na podstránkách jazyků nemá smysl, protože na ty se člověk dostane jen kliknutím na nějaký odkaz zde, takže už ví, kam jde, takže netřeba mu nabízet alternativy. Jinak k té šabloně jako takové, resp. jejímu používání, budu mít časem také nějaké návrhy, protože dnes je její používání poněkud divoké.
Danny B. ( diskusemail přehled příspěvků ) 26. 8. 2013, 08:13 (UTC)
Ad interwiki:
Robot vezme vždy 60 stránek, jejichž názvy se pokouší dohledat na ostatních wikislovnících. Pokud je najde (shodný název, case-sensitivně), propojí články dohromady.
Pokud zavedeme podstránky, které žádná jiná jazyková verze nebude mít, bude relevantní dohledávat pouze názvy hlavní stránky, tedy bez lomítek. V případě zmíněného a jde o jednu stránku z deseti. Pokud budou existovat podstránky i u hesel, která jsou právě v jednom jazyce, bude zde minimálně 60% stránek, jejichž ekvivalenty prostě existovat nebudou. A jelikož dohledávání a propojování zmíněných 60 stránek trvá cca 15 minut, prodlouží se čas potřebný k doplnění odkazů k nově vzniklým heslům na více než dvojnásobe.
Řešením tedy bude zajistit úpravu skriptu, aby ignoroval podstránky (názvy obsahující /). To už má například jeden ze skriptů používaných pro doplňování interwiki na Wikidatech (jen pro šablony a NS 4). Ovšem omezení se pak dotkne i regulerních hesel typu I/O.
JAn Dudík (diskuse) 30. 8. 2013, 06:00 (UTC)
Když jsem se před měsícem ptala, kam sekce mezijazykové patří, odpověděl jste mi, že před češtinu (viz zde). Trochu teď tedy nechápu, proč se na to ptáte, nebo proč byste to chtěl měnit, když je to zavedeno takhle. --Hellooo (diskuse) 26. 8. 2013, 07:03 (UTC)
Já vím. A stále si za tím stojím. Ale přišlo mi korektní to zmínit jako věc, která tam minule řešena nebyla.
Danny B. ( diskusemail přehled příspěvků ) 26. 8. 2013, 07:53 (UTC)
Námitky jsem napsal již před rokem a také by bylo korektní vypsat i nevýhody: především nutnost zakládání dvou stránek místo jedné při dosud nezaloženém hesle a menší přehlednost, pokud by kořenová stánka nevypadala jako nyní. Pokud by kořenová stránka vypadala jako nyní, pak by se jednalo v podstatě o duplicitní zakládání hesel. Dnes není problém založit heslo hned pro několik jazyků, to bych si ale rozmyslel, pokud bych musel založit dvě stránky pro jeden jazyk a ještě více pro další jazyky, takže z mého pohledu jednodušší zakládání hesel nevidím, naopak.--Zdenekk2 (diskuse) 26. 8. 2013, 08:11 (UTC)
Ta nutnost tu není. Předpoklad je ten, že lidský uživatel zakládá podstránky s jazykem a bot (později možná sama MediaWiki) či formulář se postará o kořenovou stránku. Ta se musí editovat jen jednou - při zakládání. Pak už ne, neboť se o nové jazyky automaticky aktualizuje sama.
Představte si následující scénář: Otevřete stránku s formulářem. Do políčka vyplníte slovo, o němž píšete, z nabídky vyberete jazyk. Z další nabídky vyberete slovní druh, potažmo deklinační vzor. Podle vybraného slovního druhu a jazyka vám to nabídne i další gramatické kategorie (např. rod a životnost u jmen, tranzitivnost u sloves apod.) Samo zjistí, jestli existuje soubor s výslovností, a případně jej vloží. Automatická kategorizace, nemusíte se starat o správné zařazování. A tak dále. V podstatě by se tak dalo dosáhnout i konce zakládání minimálních hesel, protože za stejnou dobu, za níž "líný" (prosím, nebrat pejorativně) editor založí minimálku psaním wikitextu, přes formulář vloží informací více (nebo se některé vloží samy). Již téměř žádná nutnost psát wikitext nebo vzpomínat na formát hesla. Formulář se o vše postará sám. Tomu říkám maximální zjednodušení práce s Wikislovníkem pro editory. Samozřejmě, že nejprve u češtiny a pak přes nejpoužívanější jazyky postupně dále. Ale tohle prakticky není možné provést v okamžiku, kdy je více jazyků na stejné stránce.
Přehlednost je subjektivní záležitost, a proto je v návrhu řečeno, že by se mělo vyjít vstříc všem - tedy jak těm, pro něž je přehledné mít všechno nahňácané na jedné stránce, tak těm, kteří raději oddělenost.
Pakliže zmiňujeme korektnost, je třeba ji dodržet všude: Nejednalo by se o duplicitní zakládání hesel. Tomuto termínu by odpovídalo, kdyby někdo vkládal stejný wikitext na dvě stránky. Ale to se dít nebude.
"...založit heslo hned pro několik jazyků..." - tady jste se dotknul jedné klíčové věci, a to faktu, že se jedná o odlišná slova s mnohdy odlišnými významy, tedy logicky patří odděleně. (Nehledě na fakt, že máme-li třeba stránku a, tak na ní popisujeme 8 různých slov (+ mezijazykové zkratky a značky), ale navenek se to tváří, že popisujeme pouze slovo jedno. Takže ve skutečnosti Wikislovník nyní popisuje mnohem více slov, než aktuálně zobrazovaných ~50000, ale přitom nám tvrdí toto číslo.) Použiji-li paralelu s Wikipedií, tak tam také nepíšete na stránku řekněme "Koruna" o všech významech toho slova najednou, nýbrž máte rozcestník a ten odkazuje na články o tom kterém významu. Tedy když tam budete chtít zakládat heslo "Koruna", tak si to také rozmyslíte, protože byste podle tamního úzu měl rovněž založit stránek více?
Jinak jaký je vlastně tedy rozdíl v pracnosti v zakládání jedné stránky pro více jazyků najednou nebo více stránek pro každý jazyk zvlášť? Počet úderů do klávesnice je stejný, ba dokonce už i v současné demonstrační verzi dokonce menší, protože nadpisy na podstránkách jsou o úroveň výše, tedy minimálně u každého ušetříte dvě rovnítka, nehledě na další místa jako odřádkování apod. A co teprve až budou formuláře.
Danny B. ( diskusemail přehled příspěvků ) 26. 8. 2013, 09:11 (UTC)
Jen doufám, že využití formulářů bude rovněž dobrovolné, protože při čtení mi v hlavě vyskakoval jeden problém za druhým. 1) Výběr jazyka z nabídky je opravdu hrozné řešení (spousta jich tu neexistuje a i tak člověk bude rolovat nabídkou o minimálně stovce již existujících jazyků) – lepší by byla něco jako kolonka ve stylu HotCat, kdy člověk začne psát název jazyka a postupně se mu nabízí možnosti (v případě, že jazyk ještě neexistuje, prostě napíše název a po založení hesla uživatel založí i jazyk). 2) Výběr slovního druhu z nabídky je opět zbytečné, to by musela existovat nějaká databáze, který jazyk má jaké slovní druhy – buď to pak bude zjišťovat amatér a hrozí chyby, nebo bude třeba, aby měl Wikislovník uživatele, který se v jazyce vyzná (což u některých exotických jazyků může být problém). 3) deklinační vzor – spousta jazyků tady nemá vytvořené ani základní šablony pro deklinaci nebo konjugaci, kam se hrabou vzory – z tohoto hlediska bude nemožné vůbec skloňování/časování do hesla přidat. Dokonce ani finština, ze které už tu něco málo je, má méně než polovinu ohýbacích šablon, které by tu měly být, pokud by někdo chtěl založit jakékoliv heslo v celé své úplnosti a kráse. 4) najde soubor s výslovností a samo přidá – u toho pozor, na Commons je nejeden soubor s chybnou výslovností (jiné slovo nebo špatné čtení typu Benin [benyn]×[beňin]).
Ale abych nebyla moc kritická, formulář by možná byla dobrá věc, ale až v momentě, kdy má jazyk na Wikislovníku nějaké zázemí, případně kdy by se nemuselo všechno vybírat z nabídky – chce to i volnou ruku. Možná to, co jste psal, je jen výčet možností, co by se při rozdělení na podstránky všechno dalo udělat, ale reakci si to zaslouží. Moc ty formuláře přeceňujete, formulář se nepostará o vše. --Hellooo (diskuse) 26. 8. 2013, 10:56 (UTC)
Jen sem to letmo přečetla... k 3) to přece není problém - to všechno by se mělo vytvořit a k 4) pokud víte o tom, že některé nahrávky jsou chybné pak je navrhněte ke smazání, to je nejlepší postup. --Lenka64 (diskuse) 26. 8. 2013, 11:06 (UTC)
k ohýbacím šablonám: pro mnohé jazyky by těch šablon musely být desítky a jěště by zůstala nepravidelně ohýbaná slova. Některé typy slov by nusely mít šablony značně rozsáhlé, například v litevštině pro přídavná jména v ideálním případě je něco přes 150 tvarů, přičemž pro neideální případy některé tvary chybí, některé jsou "navíc" a některé mají pro různé tvary úplně jiné kořeny (podobně v češtině: dobrý - lepší). To jsem již řešil, někdo se mi do toho začal montovat a vytvořil "chlívečky" pro tvary, které nikdy v litevštině neexistovaly a ani z principu existovat nemohou. Pokud by se měly ty šablony naplňovat automaticky, tak by mohly výsledky být dost tristní. Tak jak to vidím v některých jiných jazykových verzích. Aby to potom nebylo na úrovni nebo dokonce horší, než google překladač. --Kusurija (diskuse) 1. 9. 2013, 20:42 (UTC)
Vyplňovací formulář funguje na podobné bázi jako každý správný editor wikiprojektu - před uložením poskytuje náhled k umožnění případné opravy dat před uložením. A ani po uložení není stránka nijak needitovatelná, stále je to normální wikitext jako nyní, takže je případné nedostatky možné opravit i posléze. Kromě toho, jestli se kvůli 20 % mimořádných případů nemá zjednodušit práce se zbylými 80 %, mi přijde neefektivní. Těch 20 % případů se může nadále řešit "postaru"/"klasicky" (= přímou editací wikitextu při zakládání stránky jako doposud), zbylým 80 % se naopak ušetří značné množství práce jejím maximálním zautomatizováním. Považuji to za lepší, než dělat celých 100 % případů nadále kompletně manuálně.
Danny B. ( diskusemail přehled příspěvků ) 1. 9. 2013, 20:59 (UTC)
Ještě to rozdělte podle významů a vyrobíte tu OmegaWiki. A jestli to budete bastlit nad neupraveným MediaWiki dynamicky v Lua, tak se vám možná povede i usmažit servery, což by byl teprve výkon. --Mormegil (diskuse) 10. 9. 2013, 07:58 (UTC)

Sraz?

Už je to nějakou dobu, co se tu navrhoval sraz místní komunity, který tehdy - vzhledem ke geografické roztříštěnosti a z ní plynoucí obtížné synchronizace - bohužel nevyšel. Třeba se situace za tu dobu aspoň trochu zlepšila a podaří se nám to skloubit dohromady. Píšu sem primárně pro oživení té - dle mého názoru - dobré a přínosné myšlenky; coby asi nejvíce nezávislý místní uživatel nechávám návrhy na místo a termín na těch, kteří mají omezenější možnosti...

Danny B. ( diskusemail přehled příspěvků ) 1. 9. 2013, 21:26 (UTC)

Já letos ne. --Dubicko (diskuse) 4. 9. 2013, 21:15 (UTC)
Praha by připadala v úvahu, nejlépe nějakou sobotu, i když na dnu mi až tak nezáleží. Ale ne dříve, než v říjnu. V ČB bych věděl o dobrém lokále, ale chápu, že je to pro některé dost z ruky.JAn Dudík (diskuse) 5. 9. 2013, 06:01 (UTC)

Sběr témat pro číslo 2/2013 časopisu Wikimedium

Protože se pomalu rýsuje termín letošní Wikikonference na konec listopadu, bude uzávěrka nového čísla bulletinu Wikimedium v polovině listopadu. Proto již nyní zvu všechny, kteří vědí o něčem zajímavém z Wikipedie a jejích sesterských projektů, aby mi napsali, raději ne tady (nemohu sledovat všechny kanály), ale buď na e-mail časopisu wikimedium(at)wikimedia.cz anebo na stránce w:Wikipedie:Pod lípou (Wikimedia ČR). Čím dříve náměty redakce dostane, tím lépe. Časopis bude distribuován opět elektronicky, ale zároveň bude vytištěn a bude rozdáván návštěvníkům Wikikonference a dalším zainteresovaným osobám, je tedy vhodnou cestou k propagaci úspěchů nejrůznějších projektů a aktivit. Díky. Okino (diskuse) 1. 9. 2013, 22:30 (UTC)

Prosba o vyjádření k (ne)úměrnosti správcovského zásahu

Dobrý den vespolek, prosím tímto zde působící členy komunity (tedy nejenom Mildu a Dannyho B.) o to, aby se vyjádřili, nakolik úměrné a obhajitelné (či naopak) jim připadá smazání CELÉHO hesla frajer správcem Dannym B. Podotýkám, že ano, vypršela tímtéž kolegou určená lhůta k úpravě, nicméně otázkou je, zda tato měla vůbec začít běžet. Mnou zanechaný stav hesla je k nahlédnutí v 1.editaci hesla obnoveného. Ne zcela rád zde poněkud ublíženecky kopu za své výtvory či pochroumané ego, nicméně s jistou mírou svévole a dvojího metru se u kolegy Dannyho B. nesetkávám poprvé. (Třeba to nebude jen moje zkušenost?) Děkuji, --Pyprilescu (diskuse) 25. 9. 2013, 11:47 (UTC) P.S. Zkusím to zformulovat ještě jinak: opravdu ony dvě snadno odstranitelné chyby a snad i jakási potřeba vychovávat nezbedného spolueditora váží více než přítomnost/nepřítomnost (troufnu si říci, relativně kvalitně zpracovaného) užívaného českého výrazu v našem projektu?

Já to nechci nějak podrobně zkoumat, ale řekl bych, že pokud nesouhlasíte s označením šablonou, pak by bylo lepší příště vyjadřovat nesouhlas už při označení šablonou, nikoliv až de fakto se smazáním. A možná by nebylo špatné mít jako na Wikipedii zvyklost, že u šablon odloženého smazání by neměl mazat ten, kdo to sám označil. Tím by se do jisté míry předešlo problému, kdy podezříváte jednoho uživatele z dvojího metru.--Tchoř (diskuse) 28. 9. 2013, 16:20 (UTC)

Wikislovník jako černá díra na strukturované informace

Tato diskuse sem byla přesunuta z Diskuse s uživatelem:Martin Kotačka#Přízvuky v latině. Blahma (diskuse) 28. 9. 2013, 14:14 (UTC)

Zdravím (a omlouvám se předem za svůj poněkud rozsáhlý příspěvek, ve kterém jsem byl požádán pokusit se vystihnout v souvislosti s touto diskuzí své hlavní důvody, proč jako počítačový lingvista nedovedu využívat pro další práci Wikislovník tak, jak by si to on zasloužil). Vkládání deklinačních šablon (a jakýchkoliv jiných vůbec) pomocí substituce má totiž základní problém: Při takovém vkládání se ztratí původní informace, ze které autor článku vycházel. V případě Martinovy ukázky jde o vzor, podle kterého se slovo "munimentum" skloňuje. Nikde nezůstane napsáno, že je podle vzoru "verbum", přičemž na nauce o vzorech (a memorování jejich deklinačních či konjugačních tabulkách) je naše soudobá výuka latiny založena. Obdobně to ostaně funguje i u jiných jazyků. Za absence té informace (proč ji ale v první řadě vůbec schovávat?) jsem si musel vypomoct ruční analýzou všech koncovek s tím, co znám z hlavy nebo co jsem si našel mezi šablonami či na anglickém Wikislovníku (a představte si, jak složitá taková orientace bude, pokud nepůjde o 12 tvarů substantiva, ale o nějaké složité sloveso s mnoha tabulkami), nebo se dá ještě řídit informací nad tabulkou, která uvádí "rod střední (neutrum), 2. deklinace (o-kmeny)". Proč to ale prosím vás uvádí jen jako textovou informaci, jako dvě položky seznamu, bez ladu a skladu, jejichž místo ani formát nejsou nijak předepsány a zdánlivě s tou šablonou nijak nesouvisí? Jak je zajištěna integrita dat? Kdo mi zaručí, že k takovému heslu někdo (ať už omylem nebo vandal) nenapíše třeba "rod mužský (maskulinum), 3. deklinace"?

A je v každém okamžiku zaručeno, že všechny tyhle textové informace (které bych já hned převedl na šablony) mají jednotný formát? Možná sice původně vznikají nějakou substitucí (hledal jsem dlouho, ale nepodařilo se mi najít, jestli se i celé latinské heslo vytváří substitucí, nebo se prostě zkopíruje a upraví z jiného existujícího hesla - to ukazuje, že používání substituce navíc znesnadňuje orientaci novým přispěvatelům, kteří z hotových stránek nedovedou odvodit, jak vznikly a jak by tedy mohli oni sami založit novou podobnou, resp. je to navádí k zakládání nových kopírováním, což není vhodné nebo je minimálně zbytečně zdlouhavé), ale jakékoliv opravy po substituci už pak každopádně probíhají přímo ve výsledném kódu, takže když třeba při nějaké manipulaci s heslem přepíšu (opět ať už schválně nebo třeba v rámci nějaké legitimní opravy) ty informace novými v nějaké nestandardní podobě (např. "střední rod" a ne "rod střední", nebo zapomenu na "o-kmeny", nebo popíšu vícerodá substantiva jiným způsobem, než jste zde zvyklí), hned tak vytvořím informaci, která je sice pro čtenáře dál pochopitelná (a dost možná stále úplně pravdivá), ale pro jakékoliv další hromadnější počítačové zpracování už pak naprosto nepoužitelná.

A právě to, že Wikislovník je orientován primárně na čtenáře a nepomýšlí na strojové zpracování (tj. je psán primárně ve wikikódu a šablony v něm, a zvláště tady v českém, vlastně jen jednorázově usnadňují editorům práci s vypisováním schémat), jej velkou měrou diskvalifikuje z většího strojového využití. Jak rád bych jako tvůrce počítačově-lingvistických aplikací využíval data z Wikislovníku!

První překážkou je už nutnost, muset si před napsáním parseru, který by mi vytahal z Wikislovníku data, zvolit jednu jeho konkrétní jazykovou verzi (proč ale prosím vás Wikislovník vůbec od počátku lexikografickou práci na každém jazyce dělá počet jazyků -krát? - tj. musím si nejprve vůbec vybrat, které z vydání Wikislovníku má latinská slova nejúplněji a nejvhodněji pokrytá... na něco jako Wikidata se mělo myslet ještě před vznikem Wikislovníku, protože by se tak všem strašně usnadnila práce a ušetřil čas - články nelze kopírovat, ale informace o slovech jsou z velké části "mezinárodní").

A druhým nedostatkem je pak právě zkušenost, že snaha o úspěšné využití zdroje se obvykle zasekne na výjimkách ve struktuře dat, které sice tvoří jen poměrně malou část celku, ale za to je jich tolik různorodých, že jejich pokrytí (typicky vyžadující množství manuálních oprav či složité programování detekce a ošetření výjimek) velmi znepříjemňuje, pokud to vůbec úplně neznemožňuje. A celá myšlenka muset parsovat text, abych z něj zpět získal informace, které byly jednou vloženy jako původně strukturované, je z pohledu jakéhokoliv dalšího automatického zpracování (nebo třeba i prostého vyhledávání - pokusil jsem se nyní např. vyhledat všechna latinská substantiva stejného typu jako "munimentum" a neuspěl jsem) zvrácená: Proč zde např. existuje - což je dobře - šablona {{n}} (vypisující "s"), ale podobná věc už neexistuje pro výpis onoho "rod střední (neutrum)"?

Na konec ještě jeden příklad: V rámci evropského projektu vedeného Masarykovou univerzitou brzy začne vývoj mnohojazyčného bezplatného internetového kurzu češtiny pro cizince, jehož důležitou součástí bude samozřejmě i mnohojazyčný překladový slovník. Zdálo by se být ideální ušetřit při jeho tvorbě veřejné prostředky, nevynalézat znovu kolo a využít co největší měrou dat již dostupných zde na Wikislovníku, samozřejmě s uvedením licence apod., což by tedy bylo zároveň i skvělou reklamou na Wikislovník. Jenže musím předem říct, a mrzí mne to, že raději budeme spolupracovat s počítačovými lingvisty a využijeme jejich data, ačkoliv třeba ne tak snadno dostupná, se složitějším licencováním apod. To proto, že data z Wikislovníku bych si musel nejprve sám složitě extrahovat (není divu, že to dosud více či méně úspěšně bylo provedeno pouze u několika málo jazyků - pátrání např. po seznamu všech slovních tvarů s přiřazením k nim jejich základních tvarů podle Wikislovníku ukáže k obecnému překvapení pramálo výsledků, přitom na Wikislovníku všechny tyto informace jsou - jenže ouha, v substovaných tabulkách, pro každý cílový jazyk jinak a taky v každé jazykové verzi Wikislovníku jinak). A také když už tam ty informace najdu, tak jejich nedostatečně formální struktura (srozumitelná pouze na pohled čtenáři, ale nikoliv už stroji) často znemožňuje jakékoliv jejich další zpracování a použití. Jako příklad si vezměme heslo pes: Pokud bych si chtěl z článku vytáhnout překlady toho slova do jiných jazyků, jdu se svým programem do sekce "čeština" (proč to není {{čeština}}, aneb kdo mi zaručí, že tam v tu chvíli, kdy data zpracovávám, nestojí zrovna třeba "český jazyk" a jsem jako programátor nahraný?) a tam prohlížím podsekci "překlady". Z ní by si zjevně šlo už prostě jen vytáhnout druhý a třetí parametr ode všech volání šablony {{P}} a dostal bych dvojice jazyk-překlad. Jenže ouha, ty překlady jsou rozděleny do tří částí (každá v šabloně {{Překlady}}), lišících se významem! Význam je popsán slovy (to ostatně moc líp udělat nejde, ani strojově). Takže bych na základě této informace vytvořil ve své databázi pro slovo "pes" tři významy a tyto významy blíže popsal. Jsou přece vypsány v sekci "význam"... Jenže ouha: Tam je významů za prvé šest (nikoliv tři), za druhé chybí jakékoliv provázání mezi "významy z překladů" a "významy v sekci významy" (i když alespoň pořadí tentokrát sedí) a za třetí jsou ty významy popsány v každé ze sekcí trochu, a někdy i dost podstatně jinak (u překladů: "zlý člověk" vs. u významů: "nedobrý, krutý člověk"), a jak si tedy mám být dál jistý, že jde pořád o jeden a ten samý význam, a který z popisů pak do své databáze vybrat (jeden, druhý, oba...?). Prostě hned u psa bych jako programátor zkrachoval, a nebo v lepším případě vydal výsledky jen velmi nepřesné a/nebo velmi omezené... Wikislovník se mi proto z mého pohledu jeví jako černá díra, do které lidé sypou strukturované informace, které z něj po vložení pak už nikdy nelze v původní podobě získat zpět. Jediné, co zůstává, je víceméně textové a jen pro člověka (snad) srozumitelné "povídání" o slovech. I proto bych do takového projektu sám za sebe nikdy nemohl přispívat a nepřispívám, a i proto se naopak tolik raduji ze vzniku Wikidat, která snad konečně budou lékem na "strukturovanou wiki" a která dovedou všechny naše wikiprojekty posunout v oblasti znovuvyužitelnosti mílovými kroky dopředu. Není proto divu, že se právě v těchto dnech o podobném postupu na Wikidatech hovoří i v souvislosti s Wikislovníkem, což mne velice těší. Blahma (diskuse) 28. 9. 2013, 12:31 (UTC)

Myslím, že by bylo vhodné tento příspěvek přesunout spíše pod lípu, protože kolem toho bude jistě delší diskuse, tak abychom nespamovali zdejší uživatelskou diskusi.
Danny B. ( diskusemail přehled příspěvků ) 28. 9. 2013, 13:23 (UTC)
Hmmmm... tak to já Wikislovník chápu jako výpomoc jednoho člověka druhému. Nikdy jsem to nebrala jako databázi "zadara" na vycucávání dat (to už mi lehounce zavání parazitismem). Jeden Wikislovník pro celý svět je ideál, který tvrdě naráží na množství radikálních wikislovníkářů na jednotlivých národních mutacích, kteří mají často velmi odlišné názory na jednu věc :). --Dubicko (diskuse) 28. 9. 2013, 13:25 (UTC)
S návrhem na přesun souhlasím a rád přesunu. Teď k tomu ještě čtu diskuzi na Wikidatech a hlavně sekce wikidata:Wikidata_talk:Wiktionary#Why.3F ukazuje, že jsou podstatné rozdíly v tom, kdo a jak vidí přínos Wikislovníku ve spíše textové resp. spíše strukturované formě. A zjevně je zde i problém v chápání významu svobodné licence: jakési "vycucávání zadara" (rozuměj: za uvedení zdroje a zpřístupnění odvozených dat pod stejnou licencí opět všem k "vycucávání zadara", což není málo a jde vlastně spíš o jakési "já teď pomůžu tobě, a ty jednou zas mně") je plně podporováno současnou licencí a předpokládal bych, že každý, kdo do projektů Wikimedia přispívá, si je tohoto vědom, když sem přispívá. Ale pokud je skutečně cílem většiny wikislovníkářů úmyslně data prezentovat tak, aby znovuvyužitelná nebyla, pak to jde proti cílům stanoveným nadací jako správcem tohoto projektu a do takového projektu už pak tuplem přispívat radši nebudu. Blahma (diskuse) 28. 9. 2013, 14:10 (UTC)
Já vycucávání beru jako žádoucí, jako něco, co je podstatou projektu. Informace o vzorech by tam, kde dává smysl a může být užitečná, být měla, ale nezdá se mi špatné, když tam bude v podstatě redundantně k substovanému. --Tchoř (diskuse) 28. 9. 2013, 14:21 (UTC)

Neumím opravdu erudovaně zhodnotit technickou stránku věci. Ale snad se na to mohu podívat pohledem idealistickým. Zarazila mne informace (kterou jsem slyšel již vícekrát), že zde často odvádíme práci, která je sice záslužná a přínosná, ale kterou by šlo dělat s minimálně stejnou, ne-li dokonce menší, námahou a která by navíc přinesla mnohem více možností pro další uživatele a zvýšila využitelnost našeho slovníku. A to mne trošku zarazilo a snížilo mou chuť do práce. Každý člověk, který přistupuje ke zdejší tvorbě s dobrým úmyslem musí být minimálně zaskočen, pakliže výsledek jeho snažení není plnohodnotný. A o to by nám mělo jít snad také v první řadě. Už pouze z toho důvodu, že český Wikislovník se vydal (jak zaznívá nejen zde v diskusích ale i v médiích) cestou právě co nejširší využitelnosti a okamžité kvality. Proč se tedy nesnažit právě o co nejplnohodnotnější možnosti využití pro co nejširší spektrum uživatelů? A navíc s pojistkou vůči domnělým vandalským chybám nebo jen omylům, kterým se občas z nepozornosti nevyhne každý z nás.

Zaznělo zde, že je Wikislovník pomoc jednoho člověka člověku druhému a ne databáze pro někoho, kdo je nepřímo nazván parazitem. Což však systém co nerozsáhlejší využitelnosti pro co největší spektrum uživatelů popírá samotný smysl Wikislovníku, resp. by jeho současné podobě nějak uškodil? Naopak, Wikislovník může jen získat, pakliže výše uvedené myšlenky a návrhy budou technicky proveditelné – což třeba případ největšího a zatím nejpropracovanějšího wikislovníku v anglickém jazyce ukazuje, že to patrně problém není. Zkusme se zamyslet nad tím, co nám to může přinést či zda nám to může v něčem uškodit.

Vkládáme zde své příspěvky pod volnou licencí. Tedy volně dostupné opravdu všem. Jako na Wikipedii nikdo nevlastní článek, ve zdejším prostředí nikdo nevlastní hesla ani zdejší databázi hesel. Proč ji tedy znepřístupňovat ostatním s více či méně skrytým úmyslem, že jednotlivá hesla si, čtenáři, přečíst/zkopírovat můžeš, ale ne v množství větším než malém. Věřím, že opravdu většina z nás vnímá vklad své práce a času do všech projektů Wikimedia jako službu veřejnosti a že některé výroky možná jen byly špatně pochopeny nebo jen vypadají vážněji míněné, než jak míněné ve skutečnosti jsou.

Tedy existuje nějaký netechnický důvod, proč nezačít přemýšlet o případné změně způsobu ukládání informací? --Martin Kotačka (diskuse) 28. 9. 2013, 14:45 (UTC)

Proč netechnický? Ta diskuse je ze své podstaty docela technická, ostatně i důvody, proč změnit způsob ukládání informace, budou pravděpodobně ze své podstaty technické, protože ukládání je technická záležitost. Nevidím důvod třídit argumenty na technické a netechnické.--Tchoř (diskuse) 28. 9. 2013, 16:07 (UTC)
Technicky je zřejmé, že to lze dělat jinak (pro následnou lepší a snadnější počítačovou zpracovatelnost aj.), jak nás o tom přesvědčují jinojazyčné Wikislovníky. Ovšem zazněl zde "filosofický" názor, že databáze není dělána pro to, aby se na ní dalo "parazitovat". Proto opouštím debatu o technických záležitostech ale kladu si otázku o samotném přístupu k věci. Tedy brání zavedení výše uvedeného nějaké jiné důvody než technické? Jestliže to zavést nechceme (nikoliv že nemůžeme), tak proč to tedy zavést nechceme. To byl smysl mé otázky. Snad je to vysvětleno dostatečně srozumitelně. --Martin Kotačka (diskuse) 28. 9. 2013, 16:17 (UTC)

(s editačním konfliktem) Těší mne, ale současně i děší, že se tu objevují takto dosti odlišné názory na směřování projektu Wikislovníku. Ale k tabulkám: Takže jako první krok bych viděl doplnění informací o vzorech (klidně i nějak skrytě, pokud není ochota to zobrazovat i uživateli, i když si myslím, že i ten by z toho mohl profitovat, např. pokud používá Wikislovník k učení se skloňování latinských slovíček) ke všem stávajícím deklinačním tabulkám. S tím by snad mohl panovat obecný souhlas, nebo by to aspoň těm, kdo to aktivně nepodporují, nemuselo vadit. Otázkou už ale třeba je, jak takovou informaci z tabulek zpětně odvodit? Tady už narážíme přesně na ty problémy známé "vycucávačům", které jsem popsal výše. Nicméně doplněním takové informace při současném zachování substovaných tabulek paradoxně ještě zvýšíme redundantnost informací v heslech a tím i riziko vzniku nekonzistencí. I když vím, že šablony jsou kvůli své "neprůhlednosti" někdy překážkou, jedině současné odstranění substování odstraní redundance a omezí množství uváděných informací na minimum, takže budou lépe kontrolovatelné a sníží se tím riziko, že např. - cituji z oné diskuze na Wikidatech - "someone comes in and vandalizes a single form on a Hungarian word, which might basically remain undiscovered for a long time" ("někdo přijde a zvandalizuje některý tvar maďarského slova, což pak může zůstat neodhaleno po dlouhou dobu"). Z toho pro mne vyplývá, že tato diskuze (bohužel) není zdaleka jenom o (ne)substování deklinačních tabulek, ale o práci s lingvistickými daty na Wikislovíku jako takové, i když snížení redundance právě např. odstraněním substování (neříkejte, že to nejde, když na anglickém Wikislovníku jim to takto funguje) může být prvním krokem k tomu cíli, proveditelným navíc na rozdíl od plánů s Wikidaty už dnes. Blahma (diskuse) 28. 9. 2013, 14:55 (UTC)

@Blahma: Popsala jsem svůj subjektivní názor. Jestli sem nechcete přispívat, nic se nestane. Nepříspívá sem dalších 10 mil. Čechů. @Kotačka: Doufám, že cs slovník nikdy nebude jako en, ta největší sbírka minipahýlů a nepřesných info. --Dubicko (diskuse) 28. 9. 2013, 15:11 (UTC)

Ty minipahýly a nepřesnosti jsou způsobeny výše navrhovanou podobou šablon? Jestliže ne, nechápu, v čem je smysl této poznámky vůči tématu diskuse. (Jinak rád bych vás poprosil, abyste používala pro oslovení celé mé jméno. Děkuji za vstřícnost a slušnost). --Martin Kotačka (diskuse)
To jen, že ohánět se modlou en slovníku není vhodné v jakémkoliv směru, protože jeho nedostatky jsou mnohem větší než jeho malé klady. Oslovovat vás budu tak, jak uznám za vhodné. --Dubicko (diskuse) 28. 9. 2013, 15:39 (UTC) PS: pokud se dožaduje slušnosti člověk, který palcuje prohlášení o wikilůze na slovníku, je to spíš k pobavení
Pokud někdo označuje editory Wikislovníku za lůzu, bylo by dobré ho upozornit, že osobní útoky i mimo samotné projekty se na projektových komunitách nadace moc netolerují. A navíc, k čemu jsou? --Tchoř (diskuse) 28. 9. 2013, 16:03 (UTC)
Tedy není důležité nahlížet na něco, zda je dobré a přínosné ale jen odkud to pochází? Takže takové to "Politicky, Halík. Myslete politicky!"? Krom toho nevím, zda a vůbec v čem si může český Wikislovník stěžovat na ten anglický. Ale upřímně rád se nechám konkrétně poučit o jeho chybách. P.S. já vás právě žádám, abyste uznala za vhodné chovat se slušně. --Martin Kotačka (diskuse) 28. 9. 2013, 16:11 (UTC)
Aha, takže vy chcete po ostatních, aby s k vám chovali slušně, ale sám se tak nechováte. Tak to běžte na wikipedii, tam je takových křivých osobností plno = přátelštější prostředí pro vás. A chápu, že pro editora, tvořící šablonovitě latinské tvary, je en slovník ideální vzor. --Dubicko (diskuse) 28. 9. 2013, 16:26 (UTC)

Pro Blahmu: Ta redundance podle mého názoru není nijak škodlivá. Argument, že to usnadňuje vandalizaci, moc nechápu. V každém systému budeme muset umožnit zadání nepravidelnosti, a jakmile umožníme zadání nepravidelnosti, pak se samozřejmě může jednat o nepravidelnost vandalskou. Já nejsem zásadní odpůrce nesubstování, nicméně obavy z vandalů se mi jako argument zdají nedostatečné. --Tchoř (diskuse) 28. 9. 2013, 15:50 (UTC)

Souhlasím, že jazyk není zdaleka tak pravidelný, jak se ho gramatikové snaží popsat, spoustávajíce ho do kategorií a vzorů. Ale když to dovedou řešit na anglickém Wikislovníku (zpracovávají přece stejná slova jako my zde, ne?), tak by stálo za to prozkoumat, jak to tam zvládají (sám nevím, ale představuju si, že do šablony lze přidat další parametry, které přebijí defaultně generované pravidelné tvary). Pro pochopení, hlavně směrem k Dubicko: Ta argumentace anglickým Wikislovníkem není proto, že bychom ho museli za každou cenu napodobovat, ale jako ukázka, že když to jde tam, tak to musí jít udělat i tady. Samozřejmě je ale jen na našem rozhodnutí, jestli to chceme nebo ne. A dotaz Martina Kotačky po těch "netechnických důvodech" směřuje podle mého chápání právě k tomuto: Pomineme-li případnou technickou náročnost či dokonce případnou neproveditelnost takových technických změn, které by snížily redundanci a zvýšily integritu informací v heslech a dlouhodobě přispěly ke snazší mezijazykové spolupráci a urychlení práce wikislovníkářů, má komunita výhledově zájem o jejich provádění? Blahma (diskuse) 28. 9. 2013, 19:48 (UTC)

Martin Kotačka tady zakládá výhradně (nebo téměř výhradně) latinská hesla, kde to skloňování asi bude do značné míry pravidelné (přiznávám se, že po 20 letech od základního dvousemestrálního kurzu a zkoušky z latiny si jen máloco pamatuji). Přitom stačí uvážit mateřský jazyk češtinu, abychom zjistili, že situace není tak jednoduchá. Máme 6+4+4=14 základních vzorů, k nim nějaké podvzory (les) nebo vzor pro adjektivní skloňování (Jiří), ale nestačí to, abychom postihli všechny rozdíly oproti vzorům (změny kmenových souhlásek, krácení kmenové samohlásky, přidávání/vypouštění samohlásky v připonách), a tak si pro generování tvarů vypomáháme dalšími desítkami našich pomocných vzorů ({{Vzor slovník}} versus {{Vzor hříbek}}, přitom je to vzor hrad; {{Vzor kočka}} versus {{Vzor buňka}}, přitom je to vzor žena), a ani to často nestačí, takže použijeme sice nejbližší generátor tvarů, ale i tak musíme v několika pádech přepisovat vygenerovaný tvar. To pomocí vzoru a kmene nepostihnete, pokud volaná šablona nebude "v sobě" mít stovky výjimek. A což teprve odlišné skloňování téhož slova v různých významech (Havel jméno versus příjmení, Polák národnost versus příjmení), myslíte, že je lepší společná tabulka a k tomu ještě několik řádků poznámek? Jako editorovi, jako čtenáři i jako občasnému programátorovi mi připadá lepší mít tvary definované jako pád = tvar, přičemž je záhodno se shodnout na vhodném systému označování pádů v různých jazycích (což kódy typu snom a pins IMO jsou). To nevylučuje, že tam může být uvedena i informace o vzoru, ale je dobré si uvědomit, že vzor je, na rozdíl od gramatických kategorií typu rod nebo vid, pouze pomůcka pro tvoření tvarů (argumenty pro a proti už tady mohly zaznít někdy dřív, protože pokud se nepletu, v minulosti se tady uvádění vzorů v heslech diskutovalo). --Milda (diskuse) 28. 9. 2013, 17:08 (UTC)

Mildo, oceňuji tvou znalost problematiky a děkuji za uvedení mnoha problematických příkladů z češtiny. Souhlasím, že vzor je jenom nástroj jazykovědců, kterým se pokoušejí živý jazyk sešněrovat do diskrétních kategorií. Počítačoví lingvisté na FI MU rozlišují pro substantiva přibližně 2000 vzorů, po zahrnutí právě těch všech výjimek, o kterých píšeš. Nevím a nechci rozhodovat, zda nebo jak takové vzory reflektovat i zde na Wikislovníku, a o tom ani tato diskuze snad primárně není. Tady jde naopak primárně právě o ta (téměř) výhradně pravidelná slova, která po substituování během vložení tuto svou pravidelnost na pohled ztrácí a na čtenáři (ať uznalém, nebo ještě hůře neznalém) je ponecháno, aby si pečlivým prohlížením celé tabulky a jejím porovnáváním s jinými tabulkami nebo se svou pamětí zpětně odvozoval, ke kterému vzoru lze (alespoň přibližně) dotyčné slovo přiřadit. Vždyť my lidé se neučíme slova cizích jazyků memorováním výčtů všech tvarů každého z nich, ale právě jakýmsi přiřazováním ke vzorům. Nejde mi ale nakonec primárně o vzory - to je jen jeden z příkladů, skrz který jsme se s Martinem k problému nedostatku struktury na Wikislovíku dostali. Pokud si to wikipedisté dobře pohlídají, mohou být klidně slova nadále reprezentována vypsáním všech jejich tvarů, ale nemělo by docházet k tomu, aby 1.) musela být stejná data kopírována mezi mnoha místy (tabulkami, hesly, jazykovými verzemi); 2.) byly lexikografické informace do hesel dále kódovány v takové podobě, ve které je nelze vůbec nebo jen velmi nesnadno zpětně strojově zpracovávat (ať už rovnou za úkolem extrahování, nebo třeba i jen pro prostou kontrolu konzistence slovníku či třeba umožnění vyhledávání slov podle různých jejich vlastností). Pokud mám zopakovat otázku pro všechny, pak tedy: Souhlasíte, že takový stav je dosaženíhodný?
A ještě snaha o vysvětlení pro Dubicko: Prosím nechápejte má vyjádření jako pohrdání Wikislovníkem. Spíše se snažím konstruktiví kritikou rozproudit změny, které by nám všem ulehčily situaci a pomohly projektu stát se ještě lepším. To, že do něj v jeho stávající formě nepřispívám a nehodlám přispívat, je jedna věc (třeba na to ani nemám čas nebo sílu, kdoví...), ale to, že nabízím své znalosti a snažím se mu pomoci a posunout ho někam dál, podle mne i tak vyjadřuje, že mně jeho osud není úplně lhostejný. Blahma (diskuse) 28. 9. 2013, 20:07 (UTC)

Za prvé bych chtěl poznamenat, že jsem diskusi nečetl celou, moc dlouhé, ale jen tak zběžně prošel, takže si dovolím jen několik poznámek.

Hovoříte o tom, že Wikislovník nejde strojově zpracovat. Jde. Samozřejmě, Wikislovník není strojově tvořená databáze, takže to není úplně jednoduchá záležitost, ale troufnu si říct, že ze všech českojazyčných wikiprojektů je na strojové zpracování kompletního obsahu připraven nejlépe. Na lepší podporu pro strojové tahání dat si budeme muset počkat, s čím přijdou Wikidata. Wikislovník vznikl rok po Wikipedii (tedy v době, kdy wiki byla v úplně jiném stavu než dnes), požadavky na centralizaci dat tu jsou prakticky od samého počátku (příkladem budiž OmegaWiki), vývojáři ovšem nevyslyšené, jelikož většina featur je určena primárně pro Wikipedii a Commons a teprve sekundárně se něco využije na sesterských projektech (obecně s většinou těch problémů pro strojové zpracování, jako je ten příklad u překladů, si běžte přednostně stěžovat na vývoj MediaWiki, že se na slovník deset let v podstatě kašle). Zároveň, pokud by někdo chtěl tahat jen konkrétní tvary slov, tak současný stav na cs.wikt je pro něj o poznání jednodušší i pro strojové zpracování, protože mu stačí ty tvary prostě natahat z hesel, oproti tomu, když by z hesel tahal vzory, které by pak parsoval přes další databázi vzorů a jim odpovídajících tvarů.

Český Wikislovník není tvořen roboticky ale úsilím reálných lidí (ono je také v češtině akutní nedostatek zdrojů, které by šly licenčně vycucat pomocí skriptu a zároveň měly obsah na požadované úrovni wikislovníkového hesla), takže obsah je kompromisem mezi strojovou a uživatelskou přívětivostí. Ono je totiž dost problematické lákat nové editory a zároveň je nutit učit se speciální šablonu na každý "prd", který sem chtějí vložit. I já, jako docela zkušený uživatel občas bublám, když se musím proklikávat k seznamu vzorů, abych našel ten správný, a stejně tam musím dost často jeden dva tvary přepisovat. Jak bych asi bublal, kdybych měl hledat v těch zmiňovaných 2000 vzorech. I oprava chybného tvaru je jednodušší, když ty tvary před sebou vidím, než kdybych se měl prokousávat do dokumentace k šablonám, jak to opravit u "nesubstované" verze vložené šablony.

Vloženým deklinačním a konjugačním šablonám klidně parametr vzoru doplňte. Ale opět, má to být ten základní vzor (pán, hrad, muž, ...) a nebo ten speciální podvzor. V prvním případě z toho skript stejně nevytáhne o moc víc, než když zanalyzuje několik rozhodujících pádů, ve druhém narážíme na problém, kde má uživatel hledat, který vzor to má být, z těch stovek možných (většina místních názvů podvzorů není oficiální, ale je to název, který náhodně zvolil jejich autor (často před mnoha lety, kdy se dokonce tvary nevkládaly snadno zpracovatelnou šablonou, ale natvrdo vloženou tabulkou (protože to jinak ani pořádně nešlo a bez vypsaných tvarů v podstatě nešlo tvar vyhledat)).

Co se týče plíživého vandalismu, to je obecný problém wiki, objevuje se na Wikipedii, kde také často zůstává léta neodhalen, objevuje se i na dalších projektech. S tím je prostě třeba na projektech typu wiki počítat. Pokud tu někdo začne zakládat svahilská slova, tak tu pravděpodobně beztak nebude nikdo další, kdo by dokázal ověřit, jestli to nejsou nesmysly, i kdyby tu nakrásně výpis jednotlivých tvarů nebyl povolen.

Ani ten slavný en.wikt to (například v překladech) nemá o moc lepší. Snad akorát díky většímu počtu uživatelů s různou jazykovou základnou jsou překlady lépe pokryty podle jednotlivých významů. Ale jaká hrůza, názvy jazyků tam nejsou šablonou, ale natvrdo vypsány. Co když tam bude v některém jazyku překlep? Na en.wikt si totiž nevystačím se spoléháním se na t+, t-, tø, protože řada překladů dokonce vůbec není šablonovaná. A kdo mi zaručí, že některý ten překlad není zvandalizovaný. Při počtu hesel tam je dost nepravděpodobné, že zrovna někdo znalý zrovna narazí na plíživě zvandalizovaný obsah, takže to tam může přetrvávat roky. --Reaperman (diskuse) 28. 9. 2013, 21:28 (UTC)

Děkuji vám za obsáhlou reakci, která mne jenom utvrdila v nadějích, které vkládám do Wikidat, a pokud to bude v mých silách, rád přispěji k integraci českého Wikislovníku do nich, jakmile to bude aktuální. Prosím pamatujte, že můj text výše nebyl míněn jako kritika Wikislovníku nebo jeho komunity, ale pouze jako reakce na žádost jednoho z editorů o vyjádření, proč ačkoliv aktivní wikipedista a počítačový lingvista nepřispívám do Wikislovníku a mám problémy už i jen s jeho využíváním.
Děkuji vám i za shrnutí historie Wikislovníku. Pociťovanou nepřízeň tvůrců MediaWiki snad už brzy prolomí právě Wikidata, ale pak mne trochu zaráží, proč je už proti zatím jen plánům na jejich dobrovolné zavedení takový odpor na odkazované diskuzi - jako kdyby někteří wikislovníkáři vlastně žádnou pomoc nechtěli a byli spokojení s tím, na co jsou zvyklí. Trošku na technickou nótu si dovoluji upozornit, že zatímco substování šablony je nezvratný proces, běžně vloženou šablonu si lze nechat expandovat ("substovat") kdykoliv na požádání přes API, takže tabulku všech tvarů lze snadno získat a přitom v kódu mít jen šablonu s parametry a není třeba na straně vývojaře nic parsovat.
Když píšete o českém Wikislovníku a nedostatku hesel, předpokládám, že máte na mysli především česká hesla. V tom vaši lítost nad nedostatkem zdrojů sdílím. Jinak už je tomu ale u jiných jazyků (které sem - z toho, jak je vystavěn celý projekt Wikislovníku) také patří - a v diskuzi výše šlo právě o příklad latiny, ke které zdroje jsou: minimálně anglický Wikislovník, který dosud jako jediný indexuje všechny tvary slov a o jehož imitaci zde se Martin Kotačka dlouhodobě záslužně snaží. A je podle mne smutné, že Martin musí vše kopírovat ručně (už jsem mu nabídl nějakou robotickou pomoc), že to musí vůbec kopírovat (v budoucnu by to snad mělo jít natahat vlastně jen robotickým založením prostých hesel s šablonou odkazující pro tvary do Wikidat) a že z toho pak po natáhání ještě vznikají ještě ne nejšťastněji strukturované informace (šablona tabulky je substována). Ono to možná nakonec vypadá spíš tak, jako kdybych konkrétně jeho odrazoval od toho, co dělá, ale poukazuje to myslím i obecněji na to, proč je bohužel práce na Wikislovníku dost často tak trochu zbytečná a aspoň z části asi i na to, proč Wikislovník tak obtížně získává nové přispěvatele. V tomto smyslu nelze nepodpořit ty z vás, kteří tady vytvářejí obsah, který jinde není dostupný (nebo není dostupný pod svobodnou licencí), ale i jejich práce by byla lépe zhodnocená, kdyby se už vše připravilo lépe na to, že jednou se jejich data budou dát přetáhnout do nějakého centrálního úložiště a naráz budou moci daty k češtině disponovat všechny Wikislovníky.
Složitost editace slovníkových hesel je problém, kterého se asi tak snadno nezbavíme, bohužel. Buď vysvětlíte nováčkovi šablonu, nebo ho musíte přesně seznámit se strukturou a formátováním hesla (kde i každá jedna kurzíva nebo tečka může hrát pro další zpracování roli). Druhá cesta má tu nevýhodu, že ji lze nepozorností zkazit (zatímco šablona buď funguje, nebo nefunguje - víceméně).
Opět připomínám, že mi primárně šlo o latinské vzory (které jsou poměrně dobře vžité a aktivitám Martina Kotačky i podle vyjádření Mildy stačí těch pár základních), ale určitě by šlo něco dělat i s těmi českými. Zmíněná dvojtisícovka vzorů byla minimálě jednou standardizována a k podstatnému jménu vzor snadno zjistíte přes veřejně dostupnou aplikaci (např. "medvěd" je vzoru "1363-slon"). Navíc si myslím, že by se šlo s informatiky z FI MU určitě dohodnout i na nějaké další spolupráci, vždyť přece oni mají jako občasní "vycucávači" o kvalitu vašich dat také zájem. Pokud byste s tím skutečně chtěli něco dělat, mohu se dokonce pokusit něco v tomto směru sám vyjednat (mimochodem, čerstvě dokonce nabízejí na milion slovních tvarů pod CC-BY-SA - že by výzva pro Wikislovník?). A ty tisíce jsou samozřejmě hlavně podvzory, zatímco základních vzorů zůstává pořád jenom těch pár školních, takže by se daly šablonou třeba i zapisovat/zobrazovat ty informace obě dvě. Popis těchto "brněnských vzorů" (i když ne přímo jejich seznam) najdete v [18] (str. 47).
I problém plíživého vandalismu by pomohla řešit Wikidata, protože by se všechny tvary svahilských slov zakládaly tam (a tady jenom hesla s voláním příslušné obecné šablony tahající tvary z Wikidat), no a na Wikidatech by se určitě už pár mluvčích svahilštiny ke vzájemné kontrole sešlo, tím spíše, že by stejná data zřejmě jako svá primární používali i přímo redaktoři svahilského Wikisloníku. Znásobování práce nad stejnými daty napříč všemi jazykovými verzemi Wikislovníku mi od začátku připadalo asi jako vůbec největší nelogičnost/zbytečnost tohoto projektu, i když teď po jeho bližším průzkumu už aspoň trochu chápu, že k tomu mohou být i nějaké aspoň trochu legitimní důvody (ale i tak pořád jen k samé existenci jazykových verzí, ale nikoliv už ke znásobování stejných dat).
Nakonec se ještě zopakuji a poděkuji za podnětné reakce. Snad tahle diskuze nevyzní úplně do prázdna a třeba se nám podaří alespoň se dobře připravit na očekávané budoucí změny nebo třeba i dosáhnout nějakého okamžitějšího užitečného posunu už teď. Blahma (diskuse) 29. 9. 2013, 01:54 (UTC)