Sprcha - denní dávka zdravé kritiky pro osvěžení mysli
Denní dávka zdravé kritiky pro osvěžení mysli
 Titulní strana   Všechny články   Všeobecná diskuse   Deníky 
 Co je nového   Co se píše jinde   Politika   Kultura   Média   Technologie   Internet 
Podrobnější pohled na jedno známkování
mxp
19.06.2005 20:19:35 MET
(Všeobecná diskuse/Všeobecná diskuse)
Stěžování si na působnost známkovacích klanů je na Sprše tak častá záležitost, až se jejich existence začala víceméně všeobecně považovat za skutečnost. Jsa člověk ne dosti humanitně zaměřený, řekl jsem si, že se podívám, co o teorii známkovacích klanů může povědět řeč čísel.

 
 

Jako prostředek jsem zvolil analýzu podobnosti známkování stejných komentářů jednotlivými čtenáři Sprchy. Abych analýzu zacílil a dostal se na nějaký rozumný rozsah, zpracoval jsem všechny komentáře diskuze k článku Cui bono?, která podle Vodníka představuje typickou ukázku obludných forem, kterých dosáhlo klanové hodnocení založené na osobních sympatiích.

Aby bylo možné hodnotit podobnost známkování, do analýzy vstoupily pouze komentáře, které obdržely alespoň dvě či více známek. Celkem jich bylo 97. Dále jsem nepočítal s nulami, protože jsou anonymní. V celé diskuzi jsem ale zahlédnul jen dvě. K jedné se hlásil Boutros, druhá vypadala na Vodníka.

Závažným nedostatkem by mohlo být, že analýza nezahrnuje úplně vynulované komentáře. Z prostého důvodu - že je nevidím. (Kam se podělo moje mojo?) Ale jestli se dobře pamatuji, nulování v té době nepatřilo k běžne používaným prostředkům.

Výsledky analýzy

Vásledky jsou zobrazeny formou "polomatice", kde každá buňka obsahuje před lomítkem údaj o podobnosti známkování příslušných členů klanu a za lomítkem z kolika případů byla podobnost vypočtena (tedy kolikrát se ti dva sešli při známkování stejného komentáře).

Tedy např. hodnota 81/9 znamená, že oba známkovali 9 stejných komentářů a míra podobnosti jimi udělených známek v těchto 9 případech byla 81%.

Podobnost jsem počítal jako rozdíl známek převedený na procentní škálu, kde 100% reprezentuje stejné známky ve všech případech a 0% maximálně odlišné známky (1 v. 5) ve všech případech.

V průběhu výpočtu jsem stanovoval prahy statistické významnosti a co bylo pod nimi, jsem dále neuvažoval.

Z předběžných výsledků jsem vytipoval dva možné klany a jejich hlavy (podle největšího počtu známkování, Vodník a Boutros). Kritériem pro zahrnutí do klanu byla nejméně 80% podobnost známkování s hlavou klanu.

Klan č.1

Vodnik   | 99/15   | 89/11   | 81/9    | 81/8    | 100/4   |
         | pajout  | 84/8    | +       | 92/6    | -       |
                   | gogo    | 80/5    | -       | -       |
                             | Guy P.  | -       | -       |
                                       | Aha     | -       |
                                                 | Husita  |

Klan č.2

Boutros  | 81/8    | 92/6    | 95/5    |
         | Kukacka | -       | 84/8    |
                   | Prokop  | -       |
                             | max     |

Sečtením hodnot z matic zjistíme, že klan č.1 známkoval spolu (resp. kterákoliv z dvojic jeho členů) 66-krát, klan č.2 27-krát.

Komu v klanu č.2 chybí některé "známé firmy", nechť si níže přečte popis výpočtu. Nicméně z výsledků je zřejmé, že klan č.2 je možná lépe definovaný, ale více se známkami šetří.

Znovu připomínám, že toto je pouze analýza podobnosti známkování v jedné diskuzi. Úplně jiné výsledky by mohla přinést analýza známkování autorů, tedy vztahu autor komentáře - známkovač - známka.

Pokud by něco takového provedl někdo s přístupem k databázi Sprchy a nemusel to ručně vyzobávat celý sobotní večer jako, třeba by výsledky ještě zamíchaly názory na (ne)zrušení známkování.

Pro zájemce přidávám neumělý

Popis výpočtu

Shromáždil jsem nenulové známky ze všech komentářů uvedeného článku, které dostaly alespoň dvě nenulové známky. Získal jsem tak 97 sad známek od 23 různých známkovačů.

Za kritérium statistické významnosti jsem zvolil alespoń 5 známkování od každého známkovače. Odpadlo tak 5 známkovačů (Yenya, cnemo, Jan Klabačka, Tomáš, bubak).

Ze zbylých dat jsem pro každou kombinaci dvou známkovačů spočítal hodnotu podobnosti jejich známkování a počet případů společného známkování stejného komentáře.

Zahodil jsem kombinace, které spolu měly méně než 4 společná známkování. Tak např. odpadla kombinace Boutros/Astr se 100% shodou!

Ze zbylých dat jsem vytipoval vůdce klanů podle počtu známování (Vodník 40, Pajout 34 ale stejný klan, Boutros 29). K vůdcům jsem dosadil členy klanu na základě alespoň 80-ti procentní podobnosti hlasování.

A kam že se to poděli Michaela, JN a TL? Prostě neměli dostatek společných známkování s hlavou předpokládaného klanu Boutrosem. Pokud by se kritérium příslušnosti ke klanu změnilo tak, že by stačila 80% shoda s kterýmkoliv členem klanu (a ne jen s jeho hlavou), klan č.2 by vypadal následovně (klan č.1 by zůstal beze změn):

Klan č.2

Boutros  | 81/8    | 92/6    | 95/5    | -       | -       |
         | Kukacka | -       | 84/8    | 81/4    | 85/5    |
                   | Prokop  | -       | -       | -       |
                             | max     | 94/4    | 100/5   |
                                       | Michaela| -       |
                                                 | JN      |

Stále ovšem by počet společných známkování klanu č.2 byl 45 versus 66 klanu č.1.

Publikováno s vědomím, že pokud v analyzované diskuzi existuje nemalý počet vynulovaných (tudíž mně neviditelných), vícenásobně oznámkovaných komentářů, tak je tohle všechno na prd :-((
 

>>> diskuse >>>  

Základní nabídka
- registrace nového uživatele
- jak na to (aktualizace 19.1.03)
- časté dotazy
- vyhledávání

Login
Jméno:
Heslo:
 
Registrace nového uživatele

Komentáře chronologicky (15)
- Dodáte ještě něco, by max
- Já jen po sedmé Plzni, by Tomas
- cau cau Tomasi by magnus maximus
- Magne Maxime, by Tomas
- Přiznám se, by max
- mea culpa, mea culpa, mea maxima culpa by max
- No Alexeji Juchelko... by max
- Vzhledem k faktu, by cnemo
- Omlouvám se, by Jarda z Pisku
- To zobrazení by gogo
- prostou by Ivan
- O spojitosti by japout
- Ikdyž je fakt, by Jarda z Pisku
- Třeba by Jarda z Pisku
- proto maji byt jen by vodnik007

Related Links
- Cui bono?
- More on Všeobecná diskuse
- Also by mxp

Komentáře: Zobrazení: Řazení:
 
 
Podrobnější pohled na jedno známkování | 236 comments (236 topical, 0 editorial, 40 pending)
 
 
Myslím, že nuly (none / 0) (#2)
Jarda z Pisku 19.06.2005 19:11:24 MET
(User Info)

můžete pustit s klidným svědomím z hlavy. Jsou tam vynulované jenom dva Boutrosovy komentáře na jeho vlastní žádost (duplicitní komentář). Nulovali v obou případech Andyo a Postava do Jazzu.

I chose to believe what I was programmed to believe. -- Futurama
 
 
Já pro titulní stranu, (none / 0) (#3)
cnemo 19.06.2005 19:12:51 MET
(User Info) http://nautilus.bloguje.cz

konečně se někdo alespoň pokusil rozmotat ten známkovací propletenec  bez emocí. Pokud by byla k dispozici relace "autor - známkovač+znamka", počtáři by se asi vyřádili. Ve finále shlukovací analýza (či jak se to jmenuje) a existence klanů by byla matematicky doložena či vyvrácena. Mělo mě to napadnou dřív:(

 
 
Mám obavu, (none / 0) (#5)
Jarda z Pisku 19.06.2005 19:23:17 MET
(User Info)

že ten vzorek není dostatečně reprezentativní, aby cokoliv vyvrátil nebo dokázal, ale orientační hodnotu podle mě má. Hlasoval jsem taky pro titulní stranu, ikdyž nebýt zajímavého nápadu a vynaloženého úsilí, taky bych raději toto téma poslal do deníku.

I chose to believe what I was programmed to believe. -- Futurama
[ Parent ]
 
 
Reprezentativní určitě není, (none / 0) (#9)
cnemo 19.06.2005 20:10:15 MET
(User Info) http://nautilus.bloguje.cz

ale ukazuje cestu, jak se k věci postavit. Poku by byla k dispozici ona databáze celá (např od začátku Sprchy), mohl by být rozbor docela reprezentativní. Možná bychom se dověděli hodně o sobě:)

Ta data jsou reálně získatelná, někdo by musel přesvědčit Jezovce:)

[ Parent ]
 
 
Nebo mne, (none / 0) (#31)
japout (pajout na gmail com) 20.06.2005 09:05:22 MET
(User Info)

je to v MySQL, tak se mi do toho opravdu nechce... Ale chcete-li nekdo databazi Sprchy, je mozne ji nekde zabalenou vystavit k downloadu, pokud se mi podari presvedcit MySQL, aby delalo to co chci.

[ Parent ]
 
 
S tím nesouhlasím. (none / 0) (#35)
Jan Klabacka 20.06.2005 09:52:32 MET
(User Info)

V databázi Sprchy jsou e-mail adresy uživatelů, přičemž kdesi na Sprše je slib, že tyto nebudou dány k dispozici třetím osobám.

Musel by se udělat selektivní dump databáze a pokud by byla potřeba tabulka uživatelů (jako že asi ano) a další tabulky, které obsahují neveřejné údaje, tyto údaje by bylo potřeba z dumpu odstranit (e-mail adresy, IP adresy registrace, případné jiné IP adresy, ...).

----

Navíc, pochybuju, že by databáze jako taková byla mxp k něčemu nějak platná; je to relační databáze, jedna každá tabulka sama o sobě nedává dostatečný smysl a zkombinovat je mimo databázi není až tak jednoduché; samozřejmě, není to nemožné, neznám možnosti mxp.

Nejschůdnější cesta by asi byla 1. zjistit jaká přesně data mxp potřebuje pro každou udělenou známku, 2. na základě tohoto údaje napsat join select, který ta data z databáze vyexportuje.


If someone tells you they have the answer, they probably haven't understood the question.

[ Parent ]
 
 
Ano, (none / 0) (#41)
japout (pajout na gmail com) 20.06.2005 11:14:53 MET
(User Info)

nechtel jsem to zbytecne rozvadet...

[ Parent ]
 
 
Podle mne potřebuje tato data: (none / 0) (#42)
Guy Peters 20.06.2005 12:46:50 MET
(User Info) http://artax.karlin.mff.cuni.cz/~peters/

  1. autora komentáře,
  2. kdo hlasoval a
  3. jak hlasoval.


[ Parent ]
 
 
Je to celé nesmysl. (none / 0) (#46)
Vodnik (vodnik.zavináč.sprcha.com) 21.06.2005 14:39:02 MET
(User Info)

Důležitým datem je mj. také totiž to, jak kdo neznámkoval a to samozřejmě zůstane nedokazatelné.

IMHO
[ Parent ]
 
 
Je to zavádějící (none / 0) (#48)
gogo (gogo zavinac sprcha.com) 21.06.2005 14:42:01 MET
(User Info)

i proto, že jsou různé strategie známkování - za souhlas, za "kvalitu", kompenzace (i rekurzivní a na obě strany), obranné, klanové.

Jestli by se nějaké shluky vylouply, to nevím, interpretace by byla každopádně dost těžká. Taky by záleželo na tématu.

Pánu Bohu vysielať je neefektivne. On je dobre informovaný aj bez toho.
[ Parent ]
 
 
Jasně. (none / 0) (#49)
Vodnik (vodnik.zavináč.sprcha.com) 21.06.2005 14:43:46 MET
(User Info)

Interpretace by byla IMHO nemožná a to i tehdy, kdyby se z dostupných dat nakrásně vyloupl ten Klan, jak mu zde s Petersem drbeme prdel.

IMHO
[ Parent ]
 
 
Nemate spise obavy (5.00 / 1) (#56)
TL (t tecka l zavinac email tecka cz) 21.06.2005 15:41:07 MET
(User Info)

ze tvrda data by ukazala, ze klanu je vice popripade ze klan zadny neexistuje? Ze by ukazala ze veskera ukrivdenost nekterych ucastniku je jen a pouze vysledkem jejich subjektivni nepodlozeneho pocitu? Ja se za analyzu znamkovani docela primlouvam. Rad se podivam i na metodologii. Zda se, ze mnozi diskuteri na Sprse maji docela solidni vzdelani a zkusenosti se k vysledkum a metodice vyjadrit. Meli bychom to udelat s otevrenou a chladnou hlavou. Konecne by tu byla diskuze o faktech a statistice, coz je lepsi nez diskuze o dojmech a jednotlivostech vytrzenych z kontextu.

Pripada mi komicke ze nekdo kdo prisel s teorii Klanu se brani exaktni analyze ktera by jeho teorii, o ktere nepripousti pochybnost, potvrdila (nebo vyvratila). Jak typicke.

[ Parent ]
 
 
Jednou Vám tu Peters napsal, (none / 0) (#58)
Vodnik (vodnik.zavináč.sprcha.com) 21.06.2005 16:52:38 MET
(User Info)

že ekonomie je ponurá věda. Já o ní nevím skoro nic, ale někdy mu mám chuť dát za pravdu :-))) (bacha, klan!)

Jsem přesvědčen, že existence Klanu není dokazatelná ani vyvratitelná nějakými "exaktními analýzami". Na prvním místě chybí vztah známek s kvalitou příspěvku (která IMHO není nijak definovatelná, nejsou kritéria nebo jen částečná a subjektivní), dále pak není vzat v potaz emocionální vektor mezi jednotlivými účastníky, jehož známkování může ale nemusí být projevem. Proto považuji tuto práci od samého počátku za sice úctyhodnou, ale naprosto zbytečnou.

IMHO
[ Parent ]
 
 
Statistika neni ekonomie (none / 0) (#59)
TL (t tecka l zavinac email tecka cz) 21.06.2005 18:22:46 MET
(User Info)

Oboji, zejmena statistika je do jiste miry suchoparna prace s nudnymi cisly. Kazdopadne jste tu spolu s GP nekolikrat napsal, ze Klan se projevuje znamkovanim. Pak to na znamkovani musi byt videt a motivace pro znamkovani je nepodstatna, respektive muzeme ji prodiskutovat pro analyze vysledku. Kazdopadne se ale asi lisime, ze ja si rad s chladnou hlavou sednu nad fakta a cisla, misto abych veril pocitum, dojmum a zjevenym pravdam.

Mozna i to je podstatna charakteristiku ostatnich clenu udajneho Klanu. Ne sympatie me malickosti k Michaele a Michaely k Butrusovi, ale poctiva snaha odlisit subjektivno a objektivno, fakta a dojmy, pocity a logiku.

[ Parent ]
 
 
To Vás šlechtí, TL, (none / 0) (#60)
Vodnik (vodnik.zavináč.sprcha.com) 21.06.2005 18:25:59 MET
(User Info)

ale zrovna u Vás se ta "poctiva snaha odlisit subjektivno a objektivno, fakta a dojmy, pocity a logiku" v mém případě IMHO pravidelně míjela účinkem :-(((


IMHO
[ Parent ]
 
 
:))))))))))))) To je svanda / nt (none / 0) (#61)
Michaela 21.06.2005 19:26:44 MET
(User Info)



[ Parent ]
 
 
Pokud jsou tendence shlukování (none / 0) (#62)
cnemo 21.06.2005 21:27:19 MET
(User Info) http://nautilus.bloguje.cz

uživatelů do podobně se chovajících skupin tak silné, jak tvrdíte, opravdu se ve výpočtu objeví ve skupině. Zkoušel jsem to kdysi dávno na nějakých datech z pedologie, fungovalo to poměrně slušně i  za použití 8-bitového počítače Sharp:) S dnešními výpočetními prostředky by to byla hračka.

[ Parent ]
 
 
Panove gogo a Vodniku (4.50 / 2) (#55)
Michaela 21.06.2005 15:10:19 MET
(User Info)

Jak to ze predem vite, ze to nejde? A je to blbost? Shlukova analyza se pouziva prave tam, kdy chceme zjistit, zda jsou si individua, nebo jiné jednotky analýzy dosti podobná, aby je bylo možno přiřadit do shluků. Podobnost muze zahrnovat i ty ruzne strategie. To by nebylo na skodu. Shluky se vyloupnou samozrejme, otazka je zda budou smysluplne a zda je dokazeme interpetovat. Asi by bylo vhodne zkombinovat vice metod klastrovky. Spis mne dela starost, zda tam cpat jedince jako takove (clenove Sprchy), a jejich znamky prijate a dane, to by bylo spis na nic,  spis asi vsechny mozne kombinace dvojic? (ten kdo hodnoti-ten koho hodnoti). Ted nevim, to bych se musela zamyslet, coz mi dela problemy.

[ Parent ]
 
 
Neříkám, že to nejde (5.00 / 1) (#57)
gogo (gogo zavinac sprcha.com) 21.06.2005 15:41:56 MET
(User Info)

ani že je to blbost.
Pokud vím, ta metoda hledá korelace na základě nějakých pravidel, vlastností. To musíme dodat my, co se má brát v potaz.
Dostaneme skupiny můžeme je různě vážit, měřit rozptyly a těžiště, jenže interpretace výsledků je někdy ošidná.

Chtěl jsem poukázat třeba na to, že shoda v bodech na konkrétních komentářích může být způsobena různými vlivy, což te to, co nás zajímá.
Např. X a Y se shodují, protože známkují "kvalitu", zatímco A a B se shodují v názoru. Další pak preventivně obranářsky a jiní kvůli sympatii k autorovi. Těch průmětů bychom měli udělat hodně a velmi opatrně formulovat závěry.

Pánu Bohu vysielať je neefektivne. On je dobre informovaný aj bez toho.
[ Parent ]
 
 
Dovolte gogo, abych se pokusil v kostce (5.00 / 1) (#64)
cnemo 21.06.2005 22:19:33 MET
(User Info) http://nautilus.bloguje.cz

uvést příklad matematické formulace tohoto problému. Otázka zní: existují skupiny, které významně hlasují spolu? Hodnotí se tedy pouze shoda při známkování, nikoli postoj k autorovi příspěvku:
  1. Mějme n uživatelů, z nichž každý hodnotí (někdy) ostatní. I nehodnocení známka.
  2. i-tý uživatel je popsám n parametry, zvanými shoda. Což je nějaká rozumná fce fj(xi,xj), kde x je vektor známkování stejného rozměru jako je počet komentářů. Pro jednoduchost si můžeme představit fci f jako skalární součin.
  3. Představme si, že všechny uživatele zakresníme v prostoru dimenze n se souřadnicemi určenými fcemi f. Zvolením metriky (třeba něco jako Pythagorova věta v prostoru) získáme vzdálenost jednotlivých bodů (uživatelů).
  4. Nyní nastoupí vlastní shlukovací algoritmus. Ty jsou různé, ale zhruba se dá říci, že v prvním kroku udělám skupinu ze dvou nejbližších a jejich dvě pozice nahradím pozicí těžiště. Dál pokračuji stejně až se vše shlukne do jedné skupiny. Každé shluknutí je charakterizováno vzdáleností, při které ke shluknutí došlo, která zpravidla roste. Tam, kde jsou velké rozdíly v tomto parametru jsou hranice skupin - klanů.
Je to jen hrubý nástin, ve skutečnosti je to trochu složitější. Pokud jsou vyhraněné skupiny, najdete je poměrně nezávisle na metrice či konstrukci fce f atd.

Co se týká objektivity není to do puntíku přesně, ale rozhodně o několi řádů objektivnější, než prosté hodnocení čtenáře.

[ Parent ]
 
 
To souhlasí, (none / 0) (#67)
gogo (gogo zavinac sprcha.com) 22.06.2005 08:33:16 MET
(User Info)

jen jsem chtěl poukázat na to, že společné hodnocení jako jev může mít vícero příčin a na prokázání klanu to nebude to pravé. Ale zajímavé by to rozhodně bylo.

Pánu Bohu vysielať je neefektivne. On je dobre informovaný aj bez toho.
[ Parent ]
 
 
Naopak (none / 0) (#68)
Michaela 22.06.2005 08:46:21 MET
(User Info)

pri zadani spravnych promennych to bude to prave.

[ Parent ]
 
 
Pak asi záleží (none / 0) (#69)
gogo (gogo zavinac sprcha.com) 22.06.2005 08:53:29 MET
(User Info)

co si představujeme pod pojmem KLAN. To, že se třeba shodnu ve známkování s XY, může znamenat různé věci.

Korelace ve známkování by byly ale určitě zajímavé, včetně shluků.

Pánu Bohu vysielať je neefektivne. On je dobre informovaný aj bez toho.
[ Parent ]
 
 
asi jsem to nepochopila (5.00 / 1) (#70)
andyo 22.06.2005 08:56:14 MET
(User Info)

čeho se výzkumem dosáhne?
Potvrzení faktu, že někteří lidé mají stejné názory a někteří ne? Nebo že někteří známkují podle sympatií ? To už potvrdil dávný "EXPERIMENT" zde kdysi předváděný. A co kompenzační známky?

Výsledek bude, že ti, co si nemyslí, že by tu byly klany si to budou myslet dál a umanutci, co nedovedou pochopit, že někdo může jejich psaní ohodnotit jinak než na výbornou si budou dál myslet, že tu klany jsou.

[ Parent ]
 
 
Přesně tak. (none / 0) (#71)
gogo (gogo zavinac sprcha.com) 22.06.2005 09:16:29 MET
(User Info)

Zajímavé by byly jen ty shluky a jejich interpretace velice ošidná,

Pánu Bohu vysielať je neefektivne. On je dobre informovaný aj bez toho.
[ Parent ]
 
 
Právě proto bych to dělal (none / 0) (#73)
japout (pajout na gmail com) 22.06.2005 09:19:25 MET
(User Info)

naslepo, aby nikoho při interpretaci nemohlo ani náhodou ovlivnit, že tohle je GP a tohle je japout. To by pak mohla být legrace, až by se po interpretaci k identifikátorům zpětně napárovala jména...

[ Parent ]
 
 
Sranda by to byla, (none / 0) (#74)
gogo (gogo zavinac sprcha.com) 22.06.2005 09:22:12 MET
(User Info)

ale já to myslel i bez ohledu na jména. To by bylo skoro fakt na nějakou semestrální práci do cvičení pro zápočet.


Pánu Bohu vysielať je neefektivne. On je dobre informovaný aj bez toho.
[ Parent ]
 
 
Ale v tech shlucich (none / 0) (#75)
Michaela 22.06.2005 09:30:39 MET
(User Info)

pokud vim jde o mnohonasobne korelace, tj. treba kdybychom zadavali jednotlivce (u kterych, resp z nichz, budem hledat shluky, ), tak k nim muzeme zadat mnoho promenych. Treba vsechny znamky ktere obdreli od ostatnich i ty ktere dali. Takze treba u goga budou zadany hodnoty gm (gogo michaele), gp, gb, ga .... a asi mozna i mg, pg, ag .... Atd atd.  Pak bychom mohli bud urcit kolik shluku (klanu) predpokladame (radim 3 az 5) a pouzit nehierarchickou klastrovku rozkladu dat. Nebo jeste lepe predtim hierachickou, ta nam ukaze kolik shluku by tam mohlo byt, my si vyberem ktere nam pripadaji dostatecne vzdalene a jasne definovane a pak to narvat do te k/meaning. (Ale ja fakt nevim, musela bych se nad tim zamyslet, je dost mozne, ze tam mam ted nejakou blbost ....  ale mozna to casem udelam.... mam Statisticu program (doufam ze jeste nekde)... krome toho tahani a tukani cisel by to nemel byt problem.

Treba by mne poradil pan Klabacka.

[ Parent ]
 
 
Blbost, myslim, tam nemate (none / 0) (#79)
mxp (mxp&fea.st) 22.06.2005 11:49:35 MET
(User Info)

V nejjednodussim pripade by asi stacily prumery znamek udelenych mezi jednotlivymi ucastniky. Cili pokud je tu nejakych 20 kmenovych clenu, melo by stacit mit pro kazdeho sadu 20 (resp. 19) hodnot jako prumeru znamek, jez udelil kazdemu ostatnimu. Z toho by ty shluky mely jit odvodit tak, jak naznacujete.

Data by zrejme mohl byt ochotny dodat pan Jezovec. Nicmene byl bych ted uz rezervovanejsi k smyslu takoveho pocinani...

[ Parent ]
 
 
Aha, zajimava myslenka (none / 0) (#82)
Michaela 22.06.2005 12:11:04 MET
(User Info)

... myslite, ze kdybych se k tomu nekdy v budoucnu odhodlala, ze vas muzu pozadat o rady a konzultace? Nejsem valna poctarka a ani technickeho vzdelani nemam.

Smysl toho pocinani ... chapu ze pro Sprchu jako takovou je smysl temer nulovy. Mne osobne by to ale vazne zajimalo. Ja myslim ze internetova diskuse a komunikace je zajimave tema ....takove transdiciplinarni....

jenze by takova studie (nejen klany klastrovkou) by potrebovala nejakeho nezavisleho pozorovatele (vice) a na to je treba, aby i ty nicky ktere tu mame pro potrebu te studie byly anonymni. Zajimalo by mne jestli to jde nejak udelat? Nemate nekdo tuseni? Jezovce? Pajoute? Dalsi?


[ Parent ]
 
 
Urcite ano, (none / 0) (#84)
japout (pajout na gmail com) 22.06.2005 12:45:01 MET
(User Info)

muzu pripravit data tak, ze misto nicku tam budou jen a, b, c, d, ..., aa, ab, ..., pricemz si ponecham prevodni tabulku mezi nicky a malymi pismeny a zverejnim jeji hash, abych v budoucnu nemohl podvadet. Kdyz pak nekdo jiny udela jeste jednou podobnou operaci, moje mala pismena nahradi nahodne svymi velkymi, treba a->G, b->Z,..., Michaela dostane data s velkymi pismeny misto nicku. Tim nechci rict, ze nekomu neverim, ale vsem to da moznost nad vysledky diskutovat, aniz by vedeli, kdo se skryva za velkymi pismeny, a pozdeji k nim skutecne nicky priradit. Nepredpokladam, ze by nekdo chtel pokoutne zjistovat, kdo je za tim kterym pismenem - to by se data musela pripravit daleko pecliveji a nejsem si jist, ze by bylo mozne tomu zcela zabranit.

[ Parent ]
 
 
To by fakt nebylo od věci :-)) (none / 0) (#91)
gogo (gogo zavinac sprcha.com) 22.06.2005 13:14:49 MET
(User Info)

Je zajímavé, jak takové hovadiny člověka zaujmou, že o nich dumá, místo aby řešil opravdové, např. v mém případě rodinné, záležitosti.
Udělejte příležitostně první krok, on se už nějaký vrtal najde a pošťourá se v tom.
Jak by to bylo strukturované - jako db tabulky v csv?

Pánu Bohu vysielať je neefektivne. On je dobre informovaný aj bez toho.
[ Parent ]
 
 
gogo, muzu jeste dotaz? (none / 0) (#93)
Michaela 22.06.2005 13:18:33 MET
(User Info)

co je to db tabulka v csv? .... ale pokud je to slozite, tak jen mavnete rukou, ja jen ze neznam ani ty zkratky ...

[ Parent ]
 
 
Je to jednoduché (none / 0) (#94)
gogo (gogo zavinac sprcha.com) 22.06.2005 13:22:38 MET
(User Info)

a sama to třeba i znáte.
csv je normální soubor, obsahující data ve formě tabulky, kde jsou údaje odděleny oddělovačem (čárka, středník...) Dá se to pak načíst třeba do excelu. Umí s tím pracovat i ODBC ovladače, takže se s tím pak dá pracovat jako s primitivní relační databází.

A db tabulkou jsem myslel databázovou tabulku- vyexportovanou právě do té textové podoby, aby to šlo nahrnout nějakm jinam.

On by to Pajout mohl vyhrnout taky do nějakého binárního datového souboru. Pak bychom si na to museli dělat nějaké čtecí utilitky.

Pánu Bohu vysielať je neefektivne. On je dobre informovaný aj bez toho.
[ Parent ]
 
 
hmm, bohuzel (none / 0) (#95)
Michaela 22.06.2005 13:28:20 MET
(User Info)

myslim, ze neznam ... diky, alespon za zakladni predstavu.

[ Parent ]
 
 
Tak si uložte (none / 0) (#97)
gogo (gogo zavinac sprcha.com) 22.06.2005 13:37:49 MET
(User Info)

z excelu jako Save as .. *.CSV a uvidíte to sama na vlastní oko.

Pánu Bohu vysielať je neefektivne. On je dobre informovaný aj bez toho.
[ Parent ]
 
 
CSV znamená (none / 0) (#100)
Prokop (pkrasny@aol.com) 22.06.2005 13:55:45 MET
(User Info)

Comma Separated Value, takže ten středník tam asi nebude - ale jinak máte naprostou pravdu.

Pak jsou ještě ty různé .dif a .prn - někdy to dá dost práci najít co bude fungovat.

Já je používám pro přenos dat z jedné database do druhé - vydavatel dodá disk s fotkami a captions/keywords jsou extra a je třeba je srovnat, vyčistit a nacpat do digital asset mgmt systému.

[ Parent ]
 
 
Sice se to jmenuje (5.00 / 1) (#103)
gogo (gogo zavinac sprcha.com) 22.06.2005 14:01:20 MET
(User Info)

comma.... ale oddělovač se dá právě zvolit. Středník to bývá celkem často. To je ale detail.

Pánu Bohu vysielať je neefektivne. On je dobre informovaný aj bez toho.
[ Parent ]
 
 
Vzhledem k tomu, (none / 0) (#98)
japout (pajout na gmail com) 22.06.2005 13:41:57 MET
(User Info)

ze se cnemo zminuje jeste o faktorove analyze, by tedy stalo za to rozmyslet, jake sloupecky by ona tabulka mela mit.
Treba, ted jen placam, protoze neznam technickou strukturu sprchacich dat:
"hodnotitel_nick","hodnoceny_nick",znamka,"komentar_id"
takze realna data by pak vypadala nejak takhle
"japout","gogo",5,"1564"
"michaela","gogo",4,"1564"
"gogo","japout",3,"2153"
pricemz, podle meho nazoru, bychom meli nadvakrat "zasifrovat" vsechny hodnoty mimo znamky. Domnivam se, ze tyto ctyri udaje poskytuji uplnou informaci o tom, co chceme analyzovat. Pripadne lze uvazovat i o nejake casovosti.
Format csv, myslim, bude vyhovovat. Udaje budou nakonec v sedmibitovem ASCII, takze by si s tim mely poradit i postarsi softwary.

[ Parent ]
 
 
Detaily (5.00 / 1) (#99)
gogo (gogo zavinac sprcha.com) 22.06.2005 13:53:36 MET
(User Info)

Já myslím, že pro jednoduchost by to mohlo být klidně dost poplatné formátu tabulek v MySQL nebo v čem leží sprší data. Bude-li to v jednom csv-éču nebo ve více není podstatné. Když tak by se dalo udělat napřed view se všemi údaji a pak exportovat.

Podle mě by to mělo obsahovat:
ID_HODNOTITEL, ID_COMENT, ID_AUTOR, DATETIME, ZNAMKA, ID_CLANEK

Je otázka, zda vyřadit všechny nehodnocené komentáře, asi ano, i když tak ztratíme představu o "řídkosti" hodnocení.
Respektive by to mohla nahradit tabulka
ID_CLANEK celk_pocet_komentaru

A vyexportovat i ty vynulované!

Myslím, že máme zaděláno na druhé, mnohem perverznější kolo známkovací války.

Pánu Bohu vysielať je neefektivne. On je dobre informovaný aj bez toho.
[ Parent ]
 
 
V případě více tabulek (none / 0) (#102)
gogo (gogo zavinac sprcha.com) 22.06.2005 13:59:48 MET
(User Info)

pak pochopitelně tabulka hodnocení
ID_HODNOTITEL ID_COMENT ZNAMKA

a  vedle v tabulce
ID_CLANEK ID_COMENT ID_AUTOR

A na závěr
ID_CLANEK pocet_komentů

Pánu Bohu vysielať je neefektivne. On je dobre informovaný aj bez toho.
[ Parent ]
 
 
Druhé perverznější kolo známkování (none / 0) (#104)
Ales Zeman 22.06.2005 14:07:55 MET
(User Info)

Mohl by mi někdo sdělit, co z té statistické analýzy pro starší a pokročilé má vlastně v konečné fázi vylézt? Se shlukovou anylýzou jsem se trochu obeznámil dík naším biologům, kteří pomocí této metody vyhodnocují toxicitu sedimentu pro bentické bezobratlovce. Některým dílčím výsledkům této analýzy pak nerozumí ani sami autoři.


Philosophie: Toujours en ricaner. (Flaubert)
[ Parent ]
 
 
Na tom přeci nezáleží (5.00 / 1) (#106)
Prokop (pkrasny@aol.com) 22.06.2005 14:13:56 MET
(User Info)

tam jde o ten proces a zpracovávání dat:)))

Navigare necesse est!

:))


[ Parent ]
 
 
No jo, ale to může být cesta do záhuby (5.00 / 1) (#109)
Ales Zeman 22.06.2005 14:24:21 MET
(User Info)

To byl dle Plutarcha pep-up talk Pompeia k námořníkům, kteří se báli vyplout na rozbouřené moře. Celý poněkud cynický citát zní: Plavit se je nutné, žít nutné není. (Navigere necesse est, vivere non est necesse).


Philosophie: Toujours en ricaner. (Flaubert)
[ Parent ]
 
 
To jsem netušil (none / 0) (#120)
Prokop (pkrasny@aol.com) 22.06.2005 15:04:10 MET
(User Info)

já to vždycky chápal ve smyslu Tao - že cílem je vlastně cesta.

Hmmm,  to už je podruhý v životě co jsem se spletl:((

[ Parent ]
 
 
Nespletl jste se (none / 0) (#130)
Ales Zeman 22.06.2005 15:46:31 MET
(User Info)

v navigare, to byl jen můj překlep u ranního kafe.


Philosophie: Toujours en ricaner. (Flaubert)
[ Parent ]
 
 
:))) jak typicke (none / 0) (#107)
Michaela 22.06.2005 14:18:00 MET
(User Info)

pro nas cvicene opice ;).

No, podle meho nazoru by z toho mohla vylezt podobnost ci nepodobnost ruznych lidi v tom jak hodnoti a jak jsou hodnoceni a kym, jejich zarazeni do skupin (shluku, klanu) a "pribuznaost", tj, vzdalenost tech klanu od sebe.

[ Parent ]
 
 
Michaelo, jen aby ty shluky (none / 0) (#110)
Ales Zeman 22.06.2005 14:28:35 MET
(User Info)

nevypadaly jak obraz císaře pána posraný od much.


Philosophie: Toujours en ricaner. (Flaubert)
[ Parent ]
 
 
:) Alesi (none / 0) (#115)
Michaela 22.06.2005 14:46:08 MET
(User Info)

to je samozrejme mozne a tim lepe pro "Klan". Ve skutecnosti ale myslim ze by tam neco vybublalo, ale jeden ohraniceny klan v obrazu posranem od much to hadam nebude.

[ Parent ]
 
 
Nebude to daleko (none / 0) (#111)
gogo (gogo zavinac sprcha.com) 22.06.2005 14:29:33 MET
(User Info)

... toxicitu sedimentu pro bentické bezobratlovce..
Toxické to bude, sedimenty se rozvíří a bentičtí bezobratlovci budou nalezeni.

...Některým dílčím výsledkům této analýzy pak nerozumí ani sami autoři....
Tady to bude taky tak.


Pánu Bohu vysielať je neefektivne. On je dobre informovaný aj bez toho.
[ Parent ]
 
 
Odpovědi na otázky: (none / 0) (#113)
cnemo 22.06.2005 14:32:40 MET
(User Info) http://nautilus.bloguje.cz

  1. Existují výrazné známkovací klany?
  2. Kdo je tvoří?
  3. Kdo jsou vůdci?
Ale zejména je to počtářský pamlsek, takovou hromadu o něčem vypovídajících dat hned tak nevytvoříte:)

[ Parent ]
 
 
Počtářský pamlsek (none / 0) (#114)
Ales Zeman 22.06.2005 14:45:01 MET
(User Info)

Přeji statistickým analyzátorům mnoho úspěchů, což myslím upřímně. Doufám, že se při interpretaci výsledků nevytvoří další klany.


Philosophie: Toujours en ricaner. (Flaubert)
[ Parent ]
 
 
Tohle právě myslím (none / 0) (#116)
gogo (gogo zavinac sprcha.com) 22.06.2005 14:56:27 MET
(User Info)

nezodpoví, ale nechám se překvapit.

Spíš:
- kdo se s kým šavluje
- kdo s kým si maže
- kdo známkuje podobně jako...

- a snad i další, komplikovanější charakteristiky
- snad i vývoj v čase

Jen je škoda, že se nedá spolehnout na tématické oddíly nebo vlastní téma článku. Proto se nám třeba dočasné názorové skupiny budou rozplizávat.


Pánu Bohu vysielať je neefektivne. On je dobre informovaný aj bez toho.
[ Parent ]
 
 
Ne gogo (none / 0) (#118)
Michaela 22.06.2005 14:59:54 MET
(User Info)

opravdu ne, pokud jsme u te klastrovky, ta tezko muze ukazat to co vy rikate, ale ukaze (vudce???) to co rika cnemo.

[ Parent ]
 
 
OK, (none / 0) (#122)
gogo (gogo zavinac sprcha.com) 22.06.2005 15:08:57 MET
(User Info)

nechám se překvapit.

Pánu Bohu vysielať je neefektivne. On je dobre informovaný aj bez toho.
[ Parent ]
 
 
Říkám, nemám to úplně promyšlené, (none / 0) (#124)
cnemo 22.06.2005 15:13:10 MET
(User Info) http://nautilus.bloguje.cz

ale podle mě by měli vůdce (a jejich věrné stíny) prozradit složky nejvýznamnější vlastnosti (zapomněl jsem jak se tomu říká) z faktorové analýzy. Je pravděpodobné, že od nich těžko odlišíte jejich případné napodobovatele, ale jiné výpočty by mohly napomoci. Chce to zkusit, jsem už na hranici své představivosti.

[ Parent ]
 
 
Nebo poturčence :-) (none / 0) (#125)
gogo (gogo zavinac sprcha.com) 22.06.2005 15:15:42 MET
(User Info)

Ty vlastnosti/parametry, podle kterých se bude rozhodovat, určumeme my, nebo to algoritmus vyplivne jako parametr výsledku?

Pánu Bohu vysielať je neefektivne. On je dobre informovaný aj bez toho.
[ Parent ]
 
 
Odpovím, ale nevím, (none / 0) (#126)
cnemo 22.06.2005 15:29:41 MET
(User Info) http://nautilus.bloguje.cz

jestli to bude přesně to, nač jste se ptal. Kažbý bod (uživatel) je popsán n parametry původními. Mračno těchto bodů vytvočí jakési pseudotěleso. Kdyby to byl elipsoid hledáte hlavní osy (napsané jako vektor) a ta nejdelší je pak směr pro proměnlivost dat nejvýznamější, představuje směr největších rozdílů. Podle toho, jak významně k tomuto směru přispívá danná původní vlastnost se hledá její praktický význam. Protože v našem prostoru je každá osa svázána s jedním uživatelem, získáme takto uživatele, jejichž chování nejvíce přispívá ke vzájemným vzdálenostem.

Ale opravdu tu má představivost končí a nejsem si jist. Ale to shlukování je bez problémů.

[ Parent ]
 
 
Už se těším na výsledky (none / 0) (#127)
gogo (gogo zavinac sprcha.com) 22.06.2005 15:35:44 MET
(User Info)

a pak ty debaty kolem :-)

Pánu Bohu vysielať je neefektivne. On je dobre informovaný aj bez toho.
[ Parent ]
 
 
Pokud to budou klany významné, (none / 0) (#128)
cnemo 22.06.2005 15:41:32 MET
(User Info) http://nautilus.bloguje.cz

bude to jednoduché, horší bude, když se to bude pohybovat okolo statistické nevýznamnosti:)) To bude teprve okultismus:)

[ Parent ]
 
 
Ja bch chtel taky do klanu. (none / 0) (#132)
Milos 22.06.2005 15:53:42 MET
(User Info)

Jak se to dela, aby me tam vzali. Musim se jim nejak zalibit nebo staci flaska konaku?

[ Parent ]
 
 
Měli tam (none / 0) (#133)
gogo (gogo zavinac sprcha.com) 22.06.2005 15:57:00 MET
(User Info)

jakési zasvěcovací obřady s rysem, vojna jak řemen.

Pánu Bohu vysielať je neefektivne. On je dobre informovaný aj bez toho.
[ Parent ]
 
 
Miloši, členství v klanu (5.00 / 4) (#134)
Ales Zeman 22.06.2005 16:04:01 MET
(User Info)

již tu vysvětlil Peters. Je to jako formulář. Odpovíš na několik stručných otázek. Peters uvádí např tyto:

všichni kommunisti jsou zločinci,
zásah v Iráku byl správný a
v případě Israele je možná jedině konstruktivní kritika.


Dle odpovědi na tyto otázky pak jseš v jednom či druhém klanu. Pokud ovšem zastáváš názory neobvyklé, jako Peters, pak můžeš se stát členem klanu s neobvyklými názory, v kterém je jen jeden člen. Takových klanů je tu též dost a nevytváří je zdaleka jen Peters.



Philosophie: Toujours en ricaner. (Flaubert)
[ Parent ]
 
 
ty otazky jsou pro me prilis narocne (none / 0) (#136)
Milos 22.06.2005 16:07:05 MET
(User Info)

tak radeji poletim zitra s panimamou na Kypr.

[ Parent ]
 
 
Přeji sťastnou cestu a pobyt, Miloši (none / 0) (#137)
Ales Zeman 22.06.2005 16:10:20 MET
(User Info)

Ovšem na Kypru je těch klanů také dost. Kanadské blue helmets tam byly asi dvacet let coby buffer a nebylo to nic platné.


Philosophie: Toujours en ricaner. (Flaubert)
[ Parent ]
 
 
Pomáhali tam s dotazníky? -nt (4.00 / 1) (#138)
gogo (gogo zavinac sprcha.com) 22.06.2005 16:14:19 MET
(User Info)



Pánu Bohu vysielať je neefektivne. On je dobre informovaný aj bez toho.
[ Parent ]
 
 
Ani moc nevím, (none / 0) (#139)
Ales Zeman 22.06.2005 16:25:57 MET
(User Info)

též nevím, zda Neckář je expert nejen na Turecko, ale i na Kypr, aby tu podal zasvěcený komentář.

Oficiálně tam Kanaďané byli v roli mírových oddílů (peacekeepers) od r. 1964, kdy myslím Kypr získal nezávislost a došlo k nové rivalitě (která tam jistě byla mnohem déle) mezi Řeky a Turky. Po 20 letech málo úspěšného mírotvorectví se Kanaďané z Kypru stáhli.


Philosophie: Toujours en ricaner. (Flaubert)
[ Parent ]
 
 
jednoduche odpovedi (5.00 / 1) (#141)
vodnik007 (vodnik007@mac.com) 22.06.2005 16:34:28 MET
(User Info)

nejsou mozne.
Co kdyz nesouhlasim s dvema ale pouze s tou treti? Kazdy ma svuj nazor.
    Myslim, ze diskuse o znamkovani a klanech je zbytecne zdlouhava a staci jednoduche reseni.
Zaprve problem znamkovani byl v jesitnem nulovani zamerenem na jiste osoby. Kdyby nebyla nula a pouze se hodnotilo, neobjevilo by se klanovstvi, zamereni na jiste osoby.

   Stacilo se drzet prislovi "live and let live"
Osobne jsem zde nestranny a kdyz nekdo napise neco co se mi nelibi, necham si to pro sebe, nanejvys se snazim odpovedet nejak diplomaticky.  Naopak, prispevky Vodnika, Husity, Astra a Peterse meli casto dobre tema a stacilo se toho drzet, misto useknuti a nastoleni souboju.

Jerry
[ Parent ]
 
 
o te flasce Milosi (none / 0) (#148)
HUSITA 22.06.2005 17:19:29 MET
(User Info)