2005-12-23
2005-12-03
2005-10-26
2005-10-24
LOs ungbloggare
Jag vill inte vara petig men kan någon förklara detta för mig. Jag kommenterade ett inlägg på kalle larssons blogg och eftersom jag har för vana att kolla i Google efter svar på mina kommentarer förväntade jag mig att jag skulle se min kommentar.
När jag inte hittade kommentaren, gick jag in på hemsidan för att kolla själva inlägget. Men även det var borta! Är det praxis hos LO eller? redigeras inläggen i efterhand på något sätt?
Googles cache. Tyvärr kom min kommentar inte med. Om ni jämför cachen och sidan ser ni att dom skiler sig åt ganska markant! Inget av inläggen som syns i cachen finns på sidan längre.
Konspiration? :)
När jag inte hittade kommentaren, gick jag in på hemsidan för att kolla själva inlägget. Men även det var borta! Är det praxis hos LO eller? redigeras inläggen i efterhand på något sätt?
Googles cache. Tyvärr kom min kommentar inte med. Om ni jämför cachen och sidan ser ni att dom skiler sig åt ganska markant! Inget av inläggen som syns i cachen finns på sidan längre.
Konspiration? :)
2005-09-22
2005-09-10
Dagstidningar
En graf med dagstidningarnas länkpopularitet är nu med (omgjord, nu med 7-dagars medelvärden). Framöver blir det nog inga fler grafer, utan jag ska koncentrera mig på att utöka indexet och visa populära ord och artiklar.
2005-09-09
Egen adress
Nu har projektet en alldeles (nästan iaf=) egen adress: www.techtigo.com/metablog. En nyhet för idag är att grafen med inlägg har fått ett rullande 7-dagars medelvärde. Automatisk identifiering av bloggar är i utveckling, när den är klar kommer indexet förhoppningsvis att växa 2-3 gånger.
Denna blog kommer således framöver vara en "utvecklingsblogg", om nu någon fortfarande är intresserad av metabloggande :)
Denna blog kommer således framöver vara en "utvecklingsblogg", om nu någon fortfarande är intresserad av metabloggande :)
2005-09-07
Uppdatering
Nu har jag modifierat frekvensgrafen så att den visar procentandel av alla ord istället för st, vilket var lite svåröverskådligt. Nu blir det alltså lättare att förstå. Intressant att veta är också att endast tio ord (att, och, det, i, jag, är, som, en, på, för) står för 74% av alla ord vi använder! Här ska tilläggas att en vanlig dag använder vi (ni:) runt 10000 ord. 90/10-regeln är alltså (inte helt oväntat) tillämpbar på vårt språkbruk (rent teoretiskt borde detta också innebära att det finns en enorm effektiviseringspotential i vårt sätt att tala, då kanske så mycket som 80-90% av allt vi säger inte förmedlar den viktigaste informationen. zip....). En tolkning av detta kan vara att vi i allmänhet har en ganska enkel begreppsapparat som använder enkla operationer och applicerar dessa på alla objekt (sååå långsökt). Här:
Inläggsgrafen har också fått två undergrafer: ord per inlägg och länkar per inlägg. Formen på graferna i början är nog mycket beroende av att indexet då innehöll för få bloggar för att bearbeta dem statistiskt. Här:
För den som är så nyfiken att den orkat läsa hit kan jag säga att de tre stora frågorna som jag just nu brottas med är filtrera eller inte filtrera ord för att göra ett trendindex, detektering av bloggar (med hjälp av hakank?), samt att flytta hela projektet till en separat server, då jag nu har det på min laptop. Det känns lite omodernt att behöva gå ifrån datorn en halvtimme;) Och lite lekande kring Markov n-gram.
Inläggsgrafen har också fått två undergrafer: ord per inlägg och länkar per inlägg. Formen på graferna i början är nog mycket beroende av att indexet då innehöll för få bloggar för att bearbeta dem statistiskt. Här:
För den som är så nyfiken att den orkat läsa hit kan jag säga att de tre stora frågorna som jag just nu brottas med är filtrera eller inte filtrera ord för att göra ett trendindex, detektering av bloggar (med hjälp av hakank?), samt att flytta hela projektet till en separat server, då jag nu har det på min laptop. Det känns lite omodernt att behöva gå ifrån datorn en halvtimme;) Och lite lekande kring Markov n-gram.
2005-09-05
2005-09-04
Första resultaten
Här är några snabba snapshots. Ena grafen visar antalet inlägg den senaste tiden (i mitt index, omkr 600 bloggar fn), den andra ordfrekvens (som väntat lägger sig resultaten på en hyperbolisk graf (ser det ut som:), det anses vara en egenskap alla naturliga språk har. Jag ska senare beräkna quoefficienterna för en jämförelse). På gång är också en graf över dagstidningarnas länkpopularitet, kommer i senare post.