Dymov

2005-08-26

Metabloggande

Ajajaj, nu är sommaren över. Jag har länge hållit på med ett litet bloggprojekt, de första resultaten kommer dock först nu. Här är lite roligt info om en del aktuella svenska bloggar som jag har undersökt:

Förekomsten av ord i texterna, titlarna och länkord:

ord antal procentandel

att191278.42
och165997.31
det145616.41
i140426.18
som126845.59
är125955.55
en103574.56
96174.23
för82003.61
jag74423.28

TITLE:
och2602.69
i2442.52
är1711.77
dagens1571.62
1571.62
en1341.39
om1261.30
för1121.16
det910.94
värsting810.84

LINK:
här2283.18
i1381.93
961.34
och721.01
en660.92
den600.84
att560.78
the550.77
dn540.75
ett530.74

Populäraste sidorna:
url ant. länkar procentandel
dn.se1855.36
aftonbladet.se1765.10
svd.se1273.68
expressen.se852.46
photos1.blogger.com651.88
sr.se581.68
dagspolitik.blogspot.com561.62
hakank.org441.28
lidaker.se371.07
erixon.com330.96


Efter allt jobb som jag lagt ner på detta kan jag säga att det jag hatar mest är människor som syndikerar ofullständiga inlägg. Speciellt i RSS, där ligger den ofullständiga versionen i samma XML-tag som den fullständiga. Jag får se om detta kan forsätta, det finns fullt med uppenbara förbättringsmoment, men allt tar lång tid. Själv tycker jag att det skulle vara spännande att derivera värdena och se vilka ord som är på uppgång/nergång och likn. Samma sak med länkarna, osv, osv, osv. Är det någon som kan komma på ett bra namn på prorammet är jag tacksam, annars "blogometer".

På återseende.

UPDATE: vill du vara med i indexet, maila mig på gdymov at gmail dot com, skriv adress till ditt rss eller atom-flöde. Endast bloggar med fullständig syndikering (full-text) kan vara med.