Vad ska vi indexera / inte indexera?
Sajter som ska indexeras
*.intra.kth.se
campi.kth.se
Delar som inte ska indexeras
Många av de domäner som finns under kth.se är inte relaterade till myndigheten. Det är t ex sektioner och andra domäner som sedan länge ligger ligger där men inte är knutna till KTH.
Sektionshemsidor
b.kth.se
f.kth.se
m.kth.se
k.kth.se
d.kth.se
dr.kth.se
e.kth.se
m.kth.se
media.kth.se
ths.kth.se
s.kth.se
t.kth.se
Föreningssidor
stacken.kth.se
Duplicerat innehåll
- Kontaktformuläret (c=, u=)
- Taggsök (tag=)
- Kalender (date=)
- ??? service=
- Programväljaren på studentwebben
- researchprojects.kth.se och pocket.kth.se
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Indexerade sidor i Google idag
Polopoly, Bloggar, Kopps, Social
- site:www.kth.se (336 000 indexerade sidor)
Delmängden Social
- site:www.kth.se/social (128 000 indexerade sidor)
Delmängden Bloggar
- site:www.kth.se/blogs (7 000 indexerade sidor)
Delmängden Kurs- och programkatalogen
- site:www.kth.se/blogs (69 000 indexerade sidor)
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Allt inklusive alla subdomäner
- site:kth.se (1140 000 indexerade sidor)
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Hur mycket "duplicated content" har vi?
Finns det delar/system vi inte vill indexera?
Finns det delar av innehåll vi inte vill indexera? (i system som generellt ska indexeras)