Weet wanneer je pagina’s uit de index worden verwijderd

by Navin Poeran on juli 14, 2008

Je website kan je namelijk in de gaten houden, door een RSS van een zoekopdracht te maken en die toe te voegen aan je favoriete feed programma. Hiermee kan je op de hoogte blijven van hoeveel van je pagina’s in de index blijven, hoeveel worden weg gehaald of hoeveel erbij komen, dus het aantal pagina’s. Aangezien Google zelf gestopt is met het aanleveren van RSS voor zoekopdrachten vanwege duplicate redenen, zullen we dat anders moeten aanpakken.

Wat willen wij dus doen?

Een website monitoren op basis van hoeveel pagina’s worden geïndexeerd of gedeïndexeerd (via de site: functie).

En zo gaan wij dat doen (ten minste ik dan):

  1. Ga naar www.dapper.net en registreer voor een gratis account en log in
  2. Klik nu op create a new Dapp
  3. Je word nu gestuurd naar een ander pagina (dapp-factory.jsp), typ hier in vakje “In a website“, de adres waar de inhoud te vinden is. Hierbij typ je dus http://www.google.nl/search?q=site:www.navinpoeran.com (omdat wij willen meten hoeveel pagina’s geïndexeerd zijn, wanneer ze worden weg gehaald uit de index of wanneer er meer pagina’s worden toegevoegd)
  4. Laat alles op de pagina precies zo en klik op Next Step
  5. Klik nu op Add to Basket en klik daarna weer op Next Step,
    je krijgt een pop-up, klik gewoon
    op OK
  6. Nu als je met je muis over de pagina heen beweegt, ga je zien dat je stukken met je muis kan selecteren (gele rechthoekige balken)
  7. Selecteer alleen dat stuk waar staat hoeveel resultaten je hebt, want dat wil je meten (voorbeeld Resultaten 1 – 10 van circa 404 voor www.navinpoeran.com . ( 0,02 seconden)
  8. Klik op het geselcteerd stukje, het komt dan beneden in het “preview boxje”, klik dan op Save Field
  9. Geef het een naam, voorbeeld geïndexeerde pagina’s
  10. Nu weer klikken op Next Step
  11. Je hebt de optie om het toe te voegen in een groep, of het gewoon te laten. Als je meerdere URL’s wil binden aan een XML bestand, zal dat wel erg handig zijn, bij deze hoeft het niet echt, dus klikken op Next Step
  12. Geeft het een Dapp Name, Description, Tags, vink of laat de andere velden, en klik dan op Save
  13. Je word nu gestuurd naar een ander pagina, met aan de rechter-ongeveer-midden-kant je gaat zien “Choose format“, selecteer RSS Feed en klik op Go
  14. Bij Item Title selecteer je geïndexeerde pagina’s
  15. Nu heb je dus de RSS knop :)
  16. Linkje pakken, toevoegen aan je favoriete feed reader, and that’s it!

Nu kan jij je websites die jij aan het promoten bent op de voet volgen wat betreft hun indexatie proces, erg handig, via je feed reader.

Zie hier een werkende voorbeeld:

http://www.dapper.net/transform.php?dappName=NavinPoeran&transformer=RSS&extraArg_title=Zoekresultaten_NavinPoerannl&extraArg_pubDate=Zoekresultaten_NavinPoerannl&applyToUrl=http%3A%2F%2Fwww.google.nl%2Fsearch%3Fq%3Dsite%3Awww.navinpoeran.com

En zie hier hoe dat in je GoogleReader eruit ziet:

zoekresultaten

Zoekresultaten voor de hoeveelheid pagina's geindexeerd in Google.

:-)

Abonneer aan dit blog via RSS of via e-mail, om op de hoogte te blijven van de meest recente ontwikkelingen. Volg mij op Twitter.

Relevante items

{ 7 comments… read them below or add one }

1 Eduard Blacquière 07.14.08 at 04:27

Ik kende Dapper nog niet; het doet me denken aan een combinatie van Yahoo Pipes en Page2rss-achtige services, maar dan een stuk gebruikersvriendelijker. Leuke tip, Navin!

2 Navin Poeran 07.14.08 at 08:00

No problem Eduard.

3 Navin Poeran 07.14.08 at 08:58

Trouwens, ik had al eerder ervaring met Yahoo! Pipes, maar van Page2RSS had ik niet eerder gehoord. Heb meteen 3 RSS feeds gemaakt, heeft inderdaad ook minder opties, maar even uitproberen, soms heb je met weinig opties al genoeg.

Dus dankjewel ook aan jou :)

4 gijs 08.07.08 at 16:33

Doet ‘ ie het nog? Ik krijg een error melding als ik de voorbeeld feed wil bekijken.

5 Navin Poeran 08.07.08 at 18:43

Ik weet niet of het aan me feed ligt, ik merk dat me andere feeds het ook niet doen. Op hun site zelf staat dit nu:


Please pardon our dust
We’re performing server maintenance and will be back soon

Ik zal het morgen weer tjekken, als het toch niet werkt, maak ik wel een ander feed.

6 Navin Poeran 08.18.08 at 11:30

@ gijs: ik heb het intussen veranderend. Je kan nu dus wel een werkende voorbeeld zien als je erop klikt.

Groetjes,
Navin

7 gijs 08.19.08 at 17:56

bedankt, ik heb gezien dat ‘ie werkt bij jou. ik zal ‘m zelf eens proberen na te bouwen.

Laat een reactie achter

Je kan deze HTML tags en attributen gebruiken: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Anti-spam vraag: