ISBN.nu se perd et se retrouve dans Google Gaffe

Je pensais la semaine dernière que j'avais terminé ma série sur ISBN.nu, un service de comparaison de prix de livres en ligne qui intègre 135 000 de ses pages dans l'index de Google.com. Mais c'est avant que la relation entre le service Web et Google ne devienne d'actualité.

Un jour après mon numéro du 21 février, j'ai révélé que ISBN.nu stockait moins de 4000 pages sur son serveur - les 131000 autres pages sont générées dynamiquement chaque fois qu'une araignée de moteur de recherche (ou un humain) suit un lien - presque toutes les pages les pages du site ont soudainement disparu de l'index de Google. Lorsque j'ai vérifié le lien (reproduit ci-dessous) qui indique le nombre de pages ISBN.nu figurant dans l'index de Google, le total était tombé à neuf.

ISBN.nu Webmaster Glenn Fleishman a d'abord pensé qu'un fonctionnaire de niveau inférieur de Google avait entendu parler de mon histoire et a décidé d'interdire le site. Cela ne convenait pas à Fleishman. Il dit qu'il s'est entretenu personnellement avec les hauts dirigeants de Google au fil des ans. Comme il le décrit, Google n'a aucun problème à indexer les pages générées dynamiquement, tant que le contenu qu'une araignée voit est exactement le même que celui qu'un humain verrait. De nombreux sites basés sur des bases de données génèrent légitimement des pages à la demande plutôt que de stocker chaque page imaginable sur le disque dur d'un serveur.

Heureusement, la panne a été causée par une erreur dans une routine logicielle chez Google. La société de moteurs de recherche m'assure que les pages de ISBN.nu reviendront à l'index Google dans les jours, si elles ne l'ont pas fait au moment où vous lisez ceci.

La façon dont Fleishman a géré le problème, cependant, nous donne un tutoriel précieux. Dans le même temps, la panne révèle comment fonctionne un algorithme de «bannissement» relativement nouveau chez Google. Voici l'histoire:

1. COMMUNICATION OUVERTE. Lorsque Fleishman a remarqué le 6 mars que ses pages étaient absentes de l'index Google, il a envoyé des e-mails polis mais inquiets à ses contacts du moteur de recherche, qu'il avait déjà rencontrés.

2. RELATIONS PRESSE. Fleishman m'a informé du problème, après quoi j'ai envoyé un e-mail séparé à mes contacts chez Google (sur lesquels j'avais payé une visite de courtoisie par hasard au début de février) pour demander des éclaircissements.

3. ANALYSE. Lorsqu'un porte-parole de Google a répondu que les pages manquantes étaient simplement causées par un problème technique et non par une décision politique, Fleishman a analysé la situation et a constaté qu'aucune modification n'était nécessaire dans la conception de sa base de données.

Le problème? Chaque page de comparaison de prix sur ISBN.nu comprend des liens vers jusqu'à neuf librairies différentes. Avec 135 000 pages indexées, cela représente beaucoup de liens. Et chaque lien contient des chaînes de code d'affiliation essentielles afin que ISBN.nu puisse gagner une commission si un utilisateur finit par acheter un livre.

Comme le dit Nate Tyler de Google, "Le problème semble avoir quelque chose à voir avec le grand nombre de redirections d'affiliation, qui ont déclenché une partie de notre technologie automatisée." Cela signifie qu'une routine logicielle Google a deviné que ISBN.nu était une "ferme de liens". Il s'agit d'un faux anneau Web dans lequel des centaines de sites créent des centaines de liens entre eux, essayant de tromper le système bien connu de «popularité de lien» de Google.

Fleishman rapporte que la panne de Google a provoqué une chute de 9 000 visiteurs par jour à 5 000 (une baisse de 45%) et une baisse de 30 à 40% de ses revenus d'affiliation. Il ajoute que Yahoo a récemment omis ISBN.nu pendant quelques jours, réduisant ainsi quelques milliers de références par mois à partir de cette source. Cela souligne l'importance du trafic des moteurs de recherche vers certains sites de commerce électronique, tandis que d'autres dépendent beaucoup plus de leurs propres efforts de publicité et de marketing.

Si vous avez essayé mon lien le mois dernier vers le nombre de pages ISBN.nu chez Google, je m'excuse s'il n'a pas révélé les 135 000 pages que j'ai promises. Vous pouvez essayer le lien ci-dessous pendant quelques jours pour voir combien de pages du site reviennent à l'index au fur et à mesure que l'araignée de Google explore à nouveau les liens.

COMMENTAIRE DE GLENN FLEISHMAN SUR LA PANNE DE GOOGLE:

//[email protected]/?4e52

UNE RECHERCHE MONTRANT LE NOMBRE DE PAGES ISBN.NU SUR GOOGLE

//[email protected]/?61da

- - - - - - - - - - - - - - - - - - - - - - - - - - - -

REVUE E-BUSINESS TECH: LES PRINGLES VIDES PEUVENT UNE ANTENNE SANS FIL

En utilisant une puce de pomme de terre Pringles vide comme antenne externe, les pirates malveillants peuvent facilement trouver et pénétrer dans de nombreux réseaux sans fil d'entreprise, selon une analyse d'I-sec, un groupe de conseil en sécurité.

La société a conduit une voiture dans le quartier financier de Londres, en utilisant une boîte Pringles vide pour amplifier les signaux du réseau sans fil. Plus des deux tiers des entreprises utilisant le sans fil ou le Wi-Fi n'avaient mis en œuvre aucune fonctionnalité de cryptage, a déclaré le groupe de sécurité. Ces réseaux sont vulnérables au vol de bande passante ou à l'intrusion de données.

Le conteneur tubulaire Pringles fait une antenne directionnelle efficace, également connue sous le nom d'antenne Yagi. Les plans d'utilisation de cet appareil et d'autres pour identifier les signaux Wi-Fi ont commencé à circuler sur Internet l'année dernière.

BBC News Online affirme avoir été témoin de la détection par I-sec de près de 60 réseaux sans fil non protégés en un seul voyage de 30 minutes à travers les canyons de la ville. Son rapport décrit le problème et propose des solutions simples.

LES PRINGLES VIDES PEUVENT AIDER LES HACKERS À TROUVER UN WI-FI NON PROTÉGÉ:

//[email protected]/?7562

- - - - - - - - - - - - - - - - - - - - - - - - - - - -

TOP 10 DES ACTUALITÉS DE LIVINGSTON PICKS O 'THE WEEK

1. Netscape Navigator 6 lit les recherches, dit Newsbytes

//[email protected]/?41a

2. Les miniatures des images en ligne sont OK, les règles du tribunal

//[email protected]/?802

3. Les sites de musique en streaming dénoncent les taux de redevances arbitrés

//[email protected]/?bea

4. Comment l'achat de papier b-to-b de Miller Freeman rapporte de l'argent

//[email protected]/?fd2

5. Offrir la livraison gratuite de plus de 99 $ augmente la taille de la commande

//[email protected]/?13ba

6. La Cour suprême peut annuler l'extension du droit d'auteur

//[email protected]/?17a2

7. Cool: Comment créer une galerie rotative dans ColdFusion

//[email protected]/?1b8a

8. La fraude est 19 fois plus probable en ligne que hors ligne

//[email protected]/?1f72

9. Astuces HTML: la bonne façon de faire des rollovers rapidement

//[email protected]/?235a

10. Empêchez les pirates d'utiliser PayPal pour voler votre contenu

//[email protected]/?2742

- - - - - - - - - - - - - - - - - - - - - - - - - - - -

WACKY WEB WEEK: GÉNÉRATEUR TABLOID POP BAND SPLIT-UP

Cela pourrait peut-être satisfaire le besoin de contenu de votre site. Tapez quelques mots-clés dans un formulaire Web et hop: Popjustice, un site indie de musique irrévérencieux, crache un article de tabloïd parfait sur la rupture imminente de tout groupe pop de votre choix.

Un peu de copier-coller pour copier la rumeur familière et vous aussi, vous pouvez ressembler à un initié de la musique. Le site britannique de Popjustice est une sorte de croisement entre un fanzine et l'un des blogs les plus élaborés que vous ayez jamais vu. Essayez-le, mais soyez prévenu: langage coquin et humour juvénile, mecs.

MOTEUR WEB SPURIOUS BAND-SPLIT DE POPJUSTICE:

//[email protected]/?c382

- - - - - - - - - - - - - - - - - - - - - - - - - - - -

SECRETS DES AFFAIRES ÉLECTRONIQUES: Notre mission est de vous apporter des informations tellement utiles et stimulantes sur le Web que vous avez vraiment hâte de lire votre e-mail.

À PROPOS DE L'AUTEUR: E-Business Secrets est écrit par Contributing

Rédacteur Brian Livingston (//SecretsPro.com). Le directeur de recherche est Ben Livingston (aucun lien). Brian a publié 10 livres, dont:

Secrets Windows Me:

//[email protected]/?0764534939

Secrets de Windows 2000:

//[email protected]/?0764534130

Gagnez un chèque-cadeau valable pour un livre, un CD ou un DVD de votre choix si vous êtes le premier à envoyer un pourboire que Brian imprime. mailto: [email protected]