Rechercher sur le site

Rechercher sur le site


Rechercher sur le site - Historique

Utilisation du site du journal Fulton History

Cliff Lamere février-mars 2014, dernière révision 12 juin 2020

Le Fulton History Newspaper Site est une réalisation vraiment incroyable pour un homme travaillant seul. Tom Tryniski, un ingénieur à la retraite, y travaille depuis 18 ans, environ 10 heures par jour, sept jours par semaine. Au 24 octobre 2017, il avait réussi à mettre 40 743 000 pages de journaux sur Internet. Par comparaison, la Bibliothèque du Congrès n'a que 12 289 671 pages sur leur Chronique de l'Amérique site pour lequel ils ont reçu une subvention fédérale de 22 millions de dollars il y a des années.

[ Le 12 juin, il avait 48 156 000 pages de journaux en ligne.]

Tom Tryniski à son travail (vidéo)

Haper's Magazine a publié un article sur Tom Tryniski le 13 septembre 2017. (lien)

Le logiciel de reconnaissance optique de caractères (OCR) examine le texte d'une image et le convertit en texte numérique qui peut être recherché, copié et modifié. Sur le site Fulton History, le logiciel OCR doit fonctionner avec des images de journaux qui ont été copiées à partir de microfilms. Certains journaux sont très anciens et le texte peut être un peu difficile à lire. De plus, le site Fulton History utilise des microfilms qui ont déjà été utilisés et peuvent donc comporter des rayures, des taches et de la poussière. Tout cela peut entraîner une lecture erronée par le logiciel OCR de ce que l'œil humain voit facilement.

Les résultats de l'utilisation du moteur de recherche sur le site Fulton History sont très différents des résultats que vous obtenez lors d'une recherche Google, car Google n'essaie pas de rechercher le texte qui se trouvait sur les images. Obtenir les meilleurs résultats des recherches sur le site Fulton History nécessitera des ajustements considérables dans la façon dont vous effectuez vos recherches.

Note importante: Cette page Web décrit les différents types de recherches qui peuvent être effectuées sur le site Fulton History. Vous devez comprendre ces informations, mais la page Web connexe sur les recherches booléennes et les recherches avec caractères génériques vous montrera comment effectuer des recherches avancées et plus efficaces lorsque les recherches sur cette page Web échouent.

Avec plus de 40 millions de pages de journaux disponibles sur le site Web de Fulton History, les recherches trouvent souvent des centaines ou des milliers de visites. Les recherches utilisant "l'expression exacte" rendront les résultats moins nombreux et donc plus faciles à gérer.

Recherche de "tous les mots"

Le sens de cette recherche est évident, mais il y a un raffinement de cette recherche qui doit être mentionné ici. Supposons que vous souhaitiez rechercher :

Joseph E. Brady Albany est décédé

En utilisant l'option "all of the words", vous trouverez chaque page contenant le nom Joseph et le nom Brady et le mot mort, etc. n'importe où sur la page. Ce que vous voulez vraiment, c'est trouver Joseph E. Brady sur une page qui mentionne également les mots Albany et mort. Voici comment procéder :

"Joseph E. Brady" Albany est décédé

La recherche avec des guillemets nécessitera que tout ce qui se trouve entre guillemets soit traité comme une mot et doit donc être dans chaque coup dans exactement le bon ordre.

Recherche d'une personne

Lors de la recherche du nom d'une personne telle que John Arthur "Jack" Smith, plusieurs recherches exactes peuvent être effectuées. (Les recherches booléennes et les recherches avec caractères génériques vous donneront des résultats identiques ou meilleurs en moins de recherches, vous faisant ainsi gagner du temps.)

Malheureusement, de nombreuses personnes nées avec un prénom qu'elles n'aimaient pas ont décidé d'utiliser leur deuxième prénom comme prénom. Par exemple, John A. Smith pourrait devenir Arthur J. Smith. Gardez cela à l'esprit si vous n'êtes pas certain. Mon sentiment est que les documents officiels comme les certificats de naissance et les projets d'enregistrement devraient avoir le nom de naissance correct de la personne. Le nom d'un jeune enfant sur un recensement (âgés de 0 à 4 ou 5 ans) a également tendance à être correct, à moins qu'il ne s'agisse de surnoms évidents.

Une personne qui donne des informations à un journaliste pour un reportage peut ne pas avoir une connaissance précise de l'orthographe du nom de la personne nommée dans l'article. Par conséquent, vous pouvez également utiliser d'autres orthographes d'un nom de famille. (La recherche générique ? mentionnée sur une autre page Web peut simplifier cette recherche.)

Ajustement des erreurs d'OCR

Dans les journaux, la lettre minuscule 'i' et la lettre minuscule 'l' sont souvent difficiles à distinguer pour un programme OCR. Gardenier est l'orthographe principale du patronyme qui m'intéresse le plus. Disons que je recherche la variante orthographique Gardinier et que je souhaite trouver toutes les fois où elle a été mentionnée dans un journal. Sur ce site, il y a 5000 hits, le maximum que le moteur de recherche trouvera (il y en a probablement beaucoup plus que ça).

3183 hits se sont produits lorsque j'ai remplacé le premier i de Gardinier par un l (le L minuscule).

4139 hits se sont produits lorsque j'ai remplacé le deuxième i dans Gardinier par un l.

5000 hits (le maximum qui sera affiché) se sont produits lorsque j'ai remplacé les deux i par un l.

Dans les trois recherches utilisant des orthographes modifiées, plus de 12 000 résultats ont été obtenus, ce qui montre que la substitution de i à l et de l à i est une stratégie de recherche importante. Bien sûr, bon nombre des 12 000 articles contiendront également l'orthographe correcte du nom de famille, donc la recherche de l'orthographe normale du nom de famille seul n'aurait pas manqué ces articles. Cependant, un nombre important d'articles qui contenaient l'orthographe corrompue ne mentionnaient le nom de famille qu'une seule fois. Cela signifie qu'un grand nombre d'articles auraient été manqués si vous n'aviez pas recherché les orthographes corrompues. C'est particulièrement important lorsque vous effectuez une recherche exacte du prénom et du nom d'une personne, ou du prénom/initiale du deuxième prénom/nom de famille. Ces combinaisons dans un article peuvent être disponibles pour le moteur de recherche uniquement avec l'orthographe corrompue.

Malheureusement, de nombreuses lettres peuvent être modifiées lors de la conversion OCR en texte numérique, y compris celles des prénoms. Le nombre de variantes de la recherche que vous essayez dépendra de l'importance des informations que vous recherchez. Ce qui suit est une liste de certains changements de lettres que j'ai trouvés un jour (plus rn suggérés par Charles Dobie). Certains sont plus fréquents que d'autres.

c devient e (Saranac est devenu Saranae)

c devient o (Lucy est devenue Luoy)

e devient o (le est devenu tho)

G devient O (Gardinier est devenu Oardinier, 1183 hits)

h devient b (son est devenu bis)

rn devient m (Burnside est devenu Bumside)

Probablement moins fréquent

e devient a (pieds devenus faet, il est devenu ha)

G devient (i (une parenthèse n'est pas un terme de recherche, donc G n'est souvent qu'un i. Essayez ieorge pour George.)

s devient un (Parks est devenu Parka)

s devient e (Syracuse est devenue Syracuee)

y devient v (Syracuse est devenu Svracuse)

Parfois, le nom ne peut pas être trouvé

Parfois, le texte OCR est si mal orthographié qu'il n'y a presque aucune chance qu'il puisse être trouvé. Un mariage "Lukins-Guardenier" est devenu mariage "Laklas-Gnardenier". Vous n'auriez trouvé aucun nom de famille avec une recherche normale, et les noms n'ont été mentionnés qu'une seule fois, donc l'annonce de mariage aurait été manquée. Si vous connaissez la date d'un événement, le site vous permettra de parcourir ses pages de journaux par date.

Noms coupés par les journaux

La recherche de Gard-inier a donné lieu à 294 résultats supplémentaires. La recherche de Gardin-ier a donné lieu à 229 autres résultats. Si le nom n'était mentionné qu'une seule fois dans l'article, vous l'auriez manqué si vous n'aviez pas recherché la version avec trait d'union.

Image de journal au format PDF ou affichée sur le site d'histoire de Fulton

Lorsque l'image du journal apparaît, elle peut être présentée par votre ordinateur sous la forme d'une page PDF distincte, ou elle peut apparaître dans le cadre du site Fulton History, dans la partie à droite de la liste des résultats. Je préfère les pages PDF car elles occupent tout l'écran. Il existe des préférences ou des options dans votre navigateur Internet qui contrôlent ce qui se passe, bien que la bonne option soit difficile à trouver, et cet emplacement changera probablement si vous passez à une nouvelle version du navigateur. Il y a tellement de navigateurs et de versions disponibles qu'il n'est pas possible de donner ici des instructions utiles.

Recherches effectuées sur la page du journal après son apparition

Bien que Modifier/Rechercher puisse être utilisé, il est plus rapide d'utiliser Ctrl-f pour faire apparaître la zone de recherche. Si la page du journal apparaît dans le cadre du site Fulton History, vous devrez peut-être cliquer sur l'image du journal avant d'essayer d'afficher le champ de recherche. Sinon, vous risquez de ne rechercher que les résultats sur le côté gauche de la page.

Lorsque je recherche l'article qui m'intéresse dans une page de journal, je tape généralement le nom de famille dans le champ de recherche. Immédiatement, je répète la recherche autant de fois que nécessaire pour obtenir un message d'erreur indiquant qu'il n'y a plus d'instances de ce mot sur la page. Parfois, il y aura à la fois un article et une photo de la personne sur la même page. Vous ne voulez certainement pas manquer la photo, ou un éventuel deuxième article mentionnant cette personne ou un éventuel parent du même nom.

Trouver le nom et la date d'un journal

Lorsqu'une nécrologie ou un avis de décès indique qu'une personne est décédée hier ou vendredi, vous devez connaître la date du journal. Certaines pages de journaux n'ont pas le nom et la date du journal en haut de l'image. Une bonne recherche généalogique nécessite que vous enregistriez ces informations. Pour l'obtenir, vous devez procéder comme suit.

Copiez le lien sur lequel vous avez cliqué pour que la page du journal s'affiche. Collez-le dans le champ de recherche en haut de la page. Il y aura un numéro à quatre chiffres juste avant la fin du .pdf. Vous devez modifier ce nombre en le réduisant de un, puis assurez-vous que vous rechercherez "la phrase exacte". Le nouveau nom de fichier apparaîtra sous forme de lien. Cliquez dessus et une image de la page précédente du journal apparaîtra sous forme de fichier PDF. Vérifiez le haut de cette page pour les informations souhaitées. S'il manque sur cette page, répétez le processus, en reculant d'une page à la fois, jusqu'à ce que vous trouviez une page qui contient le nom du journal et la date. Si tout le reste échoue, vous finirez par arriver à la page 1. Elle contient toujours les informations que vous recherchez.

Au cas où vous pensez qu'il serait conseillé d'augmenter le nombre de un à la fin du nom de fichier .pdf plutôt que de diminuer le nombre comme je l'ai suggéré, augmenter le nombre vous amènera vers la fin du journal, puis vers le début du prochain journal. Parce qu'il s'agit de vieux journaux qui ont peut-être survécu à plusieurs décennies ou peut-être même à un siècle, vous ne pouvez pas supposer que chaque numéro existe toujours et a été microfilmé. Par conséquent, en regardant le prochain journal, vous n'avez aucun moyen de savoir combien de jours, de semaines ou de mois plus tard ce numéro est. Cela ne donnera aucune indication précise sur la date que vous recherchez.

Copie de texte à partir d'une page de journal

La copie de texte est normalement assez facile à partir d'une page Internet moyenne, mais c'est souvent un processus très difficile sur le site d'histoire de Fulton. Chaque page comprendra environ six colonnes de texte. À l'aide du curseur de la souris, vous pouvez surligner le texte d'un article et essayer de le copier. Cependant, ce qui arrive trop souvent, c'est que lorsque vous déplacez le curseur le long des lignes d'une colonne, vous remarquerez peut-être que le texte des autres colonnes est également mis en surbrillance. Il y a souvent des lignes noires verticales entre les colonnes. Lorsque ces lignes comportent des ruptures, la surbrillance peut passer dans la colonne suivante. Cependant, il n'y a souvent pas de pause, et il n'y a aucune raison évidente pour laquelle la mise en évidence devrait sortir de la colonne souhaitée, mais c'est le cas.

Disons que le texte en trois colonnes a été mis en évidence. Si vous utilisez la fonction de copie, elle copiera le texte en surbrillance dans les trois colonnes. Le texte que vous voulez réellement peut apparaître sur chaque troisième ligne, ce qui signifie que vous devez supprimer les lignes indésirables. Plutôt que de le faire, je réessaye généralement de surligner le texte. Lorsque vous déplacez le curseur vers le bas dans la colonne, vous pouvez remarquer à quel point la surbrillance se dégrade dans les autres colonnes. Déplacez le curseur d'une ligne vers le haut et copiez et collez cette quantité de texte. Ensuite, commencez à la ligne suivante et mettez en surbrillance autant que vous le pouvez sans déborder dans d'autres colonnes. Répétez aussi souvent que nécessaire.

Parfois, il peut être plus rapide de taper simplement certaines informations (peut-être seulement une ou deux lignes gênantes, mais parfois je tape l'article en entier). Comme j'utilise assez souvent le site Fulton History dans mes recherches, j'ai investi dans Dragon Naturally Speaking qui me permet de lire à haute voix les mots de l'article et de les faire taper par l'ordinateur pour moi. Même ce processus n'est pas sans faille, mais les quelques corrections qui doivent être apportées lors de l'utilisation de ce programme ne sont pas assez nombreuses pour me décourager de l'utiliser.

Exemple de paragraphe copié

Le texte suivant a été copié d'une colonne dans un journal. Notez qu'un retour dur (causé en appuyant sur la touche Entrée) se produit à la fin de chaque ligne de la colonne. Pour économiser de l'espace et présenter le texte dans un format plus facile à lire, je vais à la fin de chaque ligne, j'appuie sur la touche Suppr (ce qui fait remonter la ligne de texte suivante), puis j'appuie une fois sur la barre d'espace pour séparer deux mots qui ont été temporairement joints ensemble.

Lorsque l'affaire a été appelée avant

le juge Borst ce matin, il y avait

une grande affluence d'avocats étrangers

et les agents publics. L'état

s'est immédiatement opposé à ProceedLng_j.yiii.

le procès, mais les objections furent rejetées.

Certains problèmes dans cette transcription peuvent être expliqués. Un point sur la ligne trois est représenté ici comme un point. Le 'n' a été interprété comme 'ii'. Le fouillis de lettres à la fin de la cinquième ligne est le résultat d'une éraflure sur un microfilm qui a touché le bas de certaines de ces lettres, bien que le dernier mot « avec » soit très clair pour un œil humain. À la sixième ligne, le « e » final de « étaient » n'était pas complètement imprimé dans l'image du journal. Les mots « avocats » et « annulée » (lignes 3 et 6) étaient des mots coupés qui étaient séparés, une partie de chaque mot étant sur deux lignes. Le programme OCR montre parfois les parties séparément, à d'autres moments les réunit en un seul mot (parfois sans supprimer le trait d'union). Si le tiret n'est pas supprimé, ce mot ne sera pas trouvé dans une recherche (sauf si vous recherchez avec le tiret dans le mot).

Si vous ne parvenez pas à lire quelque chose tel qu'il apparaît sur l'image de la page du journal, la version OCR est parfois lisible.

À la fin de la quatrième ligne ci-dessus se trouve le mot état. Cela ne ressemblait certainement pas à ça sur la page du journal, même pas de près. Je n'aurais jamais pu le deviner, mais quand j'ai surligné, puis copié et collé le texte, c'était très lisible. Ainsi, lorsque je ne peux pas lire quelque chose d'important, je le copie, puis je le colle quelque part pour voir ce que le programme OCR pense que c'est. Cela a mieux fonctionné avec des chiffres, car j'ai parfois pu confirmer une année de naissance ou de décès déjà dans mes dossiers (je n'accepte jamais un numéro illisible sans confirmation).

Enregistrement de la source de vos informations

Il est important d'enregistrer les sources de vos informations généalogiques afin que vous puissiez ultérieurement revenir à la source pour vérifier quelque chose qui semble douteux, ou pour éventuellement obtenir des données supplémentaires de cette source. De plus, si vous transmettez vos données à une autre personne, il est préférable d'inclure les sources afin que l'autre personne puisse les vérifier. Certaines données ne semblent tout simplement pas raisonnables ou exactes, peu importe qui vous les a fournies ou qui a été cité comme source. Les dates, par exemple, peuvent être mal saisies. Si la date a été interprétée par un programme OCR, elle a pu être mal interprétée.

Pour les sources Internet, j'enregistre toujours l'URL (adresse) afin de pouvoir revenir plus tard à cette page exacte. Sur le site Fulton History, l'adresse ne change pas au fur et à mesure que de nouvelles recherches sont effectuées. Ainsi, j'enregistre l'adresse immuable suivie du lien complet vers la page PDF où l'information a été extraite. Par exemple,

Amsterdam NY Daily Democrat and Recorder 1925 Sep-Dec Grayscale - 0728.pdf

Après avoir enregistré les informations sur une page de journal, je vais en haut de la page pour extraire le nom et la date du numéro du journal. Le lien PDF sur ce site contient le nom du journal selon le format standard du webmaster qui n'est souvent pas un nom précis. Je préfère utiliser le nom tel qu'il apparaît dans ce journal, ce qui est parfois différent. Cependant, le nom sur une page particulière peut être raccourci pour économiser de l'espace. Le nom complet du journal n'apparaît peut-être qu'en première page, mais c'est beaucoup trop difficile à atteindre rapidement. Si l'article est à la page 6, vous pouvez soustraire 5 du nombre à quatre chiffres à la fin du lien PDF et espérer arriver à la première page (faites une recherche exacte, pas "tous les mots").

Au fil du temps, le nom d'un journal peut avoir changé plus d'une fois. J'utilise le nom en haut de la page ou de la première page que j'ai examinée. Pour les journaux des grandes villes, j'ajoute généralement entre parenthèses l'abréviation de l'État. Pour les noms de journaux (comme Herald Standard) qui n'incluent pas le nom de la localité dans laquelle le journal a été publié, j'ajoute la localité et l'état entre parenthèses.

Un calendrier perpétuel peut être très utile

Lorsque le jour du mois ne peut pas être lu en haut de la page du journal, l'accès à un calendrier perpétuel peut être très utile. Si vous pouvez lire que le journal a été publié un samedi, vous pouvez rechercher l'année et le mois sur le calendrier perpétuel, puis vérifier les dates de tous les samedis de ce mois. Si vous ne savez toujours pas quel samedi c'était, vous devez trouver la date complète sur une autre page.

Un calendrier perpétuel est disponible ici ou ici.

Le texte que vous trouverez sur le site Fulton History fera parfois partie d'une section consacrée à une certaine zone géographique. Vous devez rechercher le titre de l'article de journal (il peut être dans la colonne précédente à gauche). Parfois, votre texte peut faire partie d'un article avec un titre comme "il y a 10 ans aujourd'hui" ou il y a 20 ans, ou même 50 ans dans le passé. Si tel est le cas et que vous ne voyez pas ce titre, vous enregistrerez la mauvaise année pour l'événement qui vous intéresse.

Si un article semble se terminer en bas d'une colonne, vous devez regarder en haut de la colonne suivante à droite pour vous assurer que l'article n'a pas été poursuivi là-bas. C'est parfois le cas, et vous ne voudrez pas manquer cette partie.

Consultez la page Web sur les recherches booléennes et les recherches avec caractères génériques pour une description d'une recherche meilleure et plus efficace.

La page Web sur laquelle vous vous trouvez fait partie d'une série de pages Web sur le site du journal Fulton History. Il est écrit pour vous aider à faire des recherches plus productives.


Rechercher sur le site - Historique

Salut! Ce site Web relate l'histoire de cette prison à sécurité maximale de l'Iowa, vieille de près de 150 ans, qui est toujours en service aujourd'hui.Avant de partir, veuillez utiliser l'un des formulaires de commentaires sur le site pour me faire savoir ce que vous en avez pensé. N'hésitez pas à rechercher sur le site, mais n'oubliez pas qu'il s'agit d'un site d'histoire non officiel, donc les informations sur les détenus actuels ne sont pas disponibles.

Merci de visiter et profiter!

D'Arcadia Publishing, le plus grand éditeur au monde de livres d'histoire locale - "Pénitencier d'Anamosa", un livre à couverture souple de 128 pages contenant 200 images de la riche histoire de la prison d'Anamosa.

COMMANDEZ MAINTENANT - envoyez un chèque ou un mandat postal de 25 $ (le prix comprend les frais d'expédition) à l'Association du musée du pénitencier d'Anamosa, PO Box 144, Anamosa, IA 52205.


Rechercher sur le site - Historique

Recherches booléennes et caractères génériques sur

le site du journal Fulton History

Cliff Lamere oct. 2015

Cette page Web est destinée à décrire les recherches booléennes et l'utilisation de caractères génériques (méthodes avancées de recherche) sur le site Web Fulton History. Si vous ne l'avez pas déjà fait, il serait préférable d'apprendre d'abord les techniques de base pour utiliser ce site en lisant ma page Web intitulée Utilisation du site du journal Fulton History . Le site Web de FH est extrêmement précieux pour la recherche généalogique, mais les recherches obtiennent souvent des centaines ou des milliers de visites, ce qui rend leur tri très difficile et fastidieux. Les fautes d'orthographe dans le texte OCR sont courantes, ce qui signifie que vous ne trouverez peut-être pas ce qui s'y trouve réellement. Mon autre page web vous aidera à comprendre les problèmes et l'utilisation normale du site. T sa page Web vous montrera comment obtenir moins de visites, mais de meilleures.

Options de recherche booléenne

Il n'y a que quelques options de recherche booléennes : ET, OU, NON, ( ) et " "

ET exemple : marié ET décédé

Celui-ci ne trouverait que les pages de journaux sur lesquelles les deux les mots étaient présents.

OU exemple : marié OU décédé

Cela trouverait chaque page de journal sur laquelle l'un, ou l'autre, ou les deux les mots étaient présents.

NON (précédé de ET) exemple : marié ET NON décédé

Le mot marié serait sur toutes les pages trouvées, mais seules celles qui n'avaient pas aussi le mot sont mortes. Cet opérateur booléen est utilisé pour éliminer un mot ou l'orthographe particulière d'un nom de vos résultats de recherche. Il est précédé du mot ET. Mais, vous devez réaliser que l'élimination de ce mot peut également éliminer le coup que vous recherchiez. Voici un exemple qui utilise PAS deux fois.

Gardinier ET PAS Gardiner ET PAS Clarence

( ) exemple : marié ET (décédé OU né)

Marié apparaîtrait sur toutes les pages trouvées, de même que le mot mort ou né, ou les deux. Les parenthèses permettent de regrouper les termes auxquels s'applique un opérateur tel que AND ou OR. (marié ET décédé) OU né aurait un sens différent de l'exemple ci-dessus, car les parenthèses sont à un endroit différent. Dans ce dernier cas, à la fois « marié » et « décédé » doivent être présents si l'un ou l'autre est présent. Si « marié » et « décédé » sont tous les deux présents, née peut être ou ne pas être là. Si « marié » et « décédé » sont tous les deux absents, née presence obligatoire.

" " exemple : "John W. Jones" ET Jennifer

Ceci est traité comme un seul mot dans les recherches en raison des guillemets.

Recherches génériques (? avec/4)

Ces deux caractères génériques sont extrêmement utiles, et ils peuvent être utilisés avec n'importe laquelle des quatre options de recherche, pas seulement des recherches booléennes.

? exemple : Cath?rine Gard?n?er

Cela trouvera n'importe quelle lettre à cet endroit dans le mot. Les orthographes courantes dans le passé étaient à la fois Catharine et Catherine, donc l'utilisation de ce caractère générique permettra de trouver l'une ou l'autre orthographe. Cela évite une recherche supplémentaire avec la deuxième orthographe. Plus d'un ? peut être utilisé dans un mot.

Dans mes propres recherches, Gardenier/Gardinier est mon principal intérêt. En recherchant Gard?n?er, je résous plusieurs problèmes à la fois. La première ? me permettra d'obtenir Gard e nier et Gard i nier, mais aussi Gard a nier et Gard o nier (ces deux dernières sont des orthographes occasionnelles). La deuxième ? me permettra de trouver l'une des quatre orthographes mentionnées qui se terminent par - i er et e er.

En raison des erreurs de reconnaissance optique de caractères (OCR) mentionnées dans mon autre page Web, le i est souvent mal interprété comme le l minuscule. En utilisant le second ?, le moteur de recherche trouvera à la fois Gardinier et ses fautes d'orthographe OCR de Gardlnier, Gardinler et Gardlnler. Lors de la lecture de l'article proprement dit, l'œil humain peut voir l'orthographe correcte même si le programme OCR ne le peut pas.

avec 4 Connors avec 4 mariés Brady avec 5 "Carlton D."

Le w signifie "à l'intérieur". La première recherche signifie que Connors et marié doivent être à moins de 4 mots l'un de l'autre, et l'un ou l'autre mot peut être le premier (une caractéristique importante). Le 4 peut être remplacé par un certain nombre de vos propres préférences dans une situation particulière (j'utilise jusqu'à 9). La deuxième recherche est très utile lorsque vous recherchez Carlton D. Brady, en particulier lorsque son nom est divisé comme dans "Carlton D. et Mary Smith Brady ont rendu visite à ses parents". à la fois l'homme et la femme avant le nom de famille, ou lorsqu'un article indique son nom comme « Brady, Carlton D. ».

Le nombre a fonctionné pour moi jusqu'à w/15, mais avec des nombres plus importants, vous obtiendrez plus de résultats qui ne sont pas liés à ce que vous recherchez. Voici un exemple des raisons pour lesquelles l'utilisation de w/9 peut être importante. Une recherche sur 'Gardenier w/9 dead' (sans guillemets) trouvera l'exemple suivant, qui aurait été manqué si un nombre plus petit avait été utilisé.

Mme Gardenier, alors qu'elle rendait visite à sa mère Mme Andrew H. Jones, est décédée dans son sommeil.

MAIS, de temps en temps, vous pouvez obtenir zéro hit. Essayer la même recherche plusieurs fois peut entraîner des résultats. Si je n'obtiens toujours aucun résultat et que je suis convaincu que les résultats auraient dû se produire, j'attends un moment et réessaye. Cela peut dépendre du nombre de personnes qui utilisent le moteur de recherche en ce moment. Ce joker est très précieux.

Caractère générique qui fonctionne mal

Le * est un caractère générique qui est censé fonctionner, mais donne des résultats très trompeurs qui pourraient vous faire abandonner une recherche prématurément. Faisant initialement partie de cette page Web, je l'ai supprimée et signalé le problème au webmaster du site Fulton History. Les informations sur l'utilisation du * se trouvent maintenant sur une page Web distincte où je montre la preuve que cela fonctionne quelque peu, mais ne fonctionne pas comme prévu. Il manque jusqu'à 75 % de ce qu'il devrait trouver. Cliquez ici pour lire cette page Web.

Restreindre la recherche à un seul journal

Si vous allez vous concentrer sur une ville de publication en particulier, vous pouvez choisir le booléen option de recherche dans le menu déroulant. C'est une option de recherche extrêmement précieuse pour le site Web Fulton History, car elle réduit considérablement le nombre de visites en se concentrant uniquement sur les journaux de la localité que vous choisissez. Voici deux exemples d'une telle recherche sur ce site.

Jones ET marié ET (le nom de fichier contient ( Albany NY )) ET (le nom de fichier contient ( 1927

"James W. Jones" ET marié ET (le nom de fichier contient ( Albany NY )) ET (le nom de fichier contient ( 1927

Le premier exemple indique que vous voulez que le nom Jones et le mot mariés sur la même page, et que le nom de fichier PDF (le lien hit) doit contenir Albany NY, et que vous ne voulez voir que les journaux qui se produisent dans la plage de dates de 1927 -1950. En raison des guillemets dans le deuxième exemple, "James W. Jones" est traité par le moteur de recherche comme un seul mot.

Le mot AND est obligatoire entre chaque partie de cette recherche booléenne. Bien qu'il soit généralement affiché en majuscule, cela n'est pas nécessaire sur le site Fulton History. Les parties apparaissant entre parenthèses ci-dessus doivent avoir le format exact qui est affiché. La localité de publication doit inclure le code d'état à 2 lettres. La plage de dates doit avoir deux tildes (

) séparant les années, mais si vous recherchez une seule année, elles doivent être omises. Vous ne pouvez modifier que les parties des exemples ci-dessus qui sont en caractères noirs ( Jones ou James W. Jones, marié, localité (pas de virgule) et les années que vous souhaitez afficher ). Plus de mots peuvent faire partie de la recherche tant que chacun est séparé des autres mots par un ET.

Remarque : Vous devez savoir comment ce site enregistre la localité souhaitée dans ses noms de fichiers PDF. Sinon, il ne sera pas trouvé. Chaque ville a un journal, vous pouvez donc essayer de deviner en utilisant le nom de la ville plus le code d'état à deux lettres. Pour les petites localités, vous pouvez mettre ce nom dans la recherche et l'espoir. Ou, à partir de recherches précédentes, vous vous souvenez peut-être de l'emplacement du journal local. Ou bien, effectuez une recherche par "expression exacte" pour le nom et voyez quels journaux apparaissent dans les liens de recherche. Ensuite, essayez une recherche booléenne en utilisant les informations du journal.

Erreur de syntaxe : si vous faites des erreurs en tapant la chaîne de recherche booléenne, vous n'obtiendrez aucun résultat. Pour distinguer cela d'une bonne recherche qui peut également n'avoir aucun résultat, regardez près du haut de l'écran où il affiche vos résultats de recherche. Recherchez un message dans une petite police disant : " La demande de recherche contenait une erreur de syntaxe." Si vous trouvez cela, corrigez l'erreur et réessayez.

Restreindre la recherche à deux journaux

Les recherches booléennes utilisant OR vous donnent la possibilité de choisir plus d'un journal à inclure dans les résultats.

Jones ET est décédé ET (Le nom de fichier contient ( Albany NY )) OU (Le nom de fichier contient ( Troy NY )) ET (Le nom de fichier contient ( 1927

Si vous deviez remplacer le OU par un ET, chaque hit devrait avoir à la fois « Albany NY » et « Troy NY » dans le lien du hit (nom de fichier), ce qui est impossible. La recherche échouerait.

Étant donné que la ligne de recherche booléenne sera difficile à mémoriser, vous voudrez peut-être copier et coller mon exemple quelque part où vous pourrez modifier les éléments de recherche en noir pour qu'ils correspondent à ce que vous voulez trouver. Ensuite, collez simplement la nouvelle ligne dans le moteur de recherche. N'oubliez pas de sélectionner l'option de recherche booléenne.

UNE DÉCOUVERTE INTÉRESSANTE

En écrivant cette page Web, j'ai découvert quelque chose qui ne fonctionnera probablement pas dans les recherches booléennes sur la plupart des autres sites Web. Je ne sais pas pourquoi cela devrait fonctionner sur celui-ci.

Si vous recherchez juste Jones ET marié (dans une recherche booléenne ou une recherche exacte), une chose étonnante se produit. Tous les hits ont un mot entre Jones et "marié" (Jones est toujours le premier mot des deux). Jones ET ET marié donne des résultats dans lesquels Jones est suivi de deux mots, puis marié. Cinq ou dix AND aboutissent à des hits qui ont cinq ou dix mots entre Jones et "marié".

C'est un coup de chance intéressant, qui peut être utile. Cependant, le terme de recherche w/4 mentionné précédemment renverrait des résultats pour Jones et mariés lorsqu'ils étaient séparés de 1, 2, 3, 4 ou 5 mots (0-4 mots entre eux), et peu importe quel mot est venu en premier. C'est potentiellement beaucoup plus utile.

Le moteur de recherche n'est pas cohérent concernant ces utilisations inattendues de AND. Il n'a pas été conçu pour de telles utilisations, et parfois il échoue dans la recherche. Vous pouvez obtenir zéro résultat, vous pouvez obtenir un message d'erreur mentionnant une erreur de syntaxe et vous pouvez obtenir des résultats qui n'ont pas le nombre de mots souhaité. Ignorez ces problèmes. Modifiez simplement l'option de recherche de booléen à expression exacte ou vice versa, puis réessayez. Si cela ne fonctionne pas, revenez en arrière. Heureusement, w/4 (en utilisant le numéro de votre choix) obtiendra le même résultat ou un meilleur.

La page Web sur laquelle vous vous trouvez fait partie d'une série de pages Web sur le site du journal Fulton History. Il est écrit pour vous aider à faire des recherches plus productives.


Contenu

Chronologie (liste complète)
Année Moteur Statut actuel
1993 Catalogue W3 actif
Aliweb actif
JumpStation Inactif
WWW Ver Inactif
1994 WebCrawler actif
Go.com Inactif, redirige vers Disney
Lycos actif
Recherche d'informations Inactif, redirige vers Disney
1995 Yahoo! Chercher Active, initialement une fonction de recherche pour Yahoo! Annuaire
Daum actif
Magellan Inactif
Exciter actif
SAPO actif
MetaCrawler actif
AltaVista Inactif, acquis par Yahoo! en 2003, depuis 2013 redirige vers Yahoo!
1996 RangDex Inactif, incorporé à Baidu en 2000
Dogpile Actif, Agrégateur
Inktomi Inactif, acquis par Yahoo!
HotBot actif
Demandez à Jeeves Actif (renommé ask.com)
1997 AOL NetFind Actif (rebaptisé AOL Search depuis 1999)
Aurores boréales Inactif
Yandex actif
1998 Google actif
Ixquick Actif en tant que Startpage.com
Recherche MSN Actif en tant que Bing
empas Inactif (fusionné avec NATE)
1999 ToutleWeb Inactif (URL redirigée vers Yahoo!)
GenieKnows Yellowee actif et renommé (redirection vers justlocalbusiness.com)
Naver actif
Teoma Actif (© APN, LLC)
2000 Baidu actif
Exalead Inactif
Gigablast actif
2001 Kartoo Inactif
2003 Info.com actif
Scroogle Inactif
2004 A9.com Inactif
Cloutier Actif (en tant que Yippy)
Mojeek actif
Sogou actif
2005 Cherche moi Inactif
KidzSearch Actif, Recherche Google
2006 Comme ci comme ça Inactif, fusionné avec Sogou
Quaero Inactif
Search.com actif
ChaCha Inactif
Ask.com actif
Recherche en direct Actif en tant que Bing, renommé MSN Search
2007 recherche wiki Inactif
Sproose Inactif
Recherche Wikia Inactif
Blackle.com Actif, Recherche Google
2008 Ensemble de puissance Inactif (redirection vers Bing)
Picolator Inactif
Viewzi Inactif
Boogami Inactif
SautPoisson Inactif
Forestle Inactif (redirection vers Ecosia)
CanardCanardAller actif
2009 Bing Recherche en direct active et renommée
Yebol Inactif
Mugurdy Inactif faute de financement
Scout (Gobie) actif
NATE actif
Ecosia actif
Startpage.com Moteur actif, soeur d'Ixquick
2010 Blekko Inactif, vendu à IBM
Cuil Inactif
Yandex (anglais) actif
Parsijoo actif
2011 YaCy Actif, P2P
2012 Volunia Inactif
2013 Qwant actif
2014 Égérin Actif, Kurde / Sorani
vaches suisses actif
Searx actif
2015 Yooz actif
Cliqz Inactif
2016 Kiddle Actif, Recherche Google

Avant les années 1990 Modifier

Un système de localisation d'informations publiées destiné à surmonter la difficulté toujours croissante de localiser des informations dans des index centralisés de plus en plus nombreux de travaux scientifiques a été décrit en 1945 par Vannevar Bush, qui a écrit un article dans The Atlantic Monthly intitulé "As We May Think" [1 ] dans laquelle il envisageait des bibliothèques de recherche avec des annotations connectées un peu comme les hyperliens modernes. [2] L'analyse des liens deviendrait finalement une composante cruciale des moteurs de recherche grâce à des algorithmes tels que Hyper Search et PageRank. [3] [4]

Années 90 : Naissance des moteurs de recherche Modifier

Les premiers moteurs de recherche sur Internet sont antérieurs aux débuts du Web en décembre 1990 : la recherche qui est l'utilisateur remonte à 1982, [5] et la recherche d'utilisateurs multi-réseau Knowbot Information Service a été mise en œuvre pour la première fois en 1989. [6] Le premier moteur de recherche bien documenté Le moteur de recherche qui recherchait les fichiers de contenu, à savoir les fichiers FTP, était Archie, qui a fait ses débuts le 10 septembre 1990. [7]

Avant septembre 1993, le World Wide Web était entièrement indexé à la main. Il y avait une liste de serveurs Web éditée par Tim Berners-Lee et hébergée sur le serveur Web du CERN. Il reste un instantané de la liste en 1992 [8], mais comme de plus en plus de serveurs Web étaient en ligne, la liste centrale ne pouvait plus suivre. Sur le site de la NCSA, de nouveaux serveurs ont été annoncés sous le titre « Quoi de neuf ! [9]

Le premier outil utilisé pour rechercher du contenu (par opposition aux utilisateurs) sur Internet était Archie. [10] Le nom signifie "archive" sans le "v"., [11] Il a été créé par Alan Emtage [11] [12] [13] [14] étudiant en informatique à l'Université McGill à Montréal, Québec, Canada . Le programme a téléchargé les listes de répertoires de tous les fichiers situés sur des sites FTP (File Transfer Protocol) anonymes publics, créant une base de données consultable de noms de fichiers. Cependant, le moteur de recherche Archie n'a pas indexé le contenu de ces sites car la quantité de données était si limitée. il pourrait être facilement recherché manuellement.

L'essor de Gopher (créé en 1991 par Mark McCahill à l'Université du Minnesota) a conduit à deux nouveaux programmes de recherche, Veronica et Jughead. Comme Archie, ils ont recherché les noms de fichiers et les titres stockés dans les systèmes d'indexation Gopher. Véronique (Very Easy Rodent-Omenti Net-wide jeindex à Cinformatisé UNErchives) a fourni une recherche par mot-clé de la plupart des titres de menu Gopher dans l'ensemble des listes de Gopher. Jughead (Jonzy Uuniversel gopher Hhiérarchie Efouille UNEsd isplay) était un outil permettant d'obtenir des informations de menu à partir de serveurs Gopher spécifiques. Alors que le nom du moteur de recherche « Archie Search Engine » ne faisait pas référence à la série de bandes dessinées Archie, « Veronica » et « Jughead » sont des personnages de la série, faisant ainsi référence à leur prédécesseur.

À l'été 1993, aucun moteur de recherche n'existait pour le Web, bien que de nombreux catalogues spécialisés aient été maintenus à la main. Oscar Nierstrasz de l'Université de Genève a écrit une série de scripts Perl qui reflétaient périodiquement ces pages et les réécrivaient dans un format standard. Cela a constitué la base de W3Catalog, le premier moteur de recherche primitif du Web, publié le 2 septembre 1993. [15]

En juin 1993, Matthew Gray, alors au MIT, a produit ce qui était probablement le premier robot Web, le World Wide Web Wanderer basé sur Perl, et l'a utilisé pour générer un index appelé "Wandex". Le but du Wanderer était de mesurer la taille du World Wide Web, ce qu'il a fait jusqu'à la fin de 1995. Le deuxième moteur de recherche du Web, Aliweb, est apparu en novembre 1993. Aliweb n'a pas utilisé de robot Web, mais dépendait plutôt d'une notification par site Web. administrateurs de l'existence sur chaque site d'un fichier d'index dans un format particulier.

JumpStation (créé en décembre 1993 [16] par Jonathon Fletcher) utilisait un robot Web pour trouver des pages Web et créer son index, et utilisait un formulaire Web comme interface avec son programme de requête. C'était donc le premier outil de découverte de ressources WWW à combiner les trois fonctionnalités essentielles d'un moteur de recherche Web (exploration, indexation et recherche) décrites ci-dessous. En raison des ressources limitées disponibles sur la plate-forme sur laquelle il fonctionnait, son indexation et donc sa recherche étaient limitées aux titres et rubriques trouvés dans les pages Web rencontrées par le robot.

L'un des premiers moteurs de recherche basés sur des robots d'exploration "tout texte" était WebCrawler, sorti en 1994. Contrairement à ses prédécesseurs, il permettait aux utilisateurs de rechercher n'importe quel mot dans n'importe quelle page Web, ce qui est devenu la norme pour tous les principaux moteurs de recherche depuis. C'était aussi le moteur de recherche qui était largement connu du public. Toujours en 1994, Lycos (qui a débuté à l'Université Carnegie Mellon) a été lancé et est devenu une entreprise commerciale majeure.

Le premier moteur de recherche populaire sur le Web était Yahoo! Chercher. [17] Le premier produit de Yahoo!, fondé par Jerry Yang et David Filo en janvier 1994, était un annuaire Web appelé Yahoo! Annuaire. En 1995, une fonction de recherche a été ajoutée, permettant aux utilisateurs de rechercher Yahoo! Annuaire! [18] [19] C'est devenu l'un des moyens les plus populaires pour les gens de trouver des pages Web d'intérêt, mais sa fonction de recherche fonctionnait sur son répertoire Web, plutôt que sur ses copies en texte intégral de pages Web.

Peu de temps après, un certain nombre de moteurs de recherche sont apparus et se disputaient la popularité.Ceux-ci comprenaient Magellan, Excite, Infoseek, Inktomi, Northern Light et AltaVista. Les chercheurs d'informations pourraient également parcourir le répertoire au lieu de faire une recherche par mot-clé.

En 1996, Robin Li a développé l'algorithme de notation de site RankDex pour le classement des pages de résultats des moteurs de recherche [20] [21] [22] et a reçu un brevet américain pour la technologie. [23] C'était le premier moteur de recherche qui utilisait des hyperliens pour mesurer la qualité des sites Web qu'il indexait, [24] avant le brevet d'algorithme très similaire déposé par Google deux ans plus tard en 1998. [25] Larry Page a fait référence au travail de Li dans certains de ses brevets américains pour le PageRank. [26] Li a ensuite utilisé sa technologie Rankdex pour le moteur de recherche Baidu, fondé par Robin Li en Chine et lancé en 2000.

En 1996, Netscape cherchait à offrir à un seul moteur de recherche un accord exclusif en tant que moteur de recherche vedette sur le navigateur Web de Netscape. Il y avait tellement d'intérêt qu'à la place Netscape a conclu des accords avec cinq des principaux moteurs de recherche : pour 5 millions de dollars par an, chaque moteur de recherche serait en rotation sur la page du moteur de recherche Netscape. Les cinq moteurs étaient Yahoo!, Magellan, Lycos, Infoseek et Excite. [27] [28]

Google a adopté l'idée de vendre des termes de recherche en 1998, d'une petite société de moteurs de recherche nommée goto.com. Cette décision a eu un effet significatif sur l'activité SE, qui est passée de la difficulté à l'une des activités les plus rentables d'Internet. [29]

Les moteurs de recherche étaient également connus comme certaines des étoiles les plus brillantes de la frénésie d'investissement sur Internet qui s'est produite à la fin des années 1990. [30] Plusieurs sociétés sont entrées sur le marché de façon spectaculaire, en obtenant des gains records lors de leurs introductions en bourse. Certains ont supprimé leur moteur de recherche public et commercialisent des éditions réservées aux entreprises, telles que Northern Light. De nombreuses sociétés de moteurs de recherche ont été prises dans la bulle Internet, un boom du marché fondé sur la spéculation qui a culminé en 1990 et s'est terminé en 2000.

Années 2000 à nos jours : bulle post-dot-com Modifier

Vers 2000, le moteur de recherche de Google a pris de l'importance. [31] La société a obtenu de meilleurs résultats pour de nombreuses recherches avec un algorithme appelé PageRank, comme cela a été expliqué dans l'article Anatomie d'un moteur de recherche écrit par Sergey Brin et Larry Page, les derniers fondateurs de Google. [4] Cet algorithme itératif classe les pages Web en fonction du nombre et du PageRank d'autres sites Web et pages qui y sont liées, en partant du principe que les pages bonnes ou souhaitables sont liées à plus que d'autres. Le brevet de Larry Page pour le PageRank cite le brevet RankDex antérieur de Robin Li comme une influence. [26] Google a également maintenu une interface minimaliste avec son moteur de recherche. En revanche, bon nombre de ses concurrents ont intégré un moteur de recherche dans un portail Web. En fait, le moteur de recherche Google est devenu si populaire que des moteurs d'usurpation ont émergé tels que Mystery Seeker.

En 2000, Yahoo! fournissait des services de recherche basés sur le moteur de recherche d'Inktomi. Yahoo! a acquis Inktomi en 2002, et Overture (qui possédait AlltheWeb et AltaVista) en 2003. Yahoo! est passé au moteur de recherche de Google jusqu'en 2004, date à laquelle il a lancé son propre moteur de recherche basé sur les technologies combinées de ses acquisitions.

Microsoft a lancé MSN Search pour la première fois à l'automne 1998 en utilisant les résultats de recherche d'Inktomi. Au début de 1999, le site a commencé à afficher les listes de Looksmart, mélangées aux résultats d'Inktomi. Pendant une courte période en 1999, MSN Search a plutôt utilisé les résultats d'AltaVista. En 2004, Microsoft a entamé une transition vers sa propre technologie de recherche, alimentée par son propre robot d'exploration Web (appelé msnbot).

Le moteur de recherche renommé de Microsoft, Bing, a été lancé le 1er juin 2009. Le 29 juillet 2009, Yahoo! et Microsoft ont finalisé un accord dans lequel Yahoo! La recherche serait alimentée par la technologie Microsoft Bing.

Depuis 2019, les robots d'exploration actifs des moteurs de recherche incluent ceux de Google, Sogou, Baidu, Bing, Gigablast, Mojeek, DuckDuckGo et Yandex.

Un moteur de recherche maintient les processus suivants en temps quasi réel :

Les moteurs de recherche Web obtiennent leurs informations en explorant le Web d'un site à l'autre. L'"araignée" vérifie le nom de fichier standard robots.txt, qui lui est adressé. Le fichier robots.txt contient des directives pour les robots de recherche, lui indiquant quelles pages explorer et quelles pages ne pas explorer. Après avoir vérifié le fichier robots.txt et l'avoir trouvé ou non, l'araignée renvoie certaines informations à indexer en fonction de nombreux facteurs, tels que les titres, le contenu de la page, JavaScript, les feuilles de style en cascade (CSS), les en-têtes ou ses métadonnées dans Balises méta HTML. Après un certain nombre de pages explorées, une quantité de données indexées ou du temps passé sur le site Web, l'araignée arrête d'explorer et passe à autre chose. "[A]ucun robot d'exploration Web ne peut réellement explorer l'ensemble du Web accessible. En raison des sites Web infinis, des pièges à araignées, du spam et d'autres exigences du vrai Web, les robots d'exploration appliquent plutôt une politique d'exploration pour déterminer quand l'exploration d'un site doit être considérée suffisant. Certains sites Web sont explorés de manière exhaustive, tandis que d'autres ne le sont que partiellement". [33]

L'indexation consiste à associer des mots et d'autres jetons définissables trouvés sur des pages Web à leurs noms de domaine et à des champs HTML. Les associations sont faites dans une base de données publique, mise à disposition pour les requêtes de recherche sur le Web. Une requête d'un utilisateur peut être un seul mot, plusieurs mots ou une phrase. L'index permet de retrouver le plus rapidement possible les informations relatives à la requête. [32] Certaines des techniques d'indexation et de mise en cache sont des secrets commerciaux, alors que l'exploration du Web est un processus simple consistant à visiter tous les sites de manière systématique.

Entre les visites du araignée, la version mise en cache de la page (une partie ou la totalité du contenu nécessaire pour la rendre) stockée dans la mémoire de travail du moteur de recherche est rapidement envoyée à un demandeur. Si une visite est en retard, le moteur de recherche peut simplement agir comme un proxy Web à la place. Dans ce cas, la page peut différer des termes de recherche indexés. [32] La page mise en cache conserve l'apparence de la version dont les mots ont été précédemment indexés, de sorte qu'une version mise en cache d'une page peut être utile au site Web lorsque la page réelle a été perdue, mais ce problème est également considéré comme une forme légère de lienrot.

Généralement, lorsqu'un utilisateur saisit une requête dans un moteur de recherche, il s'agit de quelques mots-clés. [34] L'index a déjà les noms des sites contenant les mots-clés, et ceux-ci sont instantanément obtenus à partir de l'index. La véritable charge de traitement réside dans la génération des pages Web qui constituent la liste des résultats de la recherche : chaque page de la liste entière doit être pondérée en fonction des informations contenues dans les index. [32] Ensuite, l'élément de résultat de recherche supérieur nécessite la recherche, la reconstruction et le balisage du extraits montrant le contexte des mots-clés mis en correspondance. Ce ne sont qu'une partie du traitement requis par chaque page Web de résultats de recherche, et les autres pages (à côté du haut) nécessitent plus de ce post-traitement.

Au-delà des simples recherches de mots clés, les moteurs de recherche proposent leurs propres opérateurs et paramètres de recherche basés sur l'interface graphique ou les commandes pour affiner les résultats de la recherche. Ceux-ci fournissent les contrôles nécessaires pour l'utilisateur engagé dans la boucle de rétroaction que les utilisateurs créent en filtration et pondération tout en affinant les résultats de la recherche, compte tenu des premières pages des premiers résultats de recherche. Par exemple, depuis 2007, le moteur de recherche Google.com permet de filtre par date en cliquant sur « Afficher les outils de recherche » dans la colonne la plus à gauche de la page de résultats de recherche initiale, puis en sélectionnant la plage de dates souhaitée. [35] Il est également possible de poids par date car chaque page a une heure de modification. La plupart des moteurs de recherche prennent en charge l'utilisation des opérateurs booléens AND, OR et NOT pour aider les utilisateurs finaux à affiner la requête de recherche. Les opérateurs booléens sont destinés aux recherches littérales qui permettent à l'utilisateur d'affiner et d'étendre les termes de la recherche. Le moteur recherche les mots ou les phrases exactement tels qu'ils ont été saisis. Certains moteurs de recherche proposent une fonctionnalité avancée appelée recherche de proximité, qui permet aux utilisateurs de définir la distance entre les mots-clés. [32] Il existe également une recherche basée sur des concepts où la recherche implique l'utilisation d'une analyse statistique sur des pages contenant les mots ou les expressions que vous recherchez.

L'utilité d'un moteur de recherche dépend de la pertinence des ensemble de résultats ça redonne. Bien qu'il puisse y avoir des millions de pages Web qui incluent un mot ou une phrase en particulier, certaines pages peuvent être plus pertinentes, populaires ou faisant autorité que d'autres. La plupart des moteurs de recherche utilisent des méthodes pour classer les résultats afin de fournir les « meilleurs » résultats en premier. La façon dont un moteur de recherche décide quelles pages correspondent le mieux et dans quel ordre les résultats doivent être affichés varie considérablement d'un moteur à l'autre. [32] Les méthodes changent également au fil du temps à mesure que l'utilisation d'Internet change et que de nouvelles techniques évoluent. Il existe deux principaux types de moteurs de recherche qui ont évolué : l'un est un système de mots-clés prédéfinis et hiérarchisés que les humains ont programmés intensivement. L'autre est un système qui génère un « index inversé » en analysant les textes qu'il localise. Cette première forme repose beaucoup plus sur l'ordinateur lui-même pour faire le gros du travail.

La plupart des moteurs de recherche Web sont des entreprises commerciales soutenues par des revenus publicitaires et, par conséquent, certains d'entre eux permettent aux annonceurs de voir leurs annonces mieux classées dans les résultats de recherche moyennant des frais. Les moteurs de recherche qui n'acceptent pas d'argent pour leurs résultats de recherche gagnent de l'argent en diffusant des annonces liées à la recherche à côté des résultats habituels des moteurs de recherche. Les moteurs de recherche gagnent de l'argent à chaque fois que quelqu'un clique sur l'une de ces annonces. [36]

Recherche locale Modifier

La recherche locale est le processus qui optimise les efforts des entreprises locales. Ils se concentrent sur le changement pour s'assurer que toutes les recherches sont cohérentes. C'est important parce que de nombreuses personnes déterminent où elles prévoient d'aller et quoi acheter en fonction de leurs recherches. [37]

En mai 2021 [mise à jour] , [38] Google est le moteur de recherche le plus utilisé au monde, avec une part de marché de 92,18%, et les autres moteurs de recherche les plus utilisés au monde étaient :

| Google-1,18 milliard d'utilisateurs | Bing-101,5 millions d'utilisateurs | Yahoo!-65,6 millions d'utilisateurs | Badui-63,7 millions d'utilisateurs | Yandex-18,2 millions d'utilisateurs | DuckDuckGo-15 millions d'utilisateurs

Russie et Asie de l'Est Modifier

En Russie, Yandex détient une part de marché de 61,9%, contre 28,3% pour Google. [39] En Chine, Baidu est le moteur de recherche le plus populaire. [40] Le portail de recherche local de la Corée du Sud, Naver, est utilisé pour 70 % des recherches en ligne dans le pays. [41] Yahoo! Le Japon et Yahoo! Taïwan sont les avenues les plus populaires pour les recherches sur Internet au Japon et à Taïwan, respectivement. [42] La Chine est l'un des rares pays où Google ne figure pas parmi les trois principaux moteurs de recherche Web pour la part de marché. Google était auparavant l'un des principaux moteurs de recherche en Chine, mais a dû se retirer après avoir omis de respecter les lois chinoises. [43]

Europe Modifier

Les marchés de la plupart des pays de l'Union européenne sont dominés par Google, à l'exception de la République tchèque, où Seznam est un concurrent sérieux. [44]

Bien que les moteurs de recherche soient programmés pour classer les sites Web en fonction d'une combinaison de leur popularité et de leur pertinence, des études empiriques indiquent divers biais politiques, économiques et sociaux dans les informations qu'ils fournissent [45] [46] et les hypothèses sous-jacentes concernant la technologie. [47] Ces biais peuvent être le résultat direct de processus économiques et commerciaux (par exemple, les entreprises qui font de la publicité avec un moteur de recherche peuvent également devenir plus populaires dans ses résultats de recherche organiques) et de processus politiques (par exemple, la suppression des résultats de recherche pour se conformer avec les lois locales). [48] ​​Par exemple, Google ne fera pas apparaître certains sites Web néo-nazis en France et en Allemagne, où la négation de l'Holocauste est illégale.

Les biais peuvent également être le résultat de processus sociaux, car les algorithmes des moteurs de recherche sont fréquemment conçus pour exclure les points de vue non normatifs en faveur de résultats plus « populaires ». [49] Les algorithmes d'indexation des principaux moteurs de recherche privilégient la couverture des sites basés aux États-Unis, plutôt que les sites Web de pays non américains. [46]

Google Bombing est un exemple de tentative de manipulation des résultats de recherche pour des raisons politiques, sociales ou commerciales.

Plusieurs chercheurs ont étudié les changements culturels déclenchés par les moteurs de recherche, [50] et la représentation de certains sujets controversés dans leurs résultats, comme le terrorisme en Irlande, [51] le déni du changement climatique, [52] et les théories du complot. [53]

De nombreux moteurs de recherche tels que Google et Bing fournissent des résultats personnalisés en fonction de l'historique des activités de l'utilisateur. Cela conduit à un effet qui a été appelé une bulle de filtre. Le terme décrit un phénomène dans lequel les sites Web utilisent des algorithmes pour deviner de manière sélective les informations qu'un utilisateur aimerait voir, en fonction des informations sur l'utilisateur (telles que l'emplacement, le comportement des clics passés et l'historique de recherche). En conséquence, les sites Web ont tendance à afficher uniquement des informations qui correspondent au point de vue passé de l'utilisateur. Cela met l'utilisateur dans un état d'isolement intellectuel sans information contraire. Les principaux exemples sont les résultats de recherche personnalisés de Google et le flux d'actualités personnalisé de Facebook. Selon Eli Pariser, qui a inventé le terme, les utilisateurs sont moins exposés à des points de vue contradictoires et sont isolés intellectuellement dans leur propre bulle d'information. Pariser a rapporté un exemple dans lequel un utilisateur a recherché "BP" sur Google et a obtenu des informations sur les investissements concernant British Petroleum tandis qu'un autre chercheur a obtenu des informations sur la marée noire de Deepwater Horizon et que les deux pages de résultats de recherche étaient "très différentes". [54] [55] [56] L'effet de bulle peut avoir des implications négatives pour le discours civique, selon Pariser. [57] Depuis que ce problème a été identifié, des moteurs de recherche concurrents ont émergé qui cherchent à éviter ce problème en ne suivant pas ou en ne « bouillonnant » pas les utilisateurs, tels que DuckDuckGo. D'autres chercheurs ne partagent pas le point de vue de Pariser, trouvant les preuves à l'appui de sa thèse peu convaincantes. [58]

La croissance mondiale d'Internet et des médias électroniques dans le monde arabe et musulman au cours de la dernière décennie a encouragé les adeptes islamiques du Moyen-Orient et du sous-continent asiatique à essayer leurs propres moteurs de recherche, leurs propres portails de recherche filtrés qui permettraient aux utilisateurs de effectuer des recherches en toute sécurité. Plus que d'habitude recherche sécurisée filtres, ces portails Web islamiques classant les sites Web en « halal » ou « haram », sur la base de l'interprétation de la « loi de l'Islam ». ImHalal a été mis en ligne en septembre 2011. Halalgoogling a été mis en ligne en juillet 2013. Ceux-ci utilisent des filtres haram sur les collections de Google et Bing (et autres). [59]

Alors que le manque d'investissement et la lenteur des technologies dans le monde musulman ont entravé les progrès et contrecarré le succès d'un moteur de recherche islamique, ciblant comme principaux consommateurs les adhérents islamiques, des projets comme Muxlim, un site de style de vie musulman, ont reçu des millions de dollars d'investisseurs comme Rite Internet Ventures, et il a également faibli. D'autres moteurs de recherche axés sur la religion sont Jewogle, la version juive de Google, [60] et SeekFind.org, qui est chrétien. SeekFind filtre les sites qui attaquent ou dégradent leur foi. [61]

La soumission de moteur de recherche Web est un processus dans lequel un webmaster soumet un site Web directement à un moteur de recherche. Bien que la soumission aux moteurs de recherche soit parfois présentée comme un moyen de promouvoir un site Web, elle n'est généralement pas nécessaire car les principaux moteurs de recherche utilisent des robots d'indexation qui finiront par trouver la plupart des sites Web sur Internet sans assistance. Ils peuvent soit soumettre une page Web à la fois, soit soumettre l'intégralité du site à l'aide d'un plan du site, mais il n'est normalement nécessaire de soumettre que la page d'accueil d'un site Web, car les moteurs de recherche sont capables d'explorer un site Web bien conçu. Il reste deux raisons de soumettre un site Web ou une page Web à un moteur de recherche : ajouter un site Web entièrement nouveau sans attendre qu'un moteur de recherche le découvre, et mettre à jour l'enregistrement d'un site Web après une refonte substantielle.

Certains logiciels de soumission de moteurs de recherche soumettent non seulement des sites Web à plusieurs moteurs de recherche, mais ajoutent également des liens vers des sites Web à partir de leurs propres pages. Cela peut sembler utile pour augmenter le classement d'un site Web, car les liens externes sont l'un des facteurs les plus importants pour déterminer le classement d'un site Web. Cependant, John Mueller de Google a déclaré que cela "peut conduire à un nombre énorme de liens non naturels pour votre site" avec un impact négatif sur le classement du site. [62]


Chronologie du moteur de recherche

1990– Le premier moteur de recherche est Archie. Un an après avoir inventé le World Wide Web (WWW), le premier moteur de recherche a parcouru un index de fichiers téléchargeables. Cependant, les données limitées n'ont rendu disponibles que les listes, pas le contenu.

1991– Tim Berners-Lee, l'inventeur du WWW, a créé une bibliothèque virtuelle pour aider les utilisateurs à trouver les URL de différents sites Web. Les serveurs Web du CERN ont hébergé la bibliothèque au début d'Internet.

1993– JumpStation a fait un nouveau bond en avant avec sa recherche linéaire qui montrait le titre et l'en-tête d'une page dans les mêmes résultats. Le moteur de recherche classe les résultats dans l'ordre où ils ont été trouvés.

1994– David Filo et Jerry Yang créent Yahoo! Chercher. Le site a été la première collection de pages Web sur Internet. Ils incluent des descriptions artificielles pour les URL. Les propriétaires de sites peuvent ajouter des sites d'information gratuitement, mais les sites commerciaux devaient payer 300 $/an.

WebCrawler– la même année que Yahoo! Lancement de la recherche, lancement de Web Crawler. Ils créent le premier moteur de recherche à indexer des pages entières. La quantité de données nécessaires pour faire le moteur de recherche est trop lente à utiliser pendant la journée.

1995Le moteur de recherche Lycos a également été lancé en 1994. Le moteur de recherche a catalogué plus de 394 000 documents en août. En janvier 1995, ils avaient répertorié plus de 1,5 million de documents.

1996- Larry Page et Sergey Brin ont créé le prédécesseur de Google BackRub. L'idée initiale utilisait des backlinks pour aider à classer les sites Web pour une meilleure recherche.

Les backlinks vous montrent comment un site Web qui renvoie vers un autre site compte comme un vote. Cette idée est la base de l'autorité d'un site Web. L'algorithme d'aujourd'hui repose toujours sur le même concept initial. Il a énormément progressé au cours des 20 dernières années, mais le backlinking joue toujours un rôle dans le classement.

DemandezJeeves– Le premier moteur de recherche où ils tentent de faire répondre aux requêtes par des éditeurs humains. Le site est devenu une proie facile pour le spam.

Inktomi– Un pionnier du modèle de publicité payante. Inktomi a été un précurseur des publicités au paiement par clic (PPC).

Lycos– Toujours le plus grand moteur de recherche. Lycos compte désormais plus de 60 millions de documents indexés.

1998– Lancement officiel de Google.

Ouverture (anciennement Goto.com)– La société a été la première à utiliser un modèle PPC avec succès.

1999– Sequoia Capital et d'autres investissent dans Google. En outre, AOL sélectionne Google comme partenaire de recherche.

2000– Le moteur Teoma est sorti

2001- Le moteur de recherche Excite fait faillite et est racheté pour 10 millions de dollars.

DemandezJeeves– Le moteur de recherche achète Teoma pour remplacer son moteur de recherche Direct.

2002- Yahoo! acquiert d'autres moteurs de recherche pour trouver des résultats de recherche pour les clients de manière organique.Auparavant, ils sous-traitaient le service à des fournisseurs tiers.

2003- Overture racheté par AllTheWeb pour 70 millions de dollars et Inktomi racheté par Yahoo! pour 235 millions de dollars. Yahoo! rachète ensuite Overture pour 1,63 milliard de dollars.

Google– Ils annoncent la première mise à jour de l'algorithme de recherche au SES Boston de Northeastern, c'est pourquoi on l'appelle la mise à jour "Boston".

2004- Microsoft lance son nouveau moteur de recherche MSN.

2005- Le moteur de recherche MSN de Microsoft commence à utiliser sa technologie interne en faveur de Yahoo! résultats.

Interroger– IAC (Ticketmaster.com et Match.com) achète Ask Jeeves pour 1,85 milliard de dollars. Ils changent le nom en Ask.com et abandonnent la plateforme de recherche Teoma.

Pas de suivi– Les principaux moteurs de recherche utilisent la balise « nofollow » pour nettoyer les blogs contenant du spam.

2007- Google a créé la « recherche universelle ». Au lieu des 10 listes traditionnelles, ils ont ajouté des fonctionnalités pour les actualités, la vidéo, les images, le local et d'autres secteurs verticaux.

2008- Le lancement "Google Suggest" fournit des listes déroulantes de sujets suggérés.

2009- MSN/Live Search devient Bing.

2010- Google a amélioré son système d'indexation Web pour améliorer de 50 % les nouveaux résultats de recherche. Ils appellent la mise à jour Caféine.

Google Instant affiche les résultats de recherche en temps réel pour les utilisateurs lorsqu'ils saisissent une requête.

2011- Pour créer un Internet plus structuré, Google, Yahoo! et Microsoft (Bing) créent Schema.org.

Google– Le moteur de recherche lance le premier changement d'algorithme significatif pour améliorer les résultats des requêtes. L'algorithme de Google Panda réduit l'efficacité des fermes de contenu et des sites de grattage. Le changement affecte 12% de tous les résultats de recherche aux États-Unis.

2012- Après la sortie de Panda, Google a lancé la mise à jour de l'algorithme Google Penguin. Cette mise à jour pénalise les sites achetant des liens ou utilisant des réseaux de liens pour améliorer leur classement dans les recherches.

2013- Google révolutionne à nouveau son algorithme de recherche avec sa mise à jour Hummingbird. L'algorithme est la première tentative d'un moteur de recherche pour comprendre l'intention humaine derrière une requête de recherche. L'histoire de la recherche jusque-là se concentrait sur la façon d'améliorer les requêtes linguistiques.

2014- Yahoo! devient le moteur de recherche par défaut de Mozilla Firefox aux États-Unis.

Google– L'algorithme Pigeon met à jour les résultats de recherche locaux des moteurs de recherche. Ils souhaitent fournir aux utilisateurs des résultats de recherche locaux précis et pertinents.

Google– explique comment la sécurité des sites Web est désormais un facteur de classement avec leur HTTPS partout campagne.

2015- Google libère Mobilegeddon pour forcer les sites Web à ajouter des sites Web adaptés aux mobiles. Le changement reconnaît l'augmentation rapide de l'utilisation de la recherche mobile.

De plus, Google lance RankBrain, un programme d'apprentissage automatique qui automatise l'algorithme de classement.

Bing– En copiant Google, ils ajoutent un algorithme adapté aux mobiles.

2016- Google Possum attaque les sites de spam locaux tout comme la balise « nofollow » une décennie plus tôt a supprimé les sites Web contenant du spam.

Google a également intégré la mise à jour Google Penguin dans l'algorithme de classement de base pour assurer la mort des fermes de liens

2017- Google a pénalisé les sites utilisant des publicités interstitielles et pop-up qui détruisent l'expérience mobile.

De plus, la mise à jour "Fred" de Google pénalise les sites avec des backlinks de mauvaise qualité ainsi que ceux qui accordent de l'importance à l'argent plutôt qu'à l'expérience utilisateur.


Rechercher sur le site - Historique

Recherchez plus de 17 millions d'enregistrements d'objets de musée, d'archives et de documents de bibliothèque, y compris plus de 6,3 millions d'images, d'audio et de vidéos en ligne et de billets de blog.

Faits saillants de la recherche

Collections sélectionnées liées aux arts et au design

  • Art Africain
  • Art américain
  • Art d'Asie
  • Art contemporain
  • Artistes
  • Céramique et Poterie
  • Dessins
  • Bijoux et accessoires de costumes
  • Masques
  • Peintures
  • Tampon de la Poste
  • Sculptures

Collections sélectionnées liées à l'histoire et à la culture

  • Photographies assorties
  • Communauté et culture afro-américaines
  • Histoire de l'air et de l'espace
  • Culture asiatique
  • Journaux et carnets de terrain
  • Communauté et culture latinos
  • Lettres et correspondance
  • Musique et musiciens
  • Histoire et culture amérindiennes et autochtones
  • Histoire politique
  • Cartes postales
  • Jouets et jeux

Collections sélectionnées par Smithsonian Repositories

  • Musée et archives communautaires d'Anacostia
  • Archives d'art américain
  • Archives des jardins américains
  • Cooper Hewitt, Smithsonian Design Museum
  • Freer Gallery of Art & Arthur M. Sackler Gallery and Archives
  • Musée Hirshhorn et jardin de sculptures
  • Musée national de l'Air et de l'Espace et Centre d'archives
  • Musée national d'histoire et de culture afro-américaines
  • Musée national d'art africain & Archives photographiques Eliot Elisofon
  • Musée national d'histoire américaine et centre d'archives
  • Muséum national d'histoire naturelle
  • Musée national des Indiens d'Amérique

Découvrez ce qui est inclus dans chaque catégorie.

Art et conception

Vous trouverez ci-dessous les listes de nos meilleurs types d'enregistrement et noms dans notre Art et conception Catégorie.

Les types:
Noms:

Histoire & Culture

Vous trouverez ci-dessous les listes de nos meilleurs types d'enregistrement et des cultures dans notre Histoire & Culture Catégorie.

Les types:
Culture:

Science et technologie

Vous trouverez ci-dessous les listes de nos meilleurs types d'enregistrement, ordres et royaumes noms dans notre Science et technologie Catégorie.

Les types:
Ordre fiscal :
Royaume fiscal :

Qu'est-ce qui vous intéresse au Smithsonian ? Trouvez des objets dans les expositions maintenant. Par exemple : guerre civile, bouddhisme, masques africains ou Amelia Earhart.

Transcrivez-le !

Devenez un bénévole numérique et aidez à transcrire et à revoir certaines des nombreuses collections numérisées du Smithsonian, les rendant plus accessibles et consultables pour les chercheurs du monde entier. Parcourez les projets en cours ci-dessous.


Recherche d'antécédents criminels sur place

Lors de l'exécution d'une recherche d'emploi sur les antécédents criminels sur place, votre organisation peut déterminer si un candidat ou un employé a une condamnation pénale à signaler. Les casiers judiciaires des crimes et délits sont conservés dans les tribunaux supérieurs ou municipaux de comté. Après avoir déterminé quel comté (ou comtés) rechercher, un chercheur qualifié accédera aux dossiers spécifiés du tribunal de comté et effectuera une recherche en utilisant le nom et la date de naissance du demandeur ou de l'employé.

Si un cas à signaler est trouvé, un chercheur qualifié examinera le casier judiciaire pour l'assurance qualité afin de s'assurer qu'il est associé au demandeur et répond à tous les critères établis par le Fair Credit Reporting Act (FCRA) ainsi que les lois spécifiques à l'État. Après cet examen, le casier judiciaire sera signalé au client dans un rapport facile à lire. Le dossier comprendra le numéro de l'affaire, la date de dépôt, le type de crime (crime ou délit), ce dont ils ont été accusés, la date de la décision, la décision et les informations sur la peine. Les identifiants (tels que le nom complet, la date de naissance, etc.) trouvés dans le dossier sont également signalés pour démontrer que le dossier correspond au nom et à la date de naissance fournis par le demandeur.

En vertu de la FCRA, la période de déclaration des condamnations pénales est de sept ans à compter de la date de la condamnation ou de la sortie de prison. Les enregistrements de plus de sept ans ne sont pas à déclarer. Les enregistrements qui tombent au cours des sept dernières années sont à déclarer. Par exemple, un employeur cherche à pourvoir un poste en août 2017. Si un candidat a été reconnu coupable de vol qualifié en 1993, ce dossier serait en dehors de la période de déclaration car il date de plus de sept ans. Cependant, si le demandeur était condamné en 2015, cela tomberait dans la période de déclaration et le dossier serait signalé à l'employeur qui a demandé la perquisition.

Gardez à l'esprit qu'il existe plusieurs types de recherche d'antécédents criminels sur place :

  • Recherches d'index, qui utilisent les enregistrements de la base de données
  • Les fouilles manuelles, qui se produisent au tribunal en temps réel spécifié par le client

Une recherche d'index est une recherche dans une base de données spécifique à une juridiction, qui peut être utilisée pour trouver rapidement tous les enregistrements associés à un nom et une date de naissance. Les recherches dans l'index, cependant, ont tendance à donner accès à moins d'informations sur l'affaire - par exemple, une recherche dans l'index peut fournir le numéro de l'affaire, les accusations et la date de la décision d'un casier judiciaire. Souvent, il ne fournira pas d'informations sur la peine, comme la fin de la probation du condamné, qui sont généralement des informations précieuses lors de la prise d'une décision d'emploi.

Toutes les recherches d'index ne sont pas identiques, certains comtés offrent plus d'informations que d'autres, et tous les comtés ne disposent pas d'un index disponible. De nombreux comtés dans de nombreux États n'offrent pas de recherches par index, ce qui nécessite l'utilisation de recherches manuelles dans ces juridictions.

Les vérifications des antécédents d'index en ligne sont idéales pour un instantané rapide, mais elles ne sont pas aussi précises que les recherches manuelles. Par exemple, si un cas a été déposé très récemment, un chercheur pourrait « manquer » l'enregistrement si l'index n'a pas été mis à jour récemment pour inclure les informations sur le cas.

Les recherches manuelles restent le meilleur outil pour localiser des informations détaillées sur les affaires telles que les informations sur la peine, les violations de la probation, les amendes et les dédommagements ordonnés par le tribunal, les programmes de déjudiciarisation, etc. Les recherches manuelles sont plus longues et plus coûteuses car un chercheur du tribunal effectue physiquement la recherche à le tribunal selon vos instructions.


Contenu

Au début du développement du Web, il existait une liste de serveurs Web éditée par Tim Berners-Lee et hébergée sur le serveur Web du CERN. Il reste un instantané historique de 1992. [4] Il a également créé la World Wide Web Virtual Library, qui est le plus ancien répertoire Web. [5]

Portée de l'annonce Modifier

La plupart des annuaires ont une portée générale et répertorient des sites Web dans un large éventail de catégories, de régions et de langues. Mais certains annuaires de niche se concentrent sur des régions restreintes, des langues uniques ou des secteurs spécialisés. Un type d'annuaire de niche avec un grand nombre de sites existants est l'annuaire d'achats. Les annuaires commerciaux sont spécialisés dans le référencement des sites de commerce électronique de détail.

Yahoo! Directory (fermé fin 2014) et DMOZ (fermé le 14 mars 2017). DMOZ était important en raison de sa catégorisation étendue et de son grand nombre de listes et de sa disponibilité gratuite pour une utilisation par d'autres annuaires et moteurs de recherche. [6]

Cependant, un débat sur la qualité des annuaires et des bases de données continue toujours, car les moteurs de recherche utilisent le contenu d'ODP sans réelle intégration, et certains expérimentent le clustering.

Développement Modifier

Il y a eu de nombreuses tentatives pour faciliter la création de répertoires Web, comme l'utilisation de la soumission automatisée de liens connexes par script, ou de n'importe quel nombre de portails et de programmes PHP disponibles. Récemment, les techniques de logiciels sociaux ont engendré de nouveaux efforts de catégorisation, Amazon.com ajoutant des balises à ses pages de produits.

Les annuaires ont diverses caractéristiques dans leurs listes, souvent en fonction du prix payé pour l'inclusion :

  • Coût
    • Soumission gratuite - il n'y a pas de frais pour l'examen et l'inscription du site
    • Soumission payante - des frais uniques ou récurrents sont facturés pour l'examen/la liste du lien soumis
    • Lien réciproque - un lien vers le répertoire doit être ajouté quelque part sur le site soumis afin d'être répertorié dans le répertoire. Cette stratégie a perdu de sa popularité en raison de changements dans les algorithmes de référencement qui peuvent la rendre moins précieuse ou contre-productive. [7]
    • Aucun lien réciproque - un répertoire Web où vous soumettrez vos liens gratuitement et sans avoir besoin d'ajouter un lien vers votre site Web

    Un répertoire édité par l'homme est créé et maintenu par des éditeurs qui ajoutent des liens basés sur les politiques particulières à ce répertoire. Les annuaires édités par l'homme sont souvent ciblés par les référenceurs sur la base que les liens provenant de sources fiables amélioreront le classement dans les principaux moteurs de recherche. Certains annuaires peuvent empêcher les moteurs de recherche d'évaluer un lien affiché en utilisant des redirections, des attributs nofollow ou d'autres techniques. De nombreux répertoires édités par l'homme, y compris DMOZ, World Wide Web Virtual Library, Business.com et Jasmine Directory, sont édités par des bénévoles, qui sont souvent des experts dans des catégories particulières. Ces répertoires sont parfois critiqués en raison des longs délais d'approbation des soumissions, ou pour des structures organisationnelles rigides et des conflits entre les rédacteurs bénévoles.

    En réponse à ces critiques, certains annuaires édités par des volontaires ont adopté la technologie wiki, pour permettre une plus large participation de la communauté à l'édition de l'annuaire (au risque d'introduire des entrées de moindre qualité et moins objectives).

    Une autre direction prise par certains annuaires Web est le modèle d'inclusion payant. Cette méthode permet à l'annuaire d'offrir une inclusion en temps opportun pour les soumissions et généralement moins d'inscriptions en raison du modèle payant. Ils offrent souvent des options de référencement supplémentaires pour améliorer davantage les listes, y compris des listes de fonctionnalités et des liens supplémentaires vers les pages intérieures du site Web répertorié. Ces options sont généralement associées à des frais supplémentaires, mais offrent une aide et une visibilité importantes aux sites et/ou à leurs pages intérieures.

    Aujourd'hui, la soumission de sites Web à des annuaires Web est considérée comme une technique courante de référencement (optimisation pour les moteurs de recherche) pour obtenir des liens retour vers le site Web soumis. Une caractéristique distinctive de la « soumission d'annuaire » est qu'elle ne peut pas être entièrement automatisée comme les soumissions aux moteurs de recherche. La soumission manuelle d'annuaire est un travail fastidieux et chronophage et est souvent sous-traitée par les webmasters.

    Enchérir pour les répertoires de postes, également connus sous le nom d'annuaires Web d'enchères, sont des annuaires Web à inclusion payante dans lesquels les listes de sites Web dans l'annuaire sont classées en fonction de leur montant d'enchère. Ils sont spéciaux en ce sens que plus une personne paie, plus elle monte dans la liste des sites Web de l'annuaire. Avec une liste plus élevée, le site Web devient plus visible et augmente les chances que les visiteurs qui parcourent le répertoire cliquent sur la liste.


    Historique de navigation dans Firefox - Affichez les sites Web que vous avez visités

    Firefox garde une trace des sites Web que vous visitez lors de vos sessions de navigation. Pour afficher votre historique de navigation :

    1. Cliquez sur le bouton Bibliothèque dans la barre d'outils de Firefox.
    2. Cliquez sur Historique .
      • Le menu déroulant Historique comprend un Histoire récente liste.
    3. Clique le Afficher tout l'historiqueGérer l'historique en bas de cette liste pour ouvrir la fenêtre Bibliothèque.

    Dans la fenêtre Bibliothèque, vous pouvez rechercher un site Web particulier que vous avez visité en utilisant le champ Historique de recherche dans le coin supérieur droit.

    Double-cliquez sur un site Web pour l'ouvrir dans l'onglet actuel.
    Cliquez avec le bouton droit Maintenez la touche de contrôle enfoncée pendant que vous cliquez sur un site Web pour afficher d'autres actions, telles que l'ouverture dans un nouvel onglet, l'ouverture dans une fenêtre privée, la page de signet, la copie de l'URL, etc.

    Vous pouvez également trier tous les sites Web visités par nom, balise ou URL en cliquant sur les libellés des colonnes.

    Il est possible de supprimer des sites Web de votre historique de navigation ou d'effacer l'historique de navigation. Consultez ces articles pour en savoir plus :

    Ces braves gens ont aidé à écrire cet article :

    Bénévole

    Développez et partagez votre expertise avec les autres. Répondez aux questions et améliorez notre base de connaissances.


    Voir la vidéo: Google astuces, recherche avancée, fonctionnalités cachées