Tag Archive: Moteurs de recherches


Les failles de Google

Que ceux qui craignent que la grande “machine” prenne le pouvoir sur nos vies se rassurent, on est encore bien loin de Big Brother.
La World Wide Web Compagnie et consort est encore loin de prendre le contrôle de nos vies et de notre mode de pensée.

Son but, c’est d’abord s’adapter à nos modes de pensée, de faciliter ses services, de le rendre plus intuititifs, au plus près de nos préoccupations.

En somme, tant que cela reste un service et que tant que l’homme et son cerveau resteront le point de référence, il n’y pas de quoi s’inquiéter, on pourra toujours la débrancher et s’en servir quand on nous semble.

Mais voilà, on s’imagine souvent qu’Internet est la solution à tous nos problèmes. Un service tellement personnalisé que Google a même lancé son service de moteur de recherche personnel, (j’en ai déjà donné un exemple dans ce blog).

Parfois (ou Souvent) on est déçu par l’offre, par le service.
Surtout dans le cas de requête précise.
On ne peut pas lui poser la question à la manière de question pour un champion.
Je suis un film espagol qui traite de la question de la selection en entreprise

Simplifions l’exemple

Exemple: “film espagnol entreprise”
je cherche : un film espagnol sur le thème de l’entreprise
je cherche : une entreprise espagole qui fait des films
je cherche: un film sur une entreprise espagnole

On pourrait démultiplier l’exemple à l’infini ou au moins à l’égal du nombre de pages trouvés par le moteur de recherche. Les catalogues numérisés, bien moins séduisants il est vrai prennaient en compte ces éléments (et, ou, sauf, sans, thème auteur objet etc…)
en tentant de hiérarchiser un peu mieux l’information.

Il nous reste l’analyse contextuelle

Je donne un exemple: essayer de chercher la recherche de batterie pour votre ordinateur, vous avez la marque, le modèle mais vous avez perdu la référence exacte. essayez de le chercher sur un moteur de recherche: peine perdue! La quantité d’information fera de votre simple requête un exelmple vibrant de l’expression “chercher une aiguille dans une meule de foin”.

Pourquoi cet échec?

Google, moteur de recherche qui reste LA référence en matière d’accès à l’information sur le web, est incapable de hiérarchiser l’information.

Peu lui importe d’ailleurs, il se moque du contenu, sa politique, son aura tient moins à la pertinence de l’information qu’à son contenu qui génère de fructueuses recettes publicitaires…

Il lui manque un gros atout que nous humains nous avons de manière intuitive. Et c’est la VALEUR du mot et son CONTEXTE. La hiérarchie de l’information se base sur l’ordre que nous mettons dans nos pensées.

Google ou n’importe quel autre moteur de recherche, ne peut pour l’instant que prendre en compte les mots tel quels. Les mots que l’utilisateur donne dans sa requête définissent la solution mais pas sa compréhension contextuelle ou globale d’une question ou d’un problème qu’il resout sous l’angle de la popularité.

A cela deux solutions:
- donner du travail, aux linguistiques et sémioticiens
- insérer un langage un code capable de faire comprendre à la machine le langage naturel qui hiérarchise intuitivement l’information.
Les deux se complètent….

Le moteur de recherche reste un moteur. On ne peut pas lui poser une question à la manière de question pour un champion. Tout simplement parce que c’est les techniques de croisement des informations rendent la question du poids du mot invalide.

Ce que fait Google, (ou les autres moteurs de recherche mais je ne m’étendrais pas…) c’est de croiser des tables de données d’y injecter d’autres critères (peu ou mal connus) sur le type de site qui implique une hiérarchisation des sites mais pas des données contextuelles. En somme il n’y a pas de code pas de langage approprié pour hiérarchise rl’information. Ce que font les catalogues informatisés de certaines bibliothèques.

Suite au prochain numéro….

Google 1 BNF 0

Voila c’est dit la BNF c’est rendu compte qu’elle ne faisait pas le poids face au géant Google: mais l’immense popularité de Google Books ne viendrait-il pas aussi du fait que tous son contenu est référencé sur son moteur de recherche

On a qu’a voir la différence entre Europeana Gallica d’un coté

et  Google qui gagne la bataille d’abord par le nmbre de références indexées mais surtout par sa technologie qui rend les infos accessibles sans connaître les règles de recherches bibliographiques (grosse erreur de la BNF et Europeana).

Après avoir fermement bataillé contre la numérisation des ouvrages européens par le géant américain Google, la Bibliothèque Nationale de France (BNF) serait maintenant sur le point de céder la numérisation de ses ouvrages au moteur de recherche, imbattable sur les coûts et les délais.

Selon les informations du journal La Tribune, la Bibliothèque Nationale de France (BNF) serait actuellement en discussion avec Google pour lui confier la numérisation d’une partie de son fonds. Sous la présidence de Jean-Noël Jeanneney, l’institution française avait pourtant fortement résisté au géant américain et plébiscité son propre programme de numérisation, à un rythme d’escargot mais au prix d’un pur sang. Dans le même temps, alors que Jeanneney redoutait en 2004 la suprématie numérique de la culture anglo-saxonne, 29 grandes bibliothèques dans le monde, dont la prestigieuse Bodleian Library d’Oxford, signaient un accord avec Google.

Aujourd’hui, avec en plus des partenariats signés avec 25.000 éditeurs, Google compte plus de 10 millions d’ouvrages numérisés. Il a achevé son travail à Oxford, en se concentrant essentiellement sur les ouvrages du 19ème siècle, et se prépare à ouvrir un service d’achat de livres en ligne pour les ouvrages sous droits. 1,5 million de livres numérisés proviennent déjà d’accords avec les éditeurs, et ses conflits aux Etats-Unis sur fond de droit d’auteur sont en passe d’être réglés. En France, seuls 150.000 livres d’auteurs français auraient été numérisés par Google. La firme a d’ailleurs récemment dénoncé la trop grande rigidité du droit d’auteur français, qui l’empêcherait d’aller plus vite.

Culturellement, le danger est bien plus grand pour la francophonie et la culture européenne de se faire engloutir en refusant la numérisation par un Américain, qu’en misant sur ses propres moyens, beaucoup plus modestes. Ce que la BNF a fini par admettre.

Nos négociations avec Google pourraient aboutir d’ici à quelques mois“, affirme ainsi à la Tribune Denis Bruckmann, directeur général adjoint et directeur des collections de la BNF. Alors qu’elle ne reçoit au titre de la numérisation que 5 millions d’euros par an de l’Etat, versés par le Centre national du livre, la BNF estime qu’il faudrait entre 50 et 80 millions d’euros pour numériser les seuls fonds de la troisième République, avec ses propres moyens. Selon les formats et la qualité de numérisation souhaitée, la numérisation d’un livre coûterait à la BNF entre 0,12 euro et 0,74 par page. Un prix probablement sans commune mesure avec ceux de Google, d’autant que le géant américain dispose d’outils secrets pour numériser dans une vitesse record.

Article diffusé sous licence Creative Common by-nc-nd 2.0, écrit par Guillaume Champeau pour Numerama.com
Un Blog WordPress.com. | Thème : Motion par volcanic.
Suivre

Get every new post delivered to your Inbox.