2008-07-14

Bibliothèque planétaire et robots bibliothécaires : un nouveau service public


Depuis son lancement en 2004, le projet de Google de numériser les livres et de constituer ainsi, en diverses langues, une bibliothèque numérique planétaire, semble progresser irréversiblement. Ses initiateurs annonçaient vouloir mettre en ligne d’ici 2010 quinze millions de livres tirés des rayons des grandes bibliothèques du monde, soit 4,5 milliards de pages. Or non seulement Google Livres accumule les ententes, mais il améliore aussi constamment ses moteurs de recherche, qui retrouvent en quelques dixièmes de seconde et affichent sur notre écran, partout (ou presque…) dans le monde, les pages des livres que nous demandons. Google propose aussi au lecteur des titres de livres (et souvent des résumés) que l’usager ne connaissait pas. Autrement dit, ces robots bibliothécaires – il est désormais légitime de les appeler ainsi - vont non seulement chercher et livrer immédiatement, magiquement, sur notre table-écran, les livres demandés, mais ils ont aussi le pouvoir de vérifier pour nous l’existence même de publications traitant du thème qui nous intéresse et de nous les proposer. Devons-nous réagir en blasés ? Voilà en fait un progrès prodigieux dont il faut savoir s’étonner.

La France avait résisté d’abord à ce qu’elle considérait comme l’impérialisme américain de Google. La Bibliothèque nationale de France avait contre-attaqué en lançant son propre projet de numérisation francophone : Gallica (1), avec des budgets conséquents. Son directeur, Jean-Noël Jeanneney, avait même publié un pamplet : Quand Google défie l'Europe. Son propos était très affirmé : La première réaction, devant cette perspective gigantesque, pourrait être de pure jubilation. Prendrait ainsi forme le rêve messianique qui a été établi à la fin du siècle dernier : tous les savoirs du monde accessibles gratuitement sur la planète entière.
Il faut pourtant y regarder de plus près. Et naissent aussitôt de lourdes préoccupations. Voici que s’affirme le risque d’une domination écrasante de l’Amérique dans la définition de l’idée que les prochaines générations se feront du monde.
Dans cette affaire, la France et sa Bibliothèque nationale ont une responsabilité particulière. Mais aucune nation de notre continent n’est assez forte pour assurer seule le sursaut nécessaire. Une action collective de l’Union européenne s’impose. L’enjeu est immense.

Puis Gallica avait donc été inscrit dans une démarche plus large, baptisé Europeana (2). Il s’agissait pour les Français de réaffirmer l'identité culturelle de l'Europe et de diffuser son patrimoine face à ce qu’ils voyaient comme une américanisation de la culture. Mais la bibliothèque publique de Lyon vient de signer un accord avec Google pour numériser et mettre en ligne ses collections patrimoniales (quelques 300 000 titres). Et cette fois, la BNF donne sa bénédiction. Il faut dire que Google assume les frais, ne demande aucun monopole d’accès, et que Lyon garde la maîtrise totale du choix des ouvrages (4). Difficile de dire non !

En fait, quoiqu’en ait dit Jean-Marcel Jeannenay, et il faut le dire aujourd'hui 14 juillet, fête nationale de la France, l’internet, comme nous l’avons toujours affirmé (5), sert la diversité culturelle plus qu’il ne lui nuit, même si l’initiateur est américain. Bien sûr, il demeure indispensable de veiller au respect des droits de propriété intellectuelle – que Google avait tendance à traiter avec désinvolture -, et de veiller à ce que ne s’installe aucun monopole, facile à instaurer pour celui qui est propriétaire des technologies. Certains objectent que dans un premier temps, Google s’assure de dominer le domaine, puis que dans un deuxième temps, il compte bien en tirer un profit commercial à la mesure de son investissement. Nul n’en doutera raisonnablement, mais il est prévisible aussi que Google sera de moins en moins capable d’établir un accès payant à cette bibliothèque numérique planétaire au fur et à mesure qu’il signera des accords en grand nombre avec ces partenaires publiques que sont les grandes bibliothèques. Il devra inventer d’autres modes de rémunération ; et nous savons qu’il y réussit très bien déjà.

Il est tout aussi prévisible que Google devra certainement aussi davantage partager dans le futur sa puissance dans les moteurs de recherche aussi bien que dans sa capacité de numérisation en ligne. On lui reconnaîtra alors d’autant plus volontiers le mérite de sa vision et de ses initiatives actuelles. Tous devront inventer des plans d’affaires nouveaux pour gagner de l’argent tout en assurant ce service public. Car il faut savoir le reconnaître et l’affirmer. Certes, Google est une puissante compagnie américaine, aux visées capitalistes, et fort bien cotée en bourse, mais c’est bien un service publique planétaire et gratuit que cette multinationale nous offre aujourd’hui, d’une valeur inestimable, et qu’aucun État, qu’aucune institution publique, même socialiste, n’avait même pu envisager. Et l’aurait-il conçu, qu’il n’aurait jamais été capable d’en assurer la maîtrise d’œuvre aussi rapidement, à une si grande échelle, mondiale, et avec tant d’expertise.

J’en tire deux conclusions. La première concerne le capitalisme. Il a certes des défauts épouvantables, qu’il est de notre devoir de condamner, mais il a aussi d’étonnantes vertus de créativité et même de service public, dont il faut inversement et honnêtement accepter de faire l’éloge. Même et surtout dans le domaine de la culture ! La ville de Lyon a eu parfaitement raison de donner l'exemple d'une première entente avec une bibliothèque publique française.

Et ma deuxième conclusion, c’est de donner raison à Google Livres dans son projet. Et d’espérer que les bibliothèques publiques choisiront désormais de collaborer avec les Google de ce monde, dans le respect de leurs mandats et dans l’intérêt de tous. Ce sera aussi une excellente opportunité pour les bibliothèques publiques de consacrer leurs efforts à développer de nouveaux services, et à explorer davantage leurs spécificités, complémentaires avec leur déploiement en ligne. Une occasion, donc, pour les bibliothèques traditionnelles – que j’ai toujours aimé et respecté – de se réinventer. Oui, le monde change. Très vite. Parfois pour le pire. Plus souvent, qu’on ne le dit, pour le meilleur.
Hervé Fischer

________________________________________

(1) Gallica : gallica.bnf.fr/
(2) Voir : http://www.bnf.fr/pages/dernmin/com_google3.htm
(3) Bibliothèque européenne numérique, lancée en mars 2008, `l’occasion du Salon du livre de Paris. Voir : www.europeana.eu/
(4) Voir : www.generation-nt.com/google-numerisation-lyon-livres-domaine-public-actualite-121101.html
(5) Hervé Fischer, Le choc du numérique, éditions vlb, 2001.


Libellés : , , , , , , , , , , ,

2007-08-12

L’âge du numérique : une révolution anthropologique


Nous avons vu se développer depuis un ou deux ans un regain exubérant de projets et de spéculations sur le potentiel des technologies numériques. La Silicon Valley bruisse à nouveau de toutes sortes de rumeurs et de fièvres entrepreneuriales, évoquant les bons vieux jours d’avant la bulle spéculative de 2000. Les grandes compagnies se consolident par des rachats souvent spectaculaires. Microsoft, soumis à la concurrence agressive de Google, veut racheter Yahoo, tandis que AOL peine à se redéfinir. Les petites entreprises de niche veulent imiter le succès de Youtube et autres innovateurs couronnés par le succès.


Robotique, bionique, biotique, empowerment, intelligence, mémoire et vie artificielles, data mining et télésurveillance progressent exponentiellement. Les moteurs de recherche sur le web sont les vedettes de l’industrie actuelle. Il faut souligner aussi que la technoscience est désormais entièrement numérique, que ce soient la physique, l’astrophysique, la modélisation moléculaire chimique et pharmaceutique, les reconstitutions archéologiques, les matériaux intelligents, la robotique, l’urbanisme, la météorologie ou l’écologie. Sans compter les armements militaires et l’exploration spatiale, qui sont évidemment très demandeurs en électronique et en informatique.

La vie quotidienne elle-même est de plus en plus arrimée aux technologies numériques, qu’il s’agisse de l’information politique, financière, bancaire, culturelle, éducative, du divertissement et du tourisme, des réservations de billets d’avion ou de train, comme de la vie familiale, privée et même intime. Les moyennes d’utilisation quotidienne de l’internet dans les pays développés sont en pleine croissance, atteignant souvent deux heures par jour. Beaucoup de foyers y comptent plusieurs ordinateurs, celui du père, celui de la mère et ceux des enfants (incluant les consoles de jeu, les lecteurs numériques de cédéroms et de DVD. Bref, toute la vie sociale, financière et industrielle est désormais dépendante de l’informatique. Nous sommes entrés de plain pied dans l’âge du numérique et on peut diagnostiquer sans risque de se tromper que nous sommes bien confrontés à une révolution anthropologique aussi importante que celle qu’initia l’âge du feu dans l’histoire de l’humanité.

Conséquemment, les outils numériques se banalisent déjà.

Les logiciels à code source ouverts gagnent du terrain, notamment grâce à leur adoption dans des pays comme la Chine, ou par des institutions et entreprises majeures. Mais nous n’assistons pas au balayage des logiciels à code propriétaire, que plusieurs espéraient, et cela tient beaucoup au fait que ces logiciels demeurent encore souvent peu conviviaux et constituent de pâles imitations des logiciels commerciaux, moins développés, moins performants, et moins compatibles avec les innombrables logiciels et plugs in disponibles sur le marché, souvent téléchargeables gratuitement.

Bien entendu, comme dans la société réelle, la criminalité s’y développe aussi plus vite que la police et le droit. Et cela constitue un très grave problème, dans la mesure ou les serveurs situés dans des pays échappant au contrôle international, et les dispositifs peer2peer quasiment insaisissables, sont abondamment utilisés par les mafias, les organisations de prostitution, les réseaux de pédophilie, les narcotrafiquants, les hackers, les terroristes, etc. Il est extrêmement difficile d’élaborer un droit, nécessairement international des usages licites et interdits sur le web, et encore plus de contrôler et sanctionner les délits et crimes. L’institution du droit est constamment en retard sur ce qu’il faut bien appeler un nouveau Far West, sans shérifs ou un no man’s land hors la loi. Trafics, harcèlements, vols d’identité y sont monnaie courante.

Il faut sociologiser le cybermonde, échapper tant que possible à l'apesanteur euphorisante qu'on croit y découvrir, et en mesurer les structurations politiques, les forces sociales, l'imbriquation instrumentale avec la réalité économique, utilitariste, voire perverse et criminelle qu'elle véhicule. Il s'agit bien d'une utopie technoscientifique, qui a pris le relais des utopies sociales et politiques du XIXe siècle, aujourd'hui abandonnées pour cause d'échec catastrophique, mais qui n'est pas davantage innocente. L'âge du numérique est porteur d'espoir, de progrès, certainement, mais aussi de tous les travers de l'humanité. Et il est de plus en plus puissant. Attention à CyberProméthée: l'homme créateur, mais aussi mi par un dangereux instinct de puissance, qu'il va falloir apprendre à maîtriser.

Hervé Fischer


Libellés : , , , , ,

2007-05-12

La double profondeur du web











Les métaphores océaniques du web


Nous crawlons le web, nous surfons le web comme sur la mer, nous y naviguons comme sur l'océan. Nous en y découvrons des continents électroniques. Et nous en soupçonnons la profondeur, les abîmes inaccessibles. Nos moteurs de recherche y pratiquent le cabotage sans s'éloigner des côtes. Et les spécialistes nous disent qu'au-delà des dix milliards de pages web indexées par exemple par Google, il existe quelques cinq cents milliards de plus de pages dans le web profond, que seuls des moteurs de recherche spécialisés, peuvent atteindre éventuellement.
La compagnie américaine Bright Planet (www.brightplanet.com) souligne que ces innombrables informations ne sont accessibles qu'au sein de centaines de milliers de sites web, où elles ne sont pas indexées, sans compter celles, incalculables, qui exigent un mot de passe pour y accéder et demeurent donc invisibles aux robots de plongée.
Michael K. Bergman, qui s'est spécialisé dans ces questions, a recensé quelques 275 moteurs de recherche sémantique spécialisés, qui font de la plongée (http://www.mkbergman.com/?p=291). Le site de CompletePlanet propose un inventaire de plus de 70.000 moteurs de recherche et sites spécialisés (http://aip.completeplanet.com). Le site présente: A comprehensive listing of dynamic searchable databases. Find databases with highly relevant documents that cannot be crawled or indexed by surface web search engines:
Et on pourra voir dans la liste de domaines proposés, que le web profond concerne tous les thèmes d'activité.
All Topics >>
Agriculture, Games & Hobbies, Military, Religion, Arts & Design, Government, Music, Science, Business,
Health, News, Search Engines, Computing & Internet, Home & Garden, Newspapers, Shopping, Education,
Humanities, People, Social Sciences, Energy, Jobs & Careers, Places, Sports, Engineering, Law, Politics,
Transportation, Environment, Literature, Products & Technology, Travel, Family, Living things, Recreation,
Weather, Finance & Economics, Magazines & Journals, References, Food & Drink, Media & Entertainment,
Regional

On trouvera dans wikipedia en anglais et en français un article significatif sur l'historique et le développement du web profond: (fr.wikipedia.org/wiki/Web_profond ). Je recommande aussi le site suivant sur le web invisible: http://c.asselin.free.fr/french/invisible_web.htm

La double profondeur du web

Il ressort de cette constatation que la difficulté de la veille spécialisée tient non seulement à l'expertise préalable requise, et à l'analyse qui validera et articulera les informations colligées, mais aussi à ce défi qu'il faut relever: accéder aux informations les plus récentes, les plus pointues et donc les plus spécialisées: précisément celles qui sont souvent invisibles aux moteurs de recherche connus. Nous nous heurtons là à une double profondeur du web, si je puis dire: trouver les bons moteurs de recherche, souvent inconnus, pour trouver les bonnes informations, souvent invisibles.
On peut se demander si l'océan du web va devenir de plus en plus profond, ou si les grands moteurs de rechercher vont se regrouper ou se fédérer pour assurer le relais automatique de l'un à l'autre dans la pêche profonde et arrimer leurs filets pour râcler plus efficacement le fond de l'océan. Demeureront ceux qui veulent réserver l'accès de leurs banques de données (intranets ou contrôles de billetterie, et ceux qui veulent échapper à toute surveillance.
Il y a aussi les pirates et les détectives, ceux qui tentent d'entrer dans les sites sous haute sécurité pour faire de l'espionnage militaire, économique, financier, et ceux qui veulent pour des raisons de sécurité percer tous les encryptages. Le fond des océans risque d'être très fréquenté un de ces jours.
Hervé Fischer

Libellés : , , , ,