Pour gérer vos consentements :
Categories: Régulations

Tout Wikipedia dans un livre électronique

L’iRex Iliad est sans aucun doute le lecteur de livres électroniques le plus populaire du marché. Il embarque un écran de type « papier électronique », pour un prix encore élevé (malgré une promotion en cours) de 499 euros.

Les 256 Mo de mémoire Flash se répartissent entre un système d’exploitation basé sur Linux et 128 Mo d’espace de stockage. L’adjonction d’une carte externe permet cependant d’ajouter un maximum de 8 Go de mémoire. Amir Shimoni utilise cette caractéristique pour embarquer l’encyclopédie en ligne Wikipedia au sein de l’iRex.

À cet effet, il offre un logiciel capable de lire le contenu de l’encyclopédie, stocké dans une archive. Toute l’astuce consiste à pouvoir retrouver un article précis, sans décompresser le fichier dans sa totalité. Le logiciel utilise le langage de programmation Python et un navigateur Internet qui permettra d’afficher les pages (Dillo, Midori ou l’outil intégré à l’Iliad).

L’auteur propose d’installer les 22,3 Mo de la version anglaise simplifiée de Wikipedia. Au besoin, vous pourrez également installer la version complète de l’encyclopédie en langue anglaise, qui pèse plus de 3,6 Go (avec compression !). Il convient alors de formater la carte mémoire en ext2, le format fat32 n’acceptant pas les fichiers de plus de 2 Go.

Amir Shimoni signale toutefois que cette version « hors-ligne » de Wikipedia ne comprend aucune image. En les incluant, la taille de l’archive dépasserait en effet les 400 Go !

Vous pouvez télécharger ce projet sur cette page. Des index existent également pour le dictionnaire anglais et la version allemande de Wikipedia. L’auteur travaille maintenant à la mise au point d’une solution d’indexation qui permettra – nous l’espérons – d’adapter cet outil à d’autres versions localisées de l’encyclopédie.

Recent Posts

GPT-4o : où, quand et pour qui ?

OpenAI orchestre un déploiement très progressif de GPT-4o, y compris de ses capacités multimodales.

20 heures ago

Nom de domaine : Twitter définitivement remplacé par X

Elon Musk avait racheté le nom de domaine X.com à PayPal en 2017. Depuis juillet 2023,…

1 jour ago

Microsoft propose une délocalisation hors de Chine à ses ingénieurs IA et Cloud

Des centaines d'ingénieurs en IA et cloud travaillant pour Microsoft se voient proposer de quitter…

1 jour ago

Du « Monde » à Reddit, le point sur les partenariats data d’OpenAI

Reddit s'ajoute à la liste des « partenaires data » d'OpenAI. Qui rejoint-il ?

1 jour ago

Comment Younited a appliqué la GenAI au crédit conso

Younited a utilisé PaLM 2 puis Gemini pour catégoriser des transactions bancaires en vue de…

1 jour ago

Processeurs : les États-Unis fabriqueront 30 % des puces avancées d’ici 2032

Les États-Unis vont tripler leur capacité nationale de fabrication de puces et contrôler 30 %…

2 jours ago