“Welcome to this Wikipedia Selection. This 2008/9 Wikipedia DVD Selection is a free, hand-checked, non-commercial selection from Wikipedia, targeted around the UK National Curriculum and useful for much of the English speaking world. It has about 5500 articles (as much as can be fitted on a DVD with good size images) and is about the size of a twenty volume encyclopaedia (34,000 images and 20 million words). Articles were chosen from a list ranked by importance and quality generated by project members. This list of articles was then manually sorted for relevance to children, and adult topics were removed”

Esta está en inglés, contiene apenas 5500 artículos, pero lo bueno es que tiene todas las imágenes (por eso pesa 3gb el archivo schools-wikipedia-full-20081023.tar.gz). Está pensada para escuelas del reino unido…

Son

~/Wikipedia/schools-wikipedia-full/images$ du -h -c *
3,4G total

y

~/Wikipedia/schools-wikipedia-full/wp$ du -h -c *
414M total

es decir, 3,4G en imágenes y sólo 414 MB en textos. No tiene ni Discusión ni Usuarios; así que pesa menos el texto que la versión que bajé en castellano.

se puede buscar por Indice de Títulos o por Orden de Alfabético. (hasta donde vi, no tiene la interesantísima y utilísima función de buscar normalmente como si estuvieras online, función que sí tiene la versión castellana wikipedia-es-html.tar.7z (que no contiene imágenes pero está completa completa en materia de texto (37gb))

Está realmente muy buena a primera vista, o sea, muy completa y de buena calidad enciclopédica (no le pidamos más); eso sí, ni idea acerca de las adulteraciones, mutilaciones y censuras que pueden haber sufrido esos artículos.

En fin, otra opción más a tener en cuenta para realizar experimentos de toda clase

* forkear wikipedia
* dejar versiones congeladas no censuradas posteriormente a tal fecha
* aprender a administrar tantos datos
* crear cds o dvds o pendrives con este material

etc


Marcos Guglielmetti
www.musix.org.ar
www.ovejafm.com

_______________________________________________
La lista solar-general es un canal de comunicación de SoLAr por el libre intercambio de ideas de todos los interesados en el movimiento de software libre. Debido a su libre suscripción y publicación, y dado que no existe ningún tipo de moderación previa ni posterior, es un excelente lugar para compartir opiniones, elaborar políticas y prácticas por el Software Libre en Argentina y el mundo. Tal como dice en ourproject: “La lista de todos y todas en solar” http://ourproject.org/mail/?group_id=23

Te invitamos a subscribirte enviando un mail a solar.general@librelist.com

¡Asociate a SOLAR!: http://www.solar.org.ar/?article573

* por la restauración del historial de solar-socios (dejó de funcionar el 25 de nov de 2009)
* por la apertura del sitio solar.org.ar y de solar-socios para todo el movimiento
* por el fin de la censura contra el compañero Saravia y contra todos los compañeros
* por el fin de las mociones represivas que generan malestar entre los miembros
* por la inmediata reincorporación de cualquier socio del movimiento SL expulsado
* por la reapertura de solar-general y del wiki.solar.org.ar
* por la discusión de principios para ampliar la participación
http://wiki.solar.org.ar/publico:definiciones_y_netiqueta_para_solar-socios

3 Responses to “Wikipedia para escuelas en Inglés: 3,8 GB”

  1. admin says:

    Sobre la wikipedia castellana que pesaba 37GB

    Eliminé los *Dicusión*”

    find -name “*Discusión*” -exec rm {} \;

    y quedaron 16GB

    Luego los *Usuario*

    find -name “*Usuario*” -exec rm {} \;

    y quedaron

    15G total
    ~/Wikipedia/es/articles$

    Ahora veré sin las imágenes

    find -name “*Imagen~*” -exec rm {} \;

  2. admin says:

    Sin los html de referencias de imagenes, queda así:

    ~/Wikipedia/es/articles$ du -h -c *

    9,4G total

  3. admin says:

    Sobre la wikipedia castellana que pesaba 37GB

    Eliminé los html *Dicusión*”

    find -name “*Discusión*” -exec rm {} \;

    y quedaron 16GB

    Luego los html *Usuario*

    find -name “*Usuario*” -exec rm {} \;

    y quedaron

    15G total
    ~/Wikipedia/es/articles$

    Ahora veré sin los html de referencias de imágenes

    find -name “*Imagen~*” -exec rm {} \;

    Sin los html de referencias de imagenes, queda así:

    ~/Wikipedia/es/articles$ du -h -c *

    9,4G total

    Es decir que el contenido usual de Wikipedia en castellano en html pesaba eso al 2008-06

    Reducido en más de 3 veces, es más simple alojarlo en cualquier lado (una vez comprimido o no) o usarlo localmente.

    recordemos q esta versión de wikipedia admite búsquedas poco complejas.

    Por ejemplo si busco Camus me devuelve esto:

    ~/Wikipedia/es/articles/c/a/m/Camus.html

    Camus
    El apellido Camus puede referirse a:
    Aimée Antoinette Camus, (1879 - 1965) botánica francesa hija de Edmond Gustave Camus;
    Albert Camus, (1913 - 1960) autor y filósofo francés;
    Mario Camus, (1935 - ) director y guionista de cine español;
    Matilde Camus (1919 - ), poeta e investigadora de Cantabria (España);
    Edmond Gustave Camus, (1852 - 1915) farmacéutico y botánico francés, padre de Aimée Antoinette Camus.

Leave a Reply

You must be logged in to post a comment.