“Welcome to this Wikipedia Selection. This 2008/9 Wikipedia DVD Selection is a free, hand-checked, non-commercial selection from Wikipedia, targeted around the UK National Curriculum and useful for much of the English speaking world. It has about 5500 articles (as much as can be fitted on a DVD with good size images) and is about the size of a twenty volume encyclopaedia (34,000 images and 20 million words). Articles were chosen from a list ranked by importance and quality generated by project members. This list of articles was then manually sorted for relevance to children, and adult topics were removed”
Esta está en inglés, contiene apenas 5500 artículos, pero lo bueno es que tiene todas las imágenes (por eso pesa 3gb el archivo schools-wikipedia-full-20081023.tar.gz). Está pensada para escuelas del reino unido…
Son
~/Wikipedia/schools-wikipedia-full/images$ du -h -c *
3,4G total
y
~/Wikipedia/schools-wikipedia-full/wp$ du -h -c *
414M total
es decir, 3,4G en imágenes y sólo 414 MB en textos. No tiene ni Discusión ni Usuarios; así que pesa menos el texto que la versión que bajé en castellano.
se puede buscar por Indice de Títulos o por Orden de Alfabético. (hasta donde vi, no tiene la interesantísima y utilísima función de buscar normalmente como si estuvieras online, función que sí tiene la versión castellana wikipedia-es-html.tar.7z (que no contiene imágenes pero está completa completa en materia de texto (37gb))
Está realmente muy buena a primera vista, o sea, muy completa y de buena calidad enciclopédica (no le pidamos más); eso sí, ni idea acerca de las adulteraciones, mutilaciones y censuras que pueden haber sufrido esos artículos.
En fin, otra opción más a tener en cuenta para realizar experimentos de toda clase
* forkear wikipedia
* dejar versiones congeladas no censuradas posteriormente a tal fecha
* aprender a administrar tantos datos
* crear cds o dvds o pendrives con este material
etc
–
Marcos Guglielmetti
www.musix.org.ar
www.ovejafm.com
_______________________________________________
La lista solar-general es un canal de comunicación de SoLAr por el libre intercambio de ideas de todos los interesados en el movimiento de software libre. Debido a su libre suscripción y publicación, y dado que no existe ningún tipo de moderación previa ni posterior, es un excelente lugar para compartir opiniones, elaborar políticas y prácticas por el Software Libre en Argentina y el mundo. Tal como dice en ourproject: “La lista de todos y todas en solar” http://ourproject.org/mail/?group_id=23
Te invitamos a subscribirte enviando un mail a solar.general@librelist.com
¡Asociate a SOLAR!: http://www.solar.org.ar/?article573
* por la restauración del historial de solar-socios (dejó de funcionar el 25 de nov de 2009)
* por la apertura del sitio solar.org.ar y de solar-socios para todo el movimiento
* por el fin de la censura contra el compañero Saravia y contra todos los compañeros
* por el fin de las mociones represivas que generan malestar entre los miembros
* por la inmediata reincorporación de cualquier socio del movimiento SL expulsado
* por la reapertura de solar-general y del wiki.solar.org.ar
* por la discusión de principios para ampliar la participación
http://wiki.solar.org.ar/publico:definiciones_y_netiqueta_para_solar-socios
Entries (RSS)
December 15th, 2009 at 11:07 am
Sobre la wikipedia castellana que pesaba 37GB
Eliminé los *Dicusión*”
find -name “*Discusión*” -exec rm {} \;
y quedaron 16GB
Luego los *Usuario*
find -name “*Usuario*” -exec rm {} \;
y quedaron
15G total
~/Wikipedia/es/articles$
Ahora veré sin las imágenes
find -name “*Imagen~*” -exec rm {} \;
December 15th, 2009 at 11:55 am
Sin los html de referencias de imagenes, queda así:
~/Wikipedia/es/articles$ du -h -c *
9,4G total
December 15th, 2009 at 12:00 pm
Sobre la wikipedia castellana que pesaba 37GB
Eliminé los html *Dicusión*”
find -name “*Discusión*” -exec rm {} \;
y quedaron 16GB
Luego los html *Usuario*
find -name “*Usuario*” -exec rm {} \;
y quedaron
15G total
~/Wikipedia/es/articles$
Ahora veré sin los html de referencias de imágenes
find -name “*Imagen~*” -exec rm {} \;
Sin los html de referencias de imagenes, queda así:
~/Wikipedia/es/articles$ du -h -c *
9,4G total
Es decir que el contenido usual de Wikipedia en castellano en html pesaba eso al 2008-06
Reducido en más de 3 veces, es más simple alojarlo en cualquier lado (una vez comprimido o no) o usarlo localmente.
recordemos q esta versión de wikipedia admite búsquedas poco complejas.
Por ejemplo si busco Camus me devuelve esto:
~/Wikipedia/es/articles/c/a/m/Camus.html
Camus
El apellido Camus puede referirse a:
Aimée Antoinette Camus, (1879 - 1965) botánica francesa hija de Edmond Gustave Camus;
Albert Camus, (1913 - 1960) autor y filósofo francés;
Mario Camus, (1935 - ) director y guionista de cine español;
Matilde Camus (1919 - ), poeta e investigadora de Cantabria (España);
Edmond Gustave Camus, (1852 - 1915) farmacéutico y botánico francés, padre de Aimée Antoinette Camus.