jueves, enero 25, 2007

El presidente chino quiere "purificar" la Red.

El presidente chino, Hu Jintao, ha pedido que se supervise y regule de forma más eficiente Internet -que cuenta en el país con más de 130 millones de usuarios-, para garantizar la seguridad de la información y la "estabilidad nacional". "Que podamos manejar Internet es un aspecto que afecta al desarrollo de la cultura socialista, de la seguridad de la información y de la estabilidad nacional", manifestó Hu durante una reunión del politburó del Partido Comunista.

Hu Jintao solicitó a los presentes en ese encuentro que "de forma activa y creativa” contribuyan a alimentar “una cultura virtual saludable", y señaló que el gobierno debería recurrir a la tecnología para guiar la opinión pública que utiliza como canal de comunicación Internet. "Deberíamos difundir más información de buen gusto, y promover productos online que representen la grandeza de la cultura china", ha afirmado. "Debemos promover un funcionamiento y uso de Internet civilizado, y purificar el entorno de la red".

En el último año el Gobierno chino ha emprendido una importante campaña para controlar la difusión de información y opiniones en la Red china, que cuenta con 20,8 millones de personas con blog. El Ejecutivo ya ha anunciado su intención de obligar a registrarse con datos personales reales a quienes posean una bitácora virtual, lo que obligará a los bloggers a autocensurarse para evitar castigos.

El número de internautas chinos creció el año pasado casi un 24% y, según un estudio hecho público ayer esta cifra podría llegar a superar el número de usuarios de Estados Unidos (el país con la mayor comunidad virtual, con 210 millones de clientes) en 2010. La organización de defensa de la libertad de prensa.

La gran mayoría de los internautas chinos no puede acceder a algunas páginas web situadas más allá de sus fronteras, aquellas que ofrecen una versión crítica sobre la actualidad o que difiere de la dada por los medios oficiales. Reporteros sin Fronteras incluye a China en la lista de países que no respetan ese derecho básico. A menudo los informes de la organización incluyen críticas a Pekín por detener disidentes que expresaban sus opiniones en la red, cerrar páginas y, en definitiva, intentar ejercer un control casi total sobre la información que circula por la Red.

Fuente: El país.

PRIVACIDAD Y CENSURA EN INTERNET

Enlaces de interés:

Ingeniera informática defensora de los derechos de privacidad en internet
http://lauren.vortex.com/
http://www.vortex.com/privacy

Ley usa patriot castellano:
http://bogota.usembassy.gov/wwwsusap.shtml

Google se niega a entregar a un tribunal una lista con las búsquedas que efectúan sus
usuarios
http://www.20minutos.es/noticia/83147/2/

La privacidad en el mundo cibernético:
http://www.epic.org/privacy/terrorism/hr3162.html

Las reglas básicas para navegar por Internet
http://www.privacyrights.org/spanish/pi18.htm

Los bancos ya acatan la Ley Usa Patriot:
http://www.cajaespana.es/corporativo/infocajaespana/general/corporateinformation/usapatriotact/index.jsp


http://ws1.grupobbva.com/TLBB/tlbb/jsp/esp/conozca/usapatriot/index.jsp

PRIVACIDAD Y CENSURA EN INTERNET (II)

PRIVACIDAD

La privacidad puede ser definida como el ámbito de la vida personal de un individuo que se desarrolla en un espacio reservado y debe mantenerse confidencial.Privacidad en la red: “Derecho a mantener el secreto sobre nuestros datos personalesy comunicaciones electrónicas”.
LEGISLACIÓN SOBRE PRIVACIDAD
INICIATIVAS LEGALES A DESTACAR
Ley Graham-Leach-Billey de 1999
Requiere que las organizaciones de servicios financieros creen políticas de privacidad, que deben compartir con sus clientes, y determinen cómo se compartirá la información entre las instituciones.

Ley de California para la Protección de la Información 1386
Entra en vigor en 2003, y gracias a ella se dieron a conocer muchas de las brechas que se habían producido en el sistema. Es el punto de partida para una propuesta de ley a nivel nacional iniciada por la Senadora por California del partido Demócrata, Diana Feinstein. Para el profesor de Gestión de las operaciones y la información de Wharton, Eric Clemonds, “sin una ley que obligue a informar y/o establezca multas en los casos de fugas de datos, las empresas no van a preocuparse de protegerlos”. Actualmente las empresas desde las que se filtra la información no son responsables de los daños que se deriven”. Motivos que según Clemonds justificarían una ley nacional:

1. El robo de identidad esta empezando a ser un fenómeno financieramente significativo, y preocupa a los usuarios.
2. Informar sobre las brechas de seguridad detectadas proporciona a los individuos y a sus instituciones financieras tiempo para protegerse a sí mismos. De esta forma se minimiza el riego.
3. Aparte de la vergüenza de las empresas, que han de admitir que se ha producido una sustracción de sus datos no existe ningún otro efecto negativo asociado al hecho de informar de las quiebras detectadas en el sistema.

Directiva para la Protección de la Información de la Unión Europea
Requiere que cada nación miembro de la Unión Europea cumpla la legislación que requiere controles de confidencialidad e integridad para las redes, sistemas y datos que contengan información personal. Incluye información personal de los empleados, además de la información de los clientes. Específicamente, toda la información personal que se reúne debe estar protegida contra la destrucción, pérdida, alteración y divulgación o acceso no autorizado accidentales o ilegales.

Ley Canadiense de Protección de la Información Personal y los Documentos Electrónicos (PIPEDA) de 2004
Surge con nuevos incidentes de robo de identidad (fraude de tarjetas de crédito, posesión de documentos de identidad de otras personas). Amplia la definición de “robo de identidad”.
LEYES NACIONALES

Ley 11/1998, de 24 de Abril, General de Telecomunicaciones
Regula las obligaciones de servicio público, que se imponen a los explotadores de redes públicas, y prestadores de servicios de telecomunicaciones disponibles para el público, garantizando así la protección del interés general en un mercado liberalizado. Se incluyen, entre otras, disposiciones de los datos personales y el cifrado, dirigidas, todas ellas, a garantizar técnicamente los derechos fundamentales constitucionalmente reconocidos.

La Ley Orgánica 15/1999, de 13 de diciembre de 1999, de Protección de Datos de Carácter Personal (BOE 14-12-1999)
Recoge una serie de medidas de obligado cumplimiento para todas las empresas y entidades públicas que dispongan de bases o ficheros informáticos con datos de carácter personal, para “garantizar y proteger, en lo que concierne al tratamiento de los datos personales, las libertades públicas y los derechos fundamentales de las personas físicas, y especialmente de su honor e intimidad personal y familiar”
Artículo 18.4 de la Constitución Española
Establece que 'la ley limitará el uso de la informática para garantizar el honor y la intimidad personal y familiar de los ciudadanos y el pleno ejercicio de sus derechos'.
PRIVACIDAD Y TIPOS DE ACTIVIDADES

Actividades públicas
Existen actividades cibernéticas abiertas al público que no ofrecen ninguna garantía en cuanto a la privacidad. De acuerdo a leyes federales, cualquier persona puede consultar o divulgar comunicación electrónica si está "al alcance" del público. Serían: foros, listas de distribución, directorios de suscriptores y registros de un sitio (www.checkdomain.com)

Actividades semi-privadas
Chats, foros con acceso restringido...
Es totalmente legal que los administradores del foro capturen y divulguen la información posteriormente.

Actividades privadas

Comunicaciones electrónicas (incluye el correo electrónico)
Las leyes que rigen estas actividades tienen muchas excepciones y distinguen entre mensajes en pleno tránsito y mensajes ya almacenados. Los ya almacenados cuentan con menos protección que aquellos que son interceptados. Algunas excepciones serían:
  • Los proveedores de Internet tienen el derecho de consultar correos electrónicos privados si sospechan que el emisor los ha enviado con intención de dañar al sistema o a otro usuario.
  • Asimismo, en los Estados Unidos toda compañía tiene derecho de inspeccionar los correos electrónicos de sus empleados.
  • Las compañías pueden verse obligadas a difundir información privada si se requieren como prueba para un juicio o una citación. El primer caso judicial en el que se utilizaron por primera vez los registros de búsquedas en Internet que el imputado había realizado antes y después del homicidio de su esposa, para reconstruir los hechos, fue el de Robert James Petrick a finales de 2005. Entre otras búsquedas aparecieron términos como: “rotura de cuello” o “como deshacerse de un cuerpo”. En este sentido la ley Patriot Act ha ampliado el tipo de archivos electrónicos que puede solicitar un juez.

MEDIOS DE RASTREO Y MONITOREO

Cookies. Muchos sitios de Internet depositan en su disco duro bloques de información conocidos como cookies, o galletas, que contienen datos sobre su visita a una determinada página electrónica. Archivos de texto que graban nuestros movimientos. La mayoría de “cookies” expiran unos pocos meses o años después. Las de Google, no obstante, no expiran hasta el 2038.
La mayoría de las galletas son utilizadas sólo por el sitio que colocó dicha información en su computadora. Sin embargo, existen galletas de terceras personas que transmiten información suya a compañías de publicidad.

Bichos cibernéticos. Elemento gráfico colocado por una tercera persona, en una página Web, o en un correo electrónico que se diseñan para controlar quién los consulta. http://www.bugnosis.org/

Mercadotecnia y el spam. Los comerciantes pueden utilizar la información sobre nuestros patrones de conducta para desarrollar listas específicas de usuarios con gustos y comportamientos similares. Esta información también puede resultar de correos electrónicos enviados de forma masiva y dirigidos a personas que, en principio, no desean recibirlos (Spam). Los spammers usan los Web Bugs para controlar que direcciones de correo funcionan y cuales no.

Navegadores. La mayoría de los navegadores dan a conocer a los administradores de sitios información sobre su proveedor de servicio de Internet y otras páginas que usted ha visitado.

CONSEJOS PARA SALVAGUARDAR NUESTRA PRIVACIDAD

Contraseña. Combinación de mayúsculas, minúsculas, números sin sentido. No utilizar la misma contraseña en programas distintos.
Consular la política de privacidad del proveedor de Internet utilizado
Revisar y seleccionar las cookies
Buscar más información sobre un servicio antes de usarlo
Suponer que toda comunicación en Internet no es privada. No dar información personal
Precaución con software extraño que se carga automáticamente.
Emplear seudónimos o correos electrónicos anónimos en foros públicos
Biografía en Internet. Es mejor no crear una biografía si por alguna razón debemos salvaguardar nuestra identidad.
Discreción en nuestras páginas Web
Todas las actividades electrónicas dejan huellas electrónicas. Nuestro proveedor de Internet puede determinar que buscador utiliza, que sitios visita, la fecha y duración de sus sesiones en Internet.

HERRAMIENTAS PARA PROTEGER LA PRIVACIDAD

Codificación. Es un método capaz de codificar un correo electrónico o un documento de manera en que sólo las personas indicadas puedan decodificarlo y leerlo. Ej. PGP (Pretty Good Privacy) - Javier González

Correos anónimos. Existe un programa llamado "anonymous remailers" que consiste en recibir un mensaje electrónico, quitar información que pudiera identificar a un usuario, y mandarlo a su destino apropiado.

Servicios anónimos para navegar en Internet. Estos servicios combinan las funciones de "remailers", direcciones electrónicas desechables y aquellas de servidores "proxy" para esconder su identidad y transferir información entre su navegador y una página de Internet.
Servidor proxy, que sirve para permitir el acceso a Internet a todos los equipos de una organización cuando sólo se puede disponer de un único equipo conectado, esto es, una única dirección IP.

Software para proteger y almacenar información. Los programas de seguridad ayudan a prevenir el acceso no autorizado a documentos dentro de su computadora. Estos programas pueden incluir "rastreadores" que archivan toda actividad en el disco duro de su computadora.

ROBOS DE IDENTIDAD

ChoicePoint → Información personal de 145.000 personas. Esta proveedora de servicios de identificación y verificación de credenciales con sede en Georgia, “debido a una brecha en su seguridad, tuvo que llegar a un acuerdo con la Federal Trade Commission valorado en 15 millones de dólares, incluyendo 5 millones en concepto de compensación a los clientes”.
Lexis-Nexis → Los hackers se apropian de datos personales de 32.000 individuos que utilizan esta base de datos.
Bank of America → Pierde cintas con copias de seguridad que contienen los historiales de 1,2 millones de empleados federales.
AOL → 19 millones de búsquedas de 650.000 suscriptores

El portavoz de AOL, Andrew Weinstein, calificó como "errores graves", la firma colgó en Internet unos 19 millones de "búsquedas" hechas por más de 650.000 suscriptores durante tres meses. La idea era suministrar datos a la comunidad científica que permitieran investigar sobre el comportamiento de los usuarios de Internet. El problema es que quedaron expuestas al público.
Quizá uno de los más preocupados sea el suscriptor 17556639, quien en sus búsquedas de información más recientes utilizó repetidas veces estas frases: "cómo matar a su esposa", "asesino de esposa", "gente muerta", "fotos de muertos", "fotos de decapitados". Las listas muestran a suscriptores que han hecho búsquedas reiteradas de pornografía infantil, o "cómo decirle a tu familia que has sido víctima de incesto", o "cómo divorciarse de un cónyuge que está en la guerra".

PRIVACIDAD Y BÚSQUEDA, ¿COMPATIBLES O NO?

Cada vez que un usuario hace una 'búsqueda' en Internet la actividad queda registrada junto a su número de suscriptor. ¿Pero cómo podemos identificar al suscriptor si es sólo una dirección IP? Sí, hay varias maneras. Por ejemplo, se puede lograr conectando todas las informaciones sobre los hábitos del suscriptor. A través de darnos de alta en un servicio de correo, pueden llegar a relacionarnos con una serie de búsquedas que se han hecho desde la misma IP.

Otra posibilidad de identificarnos es si hacemos búsquedas usando nuestros nombres propios. “Somos lo que el índice de Google dice que somos” y tenemos curiosidad e interés en saber lo que en Internet se dice de nosotros. "Si uno combina esas búsquedas que se hicieron para satisfacer el ego, con búsquedas de pornografía, están dadas las condiciones para una situación bochornosa".

GOOGLE CAMINO DEL MONOPOLIO

Los datos hablan por sí solos:
CUOTA DE MERCADO MUNDIAL - 59,7%
USA - 42 % UK - 75 % AUSTRALIA - 80%
BÉLGICA - 85% FRANCIA - 85% HOLANDA - 91%
ALEMANIA - 91% ESPAÑA - 99% CHINA - 20%

¿Qué peligros traería un monopolio? Los resultados de nuestras búsquedas podrían estar filtrados, o ofrecernos una visión parcial sobre un acontecimiento o una personalidad, etc…Este es un tema muy delicado.

GOOGLE A EXAMEN

GOOGLE (BUSCADOR) → Conserva indefinidamente nuestras búsquedas para según ellos prestar un mejor servicio. La política general de privacidad de Google no aclara por cuánto tiempo se guardará esa información. Ej. Quiso decir… Este no es un tema banal ya que cada vez más el resto de personas nos definen por lo que buscamos y encontramos en Internet. ¿Quién puede usar esas búsquedas?

GOOGLE EARTH → Varios gobiernos consideran al servicio de imágenes obtenidas por satélites, una amenaza para su seguridad por mostrar instalaciones estratégicas. Podemos ver instantáneas del Palacio de La Zarzuela, las bases militares de Irak, o los campos de detención de Guantánamo, razón que ha llevado a algunos Gobiernos a pedir su retirada e incluso el cierre de alguna de las páginas que ofrecen las imágenes.

GMAIL Google hace copias de cada correo que envías o recibes y les inserta anuncios publicitarios. El ordenador analiza el mensaje para buscar coincidencias con la red AdWords (sistema de publicidad de Google). Así en un mensaje con el texto “tarta de manzana” inserta publicidad sobre recetas de tartas de manzana.

GOOGLE DESKTOP SEARCH → (Poderosa herramienta de encontrar información en nuestro ordenador y perfecto programa espía)

La principal característica de esta herramienta es que crea una base de datos con los documentos almacenados en el disco duro del usuario (páginas Webs almacenadas en el historial y visitadas por el usuario, documentos Office, mensajes del Outlook, ficheros TXT, mensajería instantánea). Todo esto es indexado para una rápida localización del contenido. El problema según los expertos vendría en el caso de ser un ordenador compartido (bibliotecas, cibercafés,…), ya que el contenido de emails privados o de conversaciones a través de servicios de mensajería instantánea quedaría visible para otros usuarios del sistema.

Algunos foros (slashdot) y weblogs (blogosfera) recomiendan no instalarse esta herramienta. Otros expertos no van tan lejos, y no la ven tan peligrosa. Entre los consejos recomendados para aquellos usuarios que deseen instalar esta herramienta figura el seleccionar cuidadosamente que tipo de documentos deseamos indexar y cuales no, y dónde (directorios) queremos que lo haga.

GOOGLE BOOKS → Hay dudas sobre si en un futuro será un servicio de pago. ¿Se firmarán clausulas de exclusividad con las bibliotecas que presten sus colecciones para digitalizarlas?

GOOGLE Y EL LADO OSCURO

Su reciente salida a bolsa (29/4/2004) parece venir acompañada de una búsqueda cada vez más creciente de rendimientos, que están empezando a erosionar la visión fundacional de Google. Banners e historial de búsqueda.

Resumiendo los puntos anteriores, parece que los usuarios por el momento aceptamos entregar parte de nuestra privacidad, a cambio de obtener mejores resultados con nuestros servicios en red. Puede que un día esta búsqueda de la eficacia deje de primar sobre nuestro deseo de confidencialidad. En ese momento el sistema deberá adaptarse a lo que quiere el usuario, o el usuario cambiará de sistema. Pero el anonimato tendrá un precio: la falta de comodidad.

Al respecto, José Cervera en su weblog del mundo.es nos tranquiliza diciendo: “Hizo falta menos de un mes para que Internet abandonara en pleno a Altavista, el anterior favorito a Google. Y candidatos no faltan. No hay que preocuparse si la conversión de Google al lado oscuro se consuma nadie saldrá perjudicado. Sólo ellos.” Así que parece que hay vida después de Google

PRIVACIDAD Y CENSURA EN INTERNET (I)

INTRODUCCIÓN


1. INTERNET

Internet se inicia en los años 60, en plena Guerra Fría, cuando EE.UU crea una red exclusivamente militar, para que en caso de que el ejército ruso atacase, poder acceder a la información militar desde cualquier punto del país. Esta red se llamó ARPANET. La red creció tanto que su sistema de comunicación se quedó obsoleto, por lo que se creó el Protocolo TCP/IP, el cual se convirtió en el estándar de comunicaciones. ARPANET dejó de tener uso militar y éste fue a parar a MILNET.

La NSF (Nacional Science Fundation), crea NSFNET que más tarde absorbe ARPANET, creando el embrión de lo que hoy conocemos como Internet. En Suiza, en el Centro Europeo de Investigaciones Nucleares, Beners Lee retomó la idea del hipervínculo, del que ya se había hablado antes y fue en 1990 cuando se le dio nombre a este sistema de vínculos de información a través de redes.

En 1993, se crea la primera versión de MOSAIC, que permitió acceder con mayor naturalidad a la WWW. Poco después se creó el programa NETSCAPE. A partir de entonces Internet a crecido a una gran velocidad, lo que hace que toda la información que alberga tenga que estar ordenada y clasificada de alguna manera, aquí entran en juego los motores de búsqueda o Robots de la web.


2. LA EVOLUCIÓN DE LOS MOTORES DE BÚSQUEDA

Enunciaremos diversos buscadores, quizá los de mayor importancia y alcance, clasificados por fechas de aparición, desde 1994 hasta 2006.

1994

WEBCRAWLER
Nació a principios de 1994, como un proyecto universitario, en la Universidad de Washington (EE.UU.) Su creador, Brian Pinkerton vendió el Motor de Búsqueda a AOL a mediados de 1995 el cual a fines de 1996 fue adquirido por Excite!.
A pesar de pertenecer a Excite! su funcionamiento es totalmente independiente. WebCrawler, fue el primer Motor de Búsqueda en crear y utilizar el estándar de exclusión de Robots o Spiders, el cual será analizado más adelante.

LYCOS
Fundado en Enero de 1994, y lanzado en Internet en Junio del mismo año. Al igual que otros Motores de Búsqueda, Lycos nació como proyecto de Investigación de la Universidad de Carnegie Mellon por el Dr. Michael Mauldin. Lycos fue la primera empresa en Internet en basar su publicidad en CPM (costo por miles de visualizaciones) la cual es actualmente un estándar en la industria de Internet.
También incluyó en su base al directorio ODP (Open Directory Project, el directorio de sitios del World Wide Web más grande, organizado en categorías y totalmente construido de forma manual, por usuarios de Internet. Más adelante se presenta al ODP con mayor detalle).

EXCITE!
Fundado por Mark Van Haren, Ryan McIntyre, Ben Lutch, Joe Kraus, Graham Spencer y Martin Reinfried.
Ofrece búsquedas basadas en palabras claves o basadas en conceptos (no sólo buscando los términos deseados por el usuario sino también los similares).
También Excite! provee una interesante forma de alineación de páginas dinámicas para diferentes sistemas operativos.

1995

ALTAVISTA
Nació en Abril de 1995, en los Laboratorios de Digital Equipment Corp. (DEC Research) en Palo Alto, California, EE.UU. Sus dueños actuales son COMPAQ y CMGI Inc.
La innovación más notable de este Motor de Búsqueda, fue la inclusión de búsqueda multi lengua en Internet, siendo el primero en soportar chino, japonés y coreano utilizando los servicios del traductor Babel Fish (Primer traductor en línea en Internet). Otra de las innovaciones presentadas por este Motor, fue la de permitir búsquedas multimedia, para explorar Internet por fotografías, videos y música, estimados en aquel momento en más de 90 millones de objetos.

YAHOO
Es principalmente un directorio Web y no un verdadero Motor de Búsqueda. Por lo tanto, su estructura está basada en sitios Web propuestos por usuarios y no por los encontrados por un Robot o Spider.
Creado por David Filo y Jerry Yang, Ingenieros Eléctricos de la Universidad de Stanford, comenzaron su catálogo en Abril de 1994, para mantener y rastrear los sitios de su propio interés.
Su lanzamiento en Internet fue en Agosto de 1994. Yahoo! es el portal favorito de muchos usuarios de Internet. A pesar de ello, en el último año, agregó servicios alternativos como chat, Correo Electrónico gratis, hosting y la posibilidad de crear comunidades virtuales. El Motor de Búsqueda de Yahoo fue Google hasta Febero de 2004. Actualmente Yahoo usa su propio motor de búsqueda el cual esta basado en Inktomi (buscador que adquirió en Marzo de 2003) y basado también en Altavista y en AllTheWeb.

1996/1997

INKTOMI
Deriva de un Motor de Búsqueda desarrollado por la Universidad de Berkeley, California, EE.UU. Fue fundado en 1996 por dos estudiantes de dicha Universidad, llamados Eric Brewer y Paul Gauthier.
Provee servicio de búsqueda a una importante legión de empresas de la web como: HotBot, AOL, ICQ, GeoCities, Search MSN, GoTo, Canada.com, RadarUol, entre otros.
Inktomi no sólo es conocido por su potente Motor de Búsqueda, sino también por lograr la confección de directorios utilizando las páginas obtenidas por su Spider.

GOOGLE
Al igual que la mayoría de los Motores de Búsqueda de Internet, nació como un proyecto de investigación universitaria de dos alumnos: Sergey Brin y Larry Page. Fue en la Universidad de Stanford, EE.UU. en 1997.
En marzo del 2000, innovó el mercado de Motores de Búsqueda con su algoritmo PageRank, siendo usado por primera vez en el proyecto Open Directory. Dicho algoritmo, convirtió a Google en uno de los Buscadores más efectivos del mercado, utilizando dicho sistema. El sistema llamado PageRank, permite a Google filtrar una gran porción de resultados irrelevantes. Este sistema identifica cuántas páginas apuntan a una página en particular para poder así decidir cuáles son las páginas más relevantes. También su arquitectura innova el mercado diferenciando sitios Educativos y Gubernamentales de los sitios Comerciales, los cuales, tienden a utilizar spam contra los Motores de Búsqueda.

FAST
El Motor de Búsqueda Fast Search & Transfer, conocido como FAST o como AllTheWeb.com, fue creado en la Universidad de Ciencia y Tecnología de Noruega (NTNU) en Julio de 1997. Su dueño y administrador es Fast Search & Transfer ASA Technologies y fue lanzado a Internet a mediados de 1998; posee una de las bases de datos más grandes de la actualidad. Su sostén principal ha sido la búsqueda especifica de multimedia.
DIRECTHIT
1. Contabiliza los clics que realizan los usuarios en otros motores de búsqueda de los resultados que ven.
2. En conclusión cuanto más veces se visita un sitio, mejor es su posición en la clasificación.

TEOMA
1. Incorpora un servicio avanzado de búsqueda con este sistema podemos acotar nuestras búsquedas por idioma, área geográfica, dominio o fecha de incorporación a la base de datos del buscador.
2. Calcula la relevancia de una página analizando los hipervínculos para identificar comunidades en Internet, determinando cuáles son las autoridades, encontrando así las mejores páginas.

MSN SEARCH
1. Se creó de la mano de Microsoft, utilizando los datos de Inktomi.
2. Msn ha llevado a cabo esta modificación para mejorar su sistema de búsqueda e incluir en él varios enlaces a sus principales servicios, como Hotmail, Messenger o Noticias.

1998

OPEN DIRECTORY PROJECT
Es el directorio más grande de la web. Construido y mantenido por voluntarios (editores), organiza pequeñas partes de la red para descartar los sitios de contenido pobre y quedarse sólo con los más relevantes. Además provee información a diferentes motores de búsqueda: NetScape Search, AOL Search, Google, Lycos, Hotbot, DirectHit…

1999

BAIDU
Motor de búsqueda chino, visto en muchos casos como punto de referencia (hasta la actualidad) debido a la presión que mantiene el gobierno chino sobre Internet. La mayor parte de la inversión que tiene viene dada de empresas estadounidenses.

2000/2005

NUTCH
Es un motor de búsqueda con Código abierto, creado en JAVA.

CLUSTY
Filosofía basada en el clustering (conjunto de ordenadores que comparten un mismo hardware).
Fue el primer buscador que ofrecía búsquedas en Blogs o la Wikipedia en una de sus opciones.

NOXTRUM
Enfocado a sitios en castellano y portugués. Contiene toda la información de Páginas Amarillas

2006

QUAERO
Buscador europeo impulsado, principalmente, por los gobiernos de Francia y Alemania (que ha abandonado el proyecto 21- diciembre 2006 por diferencias de opinión con Francia sobre la estructura y contenido del buscador) y potenciado por grandes empresas tecnológicas europeas como como Thomson, France Telecom
Se lanza como EXALEAD (Buscador que llevaba años en funcionamiento con los resultados de AOL y tras el acuerdo de éste último con Google, decidió usar el índice de Quaero)
Índice de 8.000 millones de resultados y es compatible con cualquier navegador.
Además de áste tenemos: Snap, Live, Hakia, Powerset, Cranky y Retrevo. De éstos últimos ya hablamos en un post anterior.

martes, enero 23, 2007

Petición de firmas para apoyar las recomendaciones de la Comisión Europea sobre Open Access.

Demuestra con tu firma tu apoyo al Open Access y contribuye a que las recomendaciones del último informe sobre comunicación científica de la Comisión europea se realicen. Es importante la presencia de nuestro país en este tipo de iniciativas. Precisamente, una de las personas de la Comisión europea que realizó este informe comentó la nula participación de España en el proceso de consulta en línea que la comisión establecío para recoger datos y opiniones antes del publicar el informe final. Por lo menos, ahora, vamos a apoyarlo.

Para firmar está petición, podeis acceder a través de la siguiente dirección

http://www.ec-petition.eu/

Fuente: Extraido del blog Open Access, gestionado por Alicia López Medina.

lunes, enero 22, 2007

Nueva hornada de buscadores

A pesar del liderazgo indudable de Google, la búsqueda sigue atrayendo nuevos inversores que crean posible arrancar una fracción de un mercado tan rentable. Aparecen nuevos motores de búsqueda que dan lugar a nuevas ofertas. Según lo que aportan de novedad, podemos clasificarlos en tres apartados:


  • Mejores presentaciones
Tenemos el buscador Snap que dedica la mitad de la pantalla (parte derecha) a un anticipo de la página hallada, además de permitir a los usuarios que se califique cada resultado como perfecto o chatarra (junk).

Live de Microsoft presenta ventajas a la hora de mostrarnos imágenes: las fotos se amplían cuando uno pasa el cursor por encima con el ahorro de tiempo que significa a la hora de cargar la página. Tiene una scrollbar infinita, así no tenemos que ir cambiando de página cada un número x de imágenes.


  • Innovaciones técnicas
En el caso de Hakia introduce la inteligencia artificial. El problema es que los resultados aún no son muy convincentes.

Powerset apuesta por el lenguaje natural, es decir, no con listas de términos ("keywords") sino con frases con sentido. De momento está cerrado.

Mindset, demo de Yahoo, nos permite inclinar el filtraje de los resultados de nuestra búsqueda hacia la investigación o hacia la compra.


  • Concepción distinta a la de Google
Sería el caso de motores especializados. Abarcan campos como: viajes, salud, empleo o blogs. Un caso curioso es el de Cranky que tiene en cuenta la edad (se dirige a personas de más de 50 años), y está especializado en viajes y salud.

El más avanzado sería Retrevo, que realiza búsquedas en el campo de lo productos electrónicos (hardware y software). Por ejemplo: si buscamos sobre una cámara digital, nos devolverá su manual, artículos de prensa que la analizan, foros y blogs que debaten acerca de este producto en concreto, y los lugares donde se puede adquirir.

Al parecer no todo está dicho en el fenómeno de la búsqueda en Internet.


Más información en el artículo del país Nuevos motores de búsqueda a la vista de Francis Pisani

jueves, enero 18, 2007

El blog de la central bibliotecaria de Google

El Boletín de Google dedicado a los bibliotecarios y documentalistas(Librarian Newsletter) anunciaba ayer a sus suscriptores, el lanzamiento deun blog propio para ir publicando todos los trucos y novedades del rey de las búsquedas: Google Librarian Central Blog:

http://librariancentral.blogspot.com/

Fuente: Iwetel

lunes, enero 15, 2007

Los coreanos tendrán que dar su nombre real en las webs más visitadas

Un proyecto de ley, dirigido a evitar el ciber-crimen, exigirá que los artículos y comentarios se firmen con nombres reales.

Un proyecto de ley del gobierno de Corea del Sur establece que los comentarios y artículos en las webs más visitadas tendrán que firmarse con los nombres reales de los usuarios, no con apodos.El sistema "nombre real en Internet" intenta prevenir delitos como la difamación o la invasión de la intimidad, y se aplicará a los portales, webs y páginas del gobierno con más de 100.000 visitas al día.

Los proveedores del servicio serán los encargados de comprobar las firmas de los internautas. Si se negaran, los operadores podrían enfrentarse a multas millonarias, impuestas por el ministerio de Información.

Aunque en un principio se esperaba que la ley se dirigiese a portales con más de 300.000 visitas, y medios de comunicación con más de 200.000, al final el requisito mínimo se ha reducido hasta 100.000, y se ha incluido a las agencias gubernamentales, organizaciones financiadas por el estado y las diversas páginas del Gobierno.

El proyecto de ley se debatirá a partir de febrero y, de salir adelante, estaría listo para aplicarse el próximo mes de julio.En China también pintan bastos similares. La Sociedad de Internet de China estudia que los blogueros deban registrarse en la Red con sus nombres reales.

Fuente: Baquia


El Archivo Municipal facilita el acceso a más de 433.000 páginas de prensa gerundense de entre 1808 y 1989

El Archivo Municipal de Girona presentó el pasado diciembre un nuevo servicio, el de consulta en línea de una hemeroteca que incluye 433.116 páginas de prensa gerundense del periodo 1808-1989, provenientes de sus fondos de prensa. En total hay dieciséis cabeceras y la novedad del servicio se base en el hecho que el fondo está puesto a disposición del público de manera libre, gratuita y con una más que considerable rapidez de respuesta. Se puede acceder desde el web del Ayuntamiento de Girona, o bien, directamente a www.ayuntamiento.gi/sgdap. Para poder realizar búsquedas al fondo digitalizado se ha usado un programa de reconocimiento óptico de caracteres.

La consulta de fondo documental en papel tiene varios inconvenientes, principalmente el deterioro de los documentos originales y la necesidad de invertir mucho tiempo para encontrar la información deseada. La herramienta que pone al servicio del público el Archivo Municipal de Girona hará las delicias no sólo de investigadores y estudiantes, que serán los grandes beneficiados, sino de todos aquellos que tengan una cierta curiosidad por cuestiones como por ejemplo qué fue noticia de primera página el día de su nacimiento, o referencias de hechos susceptibles de ser noticia relacionados con su propia persona o con familiares. Este servicio, que tiene como fundamento el proceso de digitalización del fondo de prensa del Archivo Municipal iniciado el año 2000, permite localizar los documentos deseados a partir de la palabra o palabras que guían el criterio de busca. Para hacerlo, este programa ha transformado previamente la imagen digitalizada en una página de texto, para poder hacer la búsqueda, que así se agiliza. El paso siguiente fue poner a disposición de los investigadores o de quienes se acercaran al Archivo Municipal el fondo que se iba digitalizando, consultable en los terminales de este centro. Ahora es posible hacer cualquier consulta desde cualquier terminal conectado a internet, gracias a la compresión de los ficheros y a la indización de miles de palabras, fruto de la tarea de una empresa externa y de la adquisición de un programa denominado Pandora, que permite, además de un proceso de consulta sencillo y ágil de miles de documentos, la descarga libre de las páginas solicitadas, en formato PDF o texto.

Todo este proceso, ha supuesto una inversión de 74.319 euros. Este nuevo servicio tiene una rapidez en la capacidad de respuesta más que considerable y, también, ofrece la posibilidad de obtener la trascripción automática que la aplicación informática hace del texto digitalizado, a pesar de que puede haber algún error, fruto de imperfecciones en la impresión de algunos de los documentos originales.

Un fondo que se ampliará

De momento son consultables un total de dieciséis cabeceras o diarios de implantación gerundense de un fondo que tiene 1.365 cabeceras, 439 de las cuales son gerundense. Las que tienen un peso específico más importante son:

Diario de Gerona (segunda etapa, 1889-1936), con 165.780 páginas;
Los Sitios (1943- 1987), con 200.136 páginas, y
Diario de Girona (1988-1989), con 27.803.
Aún así, en virtud del convenio firmado con Diario de Girona, este aportará en el futuro un total de 250.000 páginas digitalizadas del periodo 1989-1998.
Diario de Gerona - 1808-1809 (446 pàg.)
Gazette de Geronne - 1810-1812 (454 pàg.)
El Postillón - 1837-1854 (80 pàg.)
El Norte - 1870-1928 (398 pàg.)
La Nueva Lucha - 1887-1889 (3.560 pàg.)
Diario de Gerona - 1889-1936 (165.780 pàg.)
Lo Geronès - 1894-1908 (2.152 pàg.)
La Lucha - 1897-1910 (15.847 pàg.)
Suplemento de El Autonomista - 1902-1935 (1.082 pàg.)
El Autonomista - 1931-1939 (8.608 pàg.)
Gerona CNT - 1937 (712 pàg.)
Front - 1937-1939 (1.662 pàg.)
El Pirineo - 1939-1942 (4.220 pàg.)
Los Sitios - 1943-1987 (200.136 pàg.)
Hoja del Lunes - 1950 (176 pàg.)
Diari de Girona - 1988-1989 (27.803 pàg.)

jueves, enero 11, 2007

Google digitalizará fondos de las bibliotecas catalanas

Más de 300.000 libros de cinco bibliotecas catalanas, no sujetos a derechos de autor, estarán en el futuro a disposición de millones de personas de todo el mundo a través de internet, gracias al acuerdo al que han llegado estas instituciones con Google para digitalizar sus fondos.

El conjunto de bibliotecas catalanas se convierte en el segundo socio no anglosajón -tras la Biblioteca de la Universidad Complutense de Madrid- que se suma al proyecto para bibliotecas de Google.

Consulta la noticia a texto completo en El País.com

lunes, enero 08, 2007

Maestros y bibliotecarios aprenden a promover la lectura infantil y juvenil en un centro universitario de Castilla-La Mancha .


La lectura trae de cabeza a padres y profesores. Todos saben que a los niños les apasiona el colorín, colorado, pero la batalla está en el érase una vez. Comenzar a leer, empezar un cuento, o un libro juvenil. Meterles el gusanillo por la literatura no es fácil, requiere unas destrezas específicas con las que muchos profesionales no cuentan. El Centro de Estudios de Promoción de la Lectura y Literatura Infantil (Cepli) de la Universidad de Castilla-La Mancha trabaja en la búsqueda de esas claves. En él se forman, mediante másteres y trabajos de investigación, decenas de maestros, bibliotecarios y documentalistas desde 1999. El Cepli, un centro universitario con apenas un par de precedentes similares en Europa, cuenta con una biblioteca cuyo germen fue la fantástica colección de libros infantiles y juveniles de la traductora Carmen Bravo Villasante, que adquirió la universidad manchega a finales de los noventa. Fueron 8.500 volúmenes adquiridos por todo el mundo que ahora han crecido hasta casi el doble.

"La universidad necesita un complemento para formar a mediadores en lectura"
"Los profesores necesitan saber cómo deben enseñar a leer a sus alumnos y qué lecturas son las apropiadas, por eso trabajamos para que esta especialidad se introduzca en las filologías y de forma obligatoria en la carrera de maestro de primaria, porque sólo lo hay en maestro de infantil", explica el director del Cepli, Pedro Cerrillo.

Casi 250 titulados se han formado en esta disciplina en estos años de funcionamiento del centro. "Nos enorgullece que hay, entre ellos, muchos latinoamericanos, cerca de un 40%, porque pueden cursar online la parte teórica de este máster de dos años, algo que posibilita su acceso, y pueden seguir las conferencias en tiempo real mediante Internet", explica Cerrillo. Este año, el máster contará con la colaboración de la Fundación Santa María.
En el Cepli, instalado en el campus de Cuenca, trabajan en la actualidad tres grupos de investigación y se editan numerosos trabajos de apoyo, promoción y enseñanza de la lectura. La bilioteca tiene "un magnífico fondo de libros infantiles antiguos" y cada año se edita algún ejemplar facsímil para contribuir a la recuparación de los cuentos de antaño difíciles de encontrar.
"La formación reglada de la universidad necesita un complemento para formar a mediadores en lectura y los investigadores necesitan una biblioteca especializada", explica Cerrillo. Son dos de las razones por las que nació este centro en la universidad manchega.

Los expertos en literatura infantil y juvenil están repartidos por diversas universidades españolas, pero todos ellos tienen una petición común que han hecho llegar al Ministerio de Educación, ahora que se están rediseñando los estudios superiores para adaptarlos al espacio común europeo. Quieren que, al menos las filologías, incluyan esta materia en sus planes, porque es una asignatura que aparece en contadas ocasiones y es optativa. También esperan que los nuevos másteres que deberán pasar los licenciados para poder ejercer como profesores de secundaria incluyan estos estudios. Porque si la lectura es escasa entre los niños de infantil y primaria lo es mucho más en las etapas superiores. Cuando el colorín colorado ha dejado de interesar a los adolescentes.

Fuente: C.M