Novedades en la categoría Tecnología
En 1981 se publica uno de los documentos más importantes de la internet, el famoso RFC 793, que define el protocolo TCP, que es el principal protocolo de internet, y que es la base de la mayoría de los protocolos usados en la red.
En este documento Jon Postel escribe, lo que ha llegado a conocerse como el Principio de Robustez, o la Ley de Postel:
Las implementaciones TCP deben seguir un principio genera del robustez: ser conservador en lo que haces, ser liberal en lo que aceptas de otros.
TCP implementations will follow a general principle of robustness: be conservative in what you do, be liberal in what you accept from others.
Dependiendo de tu sistema valórico, encontrarás el consejo de Postel como algo bueno, e incluso recomendable para otros aspectos de la vida, no sólo en los protocolos de transmisión de datos.
Este principio ha sido criticado por cierto, porque aparentemenente promueve una tolerancia pasiva, o por ser demasiado liberal, y eventualmente permite aplicaciones inseguras.
La verdad es que no era la intención de Postel ser demasiado permisivo con los protocolos, y decir que las validaciones no eran necesarias. Pero, efectivamente, el principio de robustez ha sido mal interpretado, y eso nos ha generado muchos problemas, principalmente con la seguridad de las aplicaciones.
Pero no hay que olvidar que el principio de robustez tiene una mirada puesta en las necesidades de los usuarios finales.
En la actualidad esto tiende a olvidarse, y muchos desarrolladores, sobre todo los más rígidos (y sobre todo los más jóvenes), exigen que se cumplan los estándares, sin ninguna excepción, aunque eso atente contra las necesidades de los usuarios.
Consideren el caso de HTML. ¡Un verdadero caos! hay cientos de implementaciones de HTML, con miles de bugs, parches y soluciones ad-hoc incrustadas en la web y en los navegadores de internet.
En algún momento se optó por establecer estándares basados en XML como la solución definitiva del problema, y con esto se quiebró la Ley de Postel.
XML es un protocolo estricto. En teoría un documento XML inválido no debe ser aceptado. Pero habrán documentos inválidos, eso es casi inevitable.
Un ejemplo clásico es lo que pasa con la sigla "AT&T", de acuerdo a la especificación XML se debe escribir: "AT&T", pero eventualmente alguien escribirá "AT&T". Las aplicaciones que privilegien los deseos de los usuarios y acepten documentos XML escritos en forma no tan estricta (piensen en los varios tipos de browsers disponibles), terminarán imponiéndose (porque son aplicaciones más robustas).
XML nos pide que rompamos el principio de Postel, XML exige que seamos intolerantes con lo que recibimos. Esto puede atentar contra las necesidades del usuario.
Ese es un problema que aparece también en protocolos como SOAP, y en general casi todas las recomendaciones de interoperatividad basados en estándares rígidos, como XML. "La ley de Postel no acepta excepciones", cuando vamos contra este principio el que lo paga eventualmente es el usuario.
¿Qué opinan ustedes? ¿conocen otras situaciones donde al tratar de romper este principio perjudicamos la experiencia del usuario?
Si ustedes no alcanzan a leer este post es porque el mundo explotó, o fuimos absorbidos por un agujero negro, porque el 10 de septiembre es la fecha en que se enciende el LHC.
Como estoy seguro que no pasará nada, les vuelvo a publicar lo que escribí al respecto en julio pasado.
Este año se acaba el mundo (otra vez).
Bueno, ya hemos hablado sobre el fin del mundo por culpa de la tecnología. Pero esta nueva "amenaza" es bastante interesante.
La causa sería la activación del Large Hadron Collider, el acelerador de partículas más grande construido hasta ahora. El LHC es el proyecto más importante de la Organización Europea para la Investigación Nuclear (CERN).
En el CERN es donde nació la Web, que fue un proyecto propuesto por Tim Berners Lee con el fin de compartir el trabajo de los investigadores a través del mundo usando internet, pero esa es otra historia.
El CERN es el mayor centro de investigación en física nuclear del mundo, y el LHC es el experimiento más importante en ejecución en este momento.
En esencia el LHC es un muy frio tunel (a 2 grados Kelvin, 271 grados centigrados bajo cero) de unos 27 kilómetros de circunferencia, donde colisionarán protones a muy altas energías.
¿Para qué?
Con el fin de encontrar y observar por primera vez una partícula predicha, pero aún no observada por el modelo estándar de las partículas elementales. Se trata del "Bosón de Higg":http://es.wikipedia.org/wiki/Bos%C3%B3n_de_Higgs.
El experimento permitirá confirmar la existencia de esta partícula elemental, y con esto saber por qué todos los cuerpos tienen masa. Por que sabemos que todos los cuerpos tienen masa, y que esta es equivalente a la energía, pero no sabemos en realidad qué es la masa, y cómo los cuerpos la adquieren.
Por esta razón que incluso un permio Nobel llegó a denominarla la "Partícula de Dios".
En realidad el LHC es una máquina extraordinaria, y peligrosa, pero no en el sentido de poder destruir el mundo. Efectivamente, la energía interior es enorme, y si algo falla se puede producir una explosión, que probablemente pueda destruir el laboratorio, pero ese no es tipo de catástrofe que andan anunciando algunos.
Siempre que el hombre se ha enfrentado a este tipo de experimentos surgen los temores más catastróficos. Cuando se probó el primer artefacto nuclear algunos especularon que la explosión de la primera bomba atómica quemaría la atmósfera. De hecho, cuando se iba a romper la barrera del sonido también se habló de la destrucción de la atmósfera.
En este caso se ha especulado que durante el experimento se podrían formar agujeros negros estables que se tragarían nuestro planeta. O que surja materia exótica, que vaporizaría a la Tierra en segundos.
Los científicos han medido los riesgos probables, y han hecho dos estudios, el primero en 2003, y uno muy reciente, que permiten descartar estos escenarios catastróficos.
La verdad es que se han observado en la naturaleza la caida de rayos cósmicos con 100 millones de veces más energía que la generada en el LHC, y nunca se ha visto que se formen agujeros negros ni hasta ahora se ha quemado nuestro planeta.
Bueno, este debe ser cómo el décimo fin del mundo que me toca presenciar, así que no me preocupo mucho, puede que termine pasando algo como lo que describen en xkcd:
traducción
* El Large Hadron Collider, CERN
* Okey, el momento de la verdad
* VVVVVRRRRMMMMMMM
* ¿Viste el Bosón de Higgs?
* NOP
* Uh...
* Bueno entonces...
* Hasta que los teóricos vuelvan, ¿te parece que le demos a unas palomas con el rayo de protones?
* Ya estoy en eso. Cool! Ya le dí cancer a un helicóptero.
Google ha anunciado que mañana liberará Chrome, su propio navegador de internet.
Hoy partió con el lanzamiento de un comic book en que explica el diseño y las características de este nuevo navegador.
Continúo con mi lectura del libro Cómo Funciona la Web, publicado por el Centro de Investigación de la Web de la Universidad de Chile.
Esta vez me voy a concentrar en la parte del libro escrita por Ricardo Baeza, "La Anatomía de la Web", un capítulo muy bueno, con mucha información y estadísticas interesantes, sobretodo cuando describe la estructura de la web chilena.
Aunque hay algunos errores menores en el capítulo, como por ejemplo, se define un terabyte como un billón de megabytes (en realidad un terabyte es un billón de bytes), los resultados expuestos son muy interesantes.
Baeza discute los distintos análisis que se han hecho en forma experimental para tratar de descubrir la estructura de la web.
Si consideramos que la estructura de la web tendrá la forma de un grafo, este representa una estructura sintetizada en la siguiente figura:
Esta estructura se extrajo del primer estudio realizado por Altavista, en 1999, considerando unas 200 millones de páginas, y unos 1.500 millones de enlaces, lo que correspondía a un 25% de la web de esa época. No tenemos estudios más nuevos, porque en realidad procesar y almacenar un grafo de este tamaño es una tarea formidable, en términos computacionales. Piensen que la web al año 2006 tenía más de 20.000 millones de páginas.
Las páginas de la izquierda (entrada) son las que referencias páginas dentro del núcleo, pero no son referenciadas de vuelta. Las de la derecha son páginas referenciadas desde el núcleo, pero sin referencias de vuelta hacia el núcleo.
Hay islas, es decir, páginas aisladas del resto. Los tentáculos son caminos sin salidas que salen desde las páginas en los extremos. Y tenemos túneles que conectan páginas de la izquierda con páginas de la derecha.
El núcleo está compuesto por unas 56 millones de páginas, a la izquierda hay 43 millones de páginas, al igual que a la derecha. En las islas tenemos unos 17 millones de páginas.
Ricardo Baeza y su equipo de investigación condujeron un estudio similar con las páginas en el dominio .cl.
Descubrieron una estructura similar. Las páginas de la izquierda corresponden a las páginas más nuevas, que no son demasiado conocidas, y que al tener éxito pasan al nucleo de la web, donde se encuentran las páginas más consolidadas. Las páginas de la derecha corresponden a páginas más antiguas, que no enlazan a las páginas del centro de la web, simplemente porque en su época esas páginas no existían.
También corresponden a páginas que no tienen enlaces externos, pero que se han preocupado de posicionarse bien mediante enlaces publicitarios. En Chile, la proporción de islas es mucho mayor que en el estudio original de Altavista.
La dinámica de formación de la web es bien violenta, de acuerdo al autor. Más de la mitad de la Web ha nacido en los últimos seis meses. De ese crecimiento, el 20% se genera a través de la replicación de sitios espejos u otro tipo de copias (incluyendo el plagio). La muerte de las páginas en internet es también alta. Se estima que la vida media de una página web es de unos tres meses.
La Anatomía de la Web Chilena
El último estudio a la web chilena es del año 2006, y arrojó estos resultados:
- La web chilena tiene 170.000 sitios, con más de 7 millones de páginas.
- Un sitio promedio tiene 43 páginas, y un peso promedio de 0,304 MiB.
- Hay un promedio de 1,56 referencias desde otros sitios.
- Cerca de un cuarto de las páginas chilenas fueron actualizadas en el último año.
Con respecto al contenido
- De todos los sitios, el 20% de los sitios más grandes contiene el 99% de la información, en la web chilena.
- Cerca del 21% de los sitios web son "invisibles" a los buscadores porque utilizan tecnologías como flash y javascript.
- Cerca del 5% de los enlaces ya no existe.
La tecnología usada es muy reveladora:
- El 66.7% usa Apache como servidor Web, seguido de Microsoft IIS con un 32.8%.
- El sistema operativo más usado es Unix, con un 48.5%, seguido por Microsoft Windows con un 38.5% y Linux con un 12%.
- PHP es el generador de páginas dinámicas más usado, con un 75% de la participación.
- PDF es el formato de documento electrónico más usado, con el 53%, seguido de XML con un 21%.
- Los chilenos parece que somos muy amigos del open source, porque de acuerdo al estudio "Aproximadamente hay una disponibilidad del doble de archivos con paquetes de software para Linux que para Windows en la Web chilena".
Me gustaría saber cómo ha variado esto en estos dos últimos años, con la explosión de contenidos debido a la Web 2.0. Aunque esta información es muy interesante y reveladora.
Hace tiempo que tenía pendiente este video, pero hoy al leer una excelente nota de mi amigo Gustavo Suhit (quién tiene un muy buen blog tecnológico), recordé que debía publicarla, y creo que complementa muy bien su artículo.
Este video contiene la mejor demostración para explicar qué es y para que sirve la biometría.
A pesar de ser una animación, acá se demuestra tecnología disponible en la actualidad, pero además muestra la forma más efectiva de usar esta tecnología, la biometría multimodal, que hace practicamente imposible suplantar la identidad de una persona. En el video tenemos lectura de huella, geometría de la mano, reconocimiento del iris (o retina), la firma vocal, y el uso de una clave de acceso, la posibilidad de suplantar todos esos elementos a la vez, es, para todos los efectos prácticos, nula (claro que a un costo, al que sólo puede acceder una gran diseñadora de ropa para superheroes).
Con respecto al nuevo DELL-E Slim, comenta Alan Kay en la lista IAEP :
Nice irony, given that it was Dell's refusal to make such a machine that got OLPC started ...
Linda ironía, dado que fue el rechazo de Dell de construir esa máquina la que provocó el inicio de OLPC...
El viernes 25, Sam Ramji en el contexto de la OSCON, nos sorprendió con otra nota sobre el apoyo oficial que está dando Microsoft al proyecto Apache, se trata de financiamiento en este caso, porque Microsoft se ha convertido en sponsor platinum la Apache Software Foundation (ASF).
Algunas aclaraciones sobre que significa este apoyo financiero, para aquellos que se sientan despitados con las notas periodisticas:
- Todos los sponsors platinum aportan la misma cantidad de dinero, al menos 100.000 dolares al año, y se sabe que hay al menos 3 patrocinadores en esta categoría: Google, Microsoft y Yahoo.
- Efectivamente, la licencia Apache, permite incorporar el código fuente dentro de un producto comercial cerrado sin necesidad de publicar los códigos fuente, un modelo que es visto con buenos ojos por los sectores más "conservadores" dentro de Microsoft.
history.forward()
El título de la nota de Ramji es muy claro: history.forward().
Pero esta es noticia que no nos sorprende, al menos no debería sorprender a los lectores de este blog.
Hace rato que venimos informando de cómo se está integrando el opensource dentro de Microsoft. No ha sido un proceso fácil, por cierto, pero es algo inevitable. Yo creo que hay mucha actitud pragmática, y la necesidad de adaptarse para sobrevivir en un nuevo escenario.
Como un ejemplo, Ramji nos cuenta que el equipo de Microsoft SQL Server desarrolló un driver nativo para PHP, y en los laboratorios opensource han parchado AdoDB para que use este nuevo driver, probándolo con más de 100 aplicaciones PHP comunitarias.
Hace unos meses atrás el equipo del servidor apache visitó Microsoft con el fin de obtener información técnica interna de primera fuente. Tuvieron acceso amplio y colaboraron en forma abierta con el equipo de Windows 2008 y de IIS.
¿Está Microsoft comprometiéndose seriamente con el opensource? No es menor que hayan colaborado en un proyecto que usa la LGPL, algo que hace un tiempo atrás habría parecido impensable. Por supuesto uno puede ver esto de manera cínica, o decir que Microsoft ha sido obligado a seguir este camino. La verdad es que en parte es eso, pero también hay una necesidad de negocios sumamente pragmática.
Hay que seguir observando el curso de estas acciones. Por supuesto que en muchas partes, sobre todo en nuestro medio local, las viejas y cancinas discusiones bizantinas continuarán, pero es claro que hay un segmento importante de Microsoft que está en otra actitud más abierta y colaborativa, probablemente porque es inevitable, y están reconociendo que el opensource será una de las fuerzas dominantes de nuestra industria en el futuro.

