Archive for the ‘Bierzo’ Category

¿Cual es la web lider de información en El Bierzo?

Martes, Mayo 25th, 2010

Esta mañana bajaba en el autobús a Madrid leyendo las últimas noticias de la comarca agregadas por www.bierzeame.com y me encontré con una noticia titulada “El ascenso propicia en la jornada de este lunes 12.256 visitas, registro histórico en Infobierzo”  que me llamó la atención y entré a verla, supongo que por deformación profesional.

Ya dentro de la noticia leí una serie de cosas que pueden inducir al error y que me gustaría aclarar.

La noticia asegura que “Ello refuerza el liderazgo de Infobierzo dentro de los diarios digitales de la Comarca y webs de información”.

Según la RAE esto es liderazgo:

1. m. liderato.

2. m. Situación de superioridad en que se halla una empresa, un producto o un sector económico, dentro de su ámbito.

Para realizar esta aseveración, el autor de la noticia se basa en los datos proporcionados por Alexa.com, que asegura que es “el website referente a nivel mundial en el análsis de posicionamiento y tráfico”… nada más lejos de la realidad.

Alexa es una web propiedad de Amazon.com que se dedica a hacer análisis estadísticos de visitas y genera un ranking global y por países de páginas webs según sus propios criterios, que para nada tienen que ver con la realidad de visitantes que tiene una página web.

También hay que decir que cuanto es mayor es el número de ranking de una web, más impreciso se vuelve, de hecho la propia Alexa no tiene en cuenta en sus gráficas las webs que se encuentran por debajo de la posición 100.000 del ranking global por este motivo.

¿Como recopila Alexa la información de quienes visitan una web? De una manera muy sencilla, con su propia barra de navegación disponible para Internet Explorer y Firefox y que cualquiera se puede descargar de manera gratuita de su web.

Esa barra de navegación envía a la web de Alexa.com información de que páginas visita un usuario, cuanto tiempo está en esas páginas, que ruta de navegación sigue por las webs, etc.

¿Y si el usuario que entra en las webs no tiene la barra de Alexa? Pues esa visita no se computa, ya que Alexa no tiene manera de obtener datos de ese usuario.

Los pocos o muchos datos de una web que obtiene Alexa los analiza de manera estadística sobre el total de datos de todas las webs que ha conseguido y de ahí viene su ranking, que por otra parte es relativamente fácil de falsear de manera consciente o inconsciente.

Una de las maneras más sencillas para escalar en este ranking suele ser la primera que te proponen en los miles de webs que hay indexadas en Google explicando como falsear los datos de Alexa, instalándote en tu propio navegador la barra de Alexa y poniendo tu web como página de inicio… y funciona, luego os daré la prueba de ello viendo datos reales de visitas en varias webs y comparándolo con su ranking en Alexa.

Si nos ceñimos a Alexa y, tal y como dice el artículo, comparamos encontraremos TopTen algunas de las webs de información de la comarca (sin contar webs de Ayuntamientos, etc):

Web                                Ranking Global               Ranking España

1.-eBierzo.com                  753,730 28,280

2.-Bierzeame.com            806,714                             41,658

3.-InfoBierzo.com            874,328                             29,572

4.-DiariodelBierzo.com  990,391                             27,868 (Esta web aparece dos veces en la lista ya que está también bajo el dominio www.elbierzodigital.com)

5.-BierzoPortal.com         1,269,898                         65,831

6.-BembibreDigital.com  1,398,499                        29,356

7.-ElBierzoDigital.com     1,458,283                       46,895

8.-BierzoDiario.com          2,153,170                       102,316

9.-BierzoTotal.com            14,478,831                    No Tiene

10.-BierzoHoy.com            18,521,262                   No Tiene

El líder a nivel global es eBierzo.com seguido de Bierzeame.com, y a nivel de España es DiariodelBierzo.com seguido de eBierzo.com… hasta BembibreDigital.com está en tercera posición, así que así de entrada, la noticia está mal, aunque es una costumbre muy extendida en este país el autoproclamarse líder de algo sin aportar todos los datos… no hay más que encender la tele y ver un poco de publicidad… Don Simón lider en zumos de naranja, Pascual líder en zumos de naranja… aquí todo dios es líder.

Pero como ya dije, la fiabilidad de estos datos es total y absolutamente ridícula, trabajo con un montón de gente dedicada al marketing, al SEM y al SEO y les ha entrado la risa cuando les he enseñado esta lista que he confeccionado un par de párrafos antes.

Me aseguran que hasta el EGM, basado en consultas puerta a puerta y análisis estadístico es más fiable que Alexa.

Pero como esta es la palabra de unas cuantas personas contra una web que lleva mucho tiempo funcionando, me voy a ir a los datos reales de visitas, páginas vistas, etc. de varias de estas webs.

Que nadie se llame a engaño, soy el propietario y administrador de www.bierzeame.com y www.bierzoportal.com que aparecen en la lista. En mis máquinas alojo www.elbierzodigital.com (alias www.diariodelbierzo.com) que es un cliente y amigo a quien he pedido permiso para hacer públicos los siguientes datos.

No pretendo desprestigiar o prestigiar a alguien en particular, personalmente no gano nada con la publicidad de mis webs por falta de tiempo, los beneficios vienen de la tecnología que hay detrás de estas webs, pero se me revuelven las tripas cuando cualquiera hace apología con el ranking de Alexa.

Más allá de las estimaciones a ojo de Alexa y los datos de Google Analytics (que en SEO cada día se usa menos según me comentan), están los logs de acceso a las webs, archivos que registran todas y cada una de las peticiones que la web recibe, ya sea para cargar el texto de una página, como las imágenes, animaciones, etc que la componen… los datos reales, sin estimaciones ni demás zarandajas.

En el artículo aseguran haber tenido 12.256 visitas (creo que según Google Analytics) para luego mezclarlo con otro dato de 5.000 visitantes que dicen tener a diario…

Maticemos, no es lo mismo visitas que visitantes, una visita es el acto de entrar a la web que realiza un visitante, dicho visitante puede hacer varias visitas al día, en un análisis de log normal nos encontraremos que la columna de visitas siempre muestra un número mayor que el de visitantes.

Según la metodología empleada por el analizador de logs que he usado para sacar los siguientes datos, un visitante es una dirección IP + una traza del navegador web empleado, es decir, que si desde una misma oficina entran 3 personas con 3 navegadores web diferentes, a pesar de que los 3 tendrán la misma dirección IP, las trazas del navegador los harán distinguibles y por tanto usuarios diferentes.

Como bien dice el artículo, si desde una oficina se conectan varios PC con la misma traza de navegador web, al log le resulta imposible diferenciarlos, no así a Google Analytics, que además de tener en cuenta los parámetros ya mencionados, añade una cookie única por cada usuario, de tal manera que si se conectan 10 personas de una oficina desde una misma dirección IP, para Google son 10 visitantes.

Perdón por el rollo, espero que lo he dejado claro, cualquier duda dejadme un comentario y os lo aclaro.

Y por fin… los datos:

InfoBierzo (según el artículo):

Domingo 23: Sin datos

Lunes 24:

Páginas vistas: Desconocido

Visitas: 12.256

Visitantes: Desconocido

Tráfico de datos servido: Desconocido

Visitantes únicos mensuales:

Mayo 2010 (estimación que dan en la noticia): 20.000

ElBierzoDigital:


Domingo 23:

Páginas vistas: 126.591

Visitas: 7.927

Visitantes: 4.960

Tráfico de datos servido: 19,5 GB

Lunes 24:

Páginas vistas: 73.619

Visitas: 10.398

Visitantes: 6.534

Tráfico de datos servido: 59,09 GB (las páginas con más visitas fueron las relativas a fotogalerías del partido, de ahí tanta transferencia de datos)

Visitantes únicos mensuales:

Mayo 2010 (de momento): 39.653

Abril 2010: 39.783

Bierzeame.com:

Domingo 23:

Páginas vistas: 49.641

Visitas: 3.784

Visitantes: 1.980

Tráfico de datos servido: 1,8 GB

Lunes 24:

Páginas vistas: 61.557

Visitas: 4.387

Visitantes: 2.319

Tráfico de datos servido: 3,7 GB

Visitantes únicos mensuales:

Mayo 2010 (de momento): 16.507

Abril 2010: 15.791

BierzoPortal.com:

Domingo 23:

Páginas vistas: 35.322

Visitas: 2.257

Visitantes: 1.328

Tráfico de datos servido: 2,8 GB

Lunes 24:

Páginas vistas: 54.612

Visitas: 3.947

Visitantes: 2.161

Tráfico de datos servido: 3,9 GB

Visitantes únicos mensuales:

Mayo 2010 (de momento): 13.454

Abril 2010: 13.488

Así que para ir concluyendo, con los datos del artículo y los obtenidos en estas tres webs directamente de los logs, el ranking sería:

Para el lunes 24 (Ranking de Visitas):

1.- InfoBierzo

2.- El Bierzo Digital

3.- Bierzeame

4.- BierzoPortal

Ranking Mensual (Ranking de Visitantes):

1.- El Bierzo Digital

2.- InfoBierzo

3.- Bierzeame

4.- BierzoPortal

Nota: Obviamente en este ranking con datos más reales que los absurdos y poco fiables datos de Alexa no aparecen ni BierzoDiario, ni BierzoHoy, ni BembibreDigital, etc. etc. etc. ya que ni dispongo de acceso a sus logs ni han publicado datos de tráfico ni estimaciones mensuales de usuarios únicos. Si el propietario de alguna web de información berciana cree que tiene más visitantes y quiere aparecer en esta lista que me pase los datos.

Resumiendo, que llama mucho la atención que a pesar de que ElBierzoDigital.com (ojo que si lo buscáis por diariodelbierzo.com sube mucho ya que es el dominio histórico de esta web y el que aún usa mucha gente) tiene el doble de visitantes únicos que InfoBierzo y casi el triple que Bierzeame, según el ranking de Alexa se encuentre muy por detrás de sus inmediatos competidores… lo cual nos lleva a la conclusión de que el ranking de Alexa es lo que por estos lares llamamos “ojo de buen cubero”…

Otra Nota: Si alguien duda de mi palabra (cosa que por mi dilatada trayectoria profesional y el prestigio que he alcanzado en Madrid sería una ofensa personal) o de los datos aquí aportados, siempre puede pedir a una empresa que se dedique a auditorías serias (Comcast, OJD… por poner un ejemplo) que audite los logs que he analizado para verificar que todo esto es cierto, estaré encantado de facilitárselo.

Making Of: Twiteando el Ascenso de la Deportiva – Estado de los servicios on-line de la comarca

Lunes, Mayo 24th, 2010

Se acabó, la Deportiva Ponferradina ha alcanzado el sueño de volver a estar en Segunda División y, aunque ha sido un trabajo de chinos, he twiteado el partido casi en su totalidad desde la cuenta de @Bierzeame.

Lo divertido de todo esto es que no me gusta el fútbol, y que lo he retransmitido desde la comodidad del sofá de mi casa en Madrid… quería haber ido, pero el partido era muy tarde y no me apetecía pegarme la paliza de volver a Madrid de noche para el madrugón del lunes.

Para conseguir twitear lo que estaba pasando primero eché mano de www.deporte8.com, en la tele grande a través de un ordenador conectado con Windows XP… pero entre los cortes que hubo ya que, según ellos, había poca cobertura 3G de Movistar en el estadio del Toralín, y que al final se cortaba por completo la transmisión y/o llegaba con varios minutos de retraso, opté por dejarlo ahí de apoyo en espera de que volveira la señal.

También traté de conectarme a ellos desde el portátil, pero parece que el audio de la señal no quería ir en Ubuntu Linux…

La segunda opción fué de tirar de emisoras de radio on-line. Radio Marca León y Onda Bierzo directamente no les funcionaba la emisión on-line, la web de Radio Bierzo estaba colapsada y no respondía, al final conseguí conectar con ella en la prórroga, pero duro hasta la mitad de la segunda parte y luego volvió a morir.

La tercera opción fué tirar de las retransmisiones on-line vía texto de www.leonoticias.com y www.elbierzodigital.com.

LeoNoticias funcionó medianamente bien hasta llegar a la prórroga que dejó de actualizarse, ElBierzoDigital funcionó perfectamente todo el tiempo, pero los comentarios fueron mínimos y muy pobres… Las dos prórrogas las resumieron en 4 escuetas frases de “comienza la prórroga, fin de la primera parte, inicio de la segunda parte y un no vamos a los penalties”.

Al final entre la señal de Deporte8 que se iba más que venía, un poco de Radio Bierzo, otro poco de ElBierzoDigital y LeoNoticias y los twits que @BegoBlanco enviaba desde El Toralín, logré hacer una retransmisión lo más decente que pude.

Lo triste de todo esto es que solo ha habido un servicio en Internet capaz de soportar la carga de tráfico que el partido estaba generando, ElBierzoDigital.com, que es cliente de BierzoPortal y se aloja en sus servidores… lo cual ha sido una prueba de fuego para comprobar que tal funcionaba el nuevo esquema en la nube.

Deporte8.com caído el servicio de video, era imposible conectarse, ni desde 3G ni desde dos ADSL diferentes (Telefónica y Vodafone)

RadioBierzo.com con la web caída y la Radio Online funcionando a tirones.

LeoNoticias.com mostraba más a menudo el mensaje (literal) “No puedo conectar” o directamente un error de que la web estaba caída que el texto de la noticia de la restransmisión del partido.

ElBierzoDigital, Bierzeame.com y BierzoPortal.com mostraron varios errores de que no podía conectar con la base de datos durante la prórroga, el error duró lo justo que tardé en tunear un poco más MySQL para que soportase más conexiones simultáneas… ni 5 minutos con un error que se dió en apenas el 2% de las conexiones… y han sido un montón simultáneas, veremos mañana los logs brutales ya procesados.

Como muestra un botón, este gráfico representa el tráfico con Internet de los frontales (hay que sumar más o menos 1 a la hora que muestra la gráfica, a ver si lo pongo bien).

El pico es más o menos en la tanda de penalties y está rozando los 100 Mbps de ancho de banda, que no está nada mal, sobre todo en Domingo cuando el tráfico baja bastante.

De potencia de cálculo fuimos sobrados, los frontales no pasaron de un 43% de pico máximo de carga, y la bd apenas llegó al 17%, a pesar de ello había preparados 4 nodos adicionales para añadirse a los frontales en caso de sobrepasar el 80% de carga.

La carga habría sido inferior de haber tenido tiempo de migrar ElBierzoDigital.com del servidor web Apache al Nginx en el que ya están el resto de las webs alojadas, pero sus tripas son más complejas y hay que hacerlo con más calma y estar seguro de que todo va al 100% antes.

De todos modos, los frontales disponen de un Varnish que, junto con el APC de PHP, ha funcionado a las mil maravillas reduciendo el consumo de máquina por parte de Apache.

Resumiendo, que para el día a día los servicios on-line de la comarca están bien dimensionados, pero para eventos puntuales como el ascenso de la Deportiva, se han quedado casi todos bastante cortos.

Actualización: La Web de la SD Ponferradina tampoco está dimensionada y se ha caído: http://yfrog.com/0y6qpp

Cuentas de correo @soydelbierzo.com

Lunes, Mayo 17th, 2010

Quiero empezar la semana con un regalo.

He movido el correo de este dominio a Google Apps.

Eso significa que podemos disfrutar de los servicios de Google (Gmail, Calendar, Docs y Sites) bajo este dominio.

Tengo 48 cuentas de email libres del estilo tunombre@soydelbierzo.com para l@s primer@s 48 bercian@s que las soliciten.

El proceso es simple, mándame un mensaje directo a través de Twitter (http://twitter.com/soydelbierzo)  con el nombre que quieres antes de la @ y te envío tu clave eventual (el sistema te pedirá que la cambies la primera vez que te conectes).

Más de 7 GB de Email con opción de leerlo desde programas de correo como outlook ó TheBat y también vía webmail a través de http://correo.soydelbierzo.com, más otros 2 GB de almacenamiento para archivos, documentos, etc.

Todo a través de conexiones seguras SSL.

NOTA: Los miembros bercianos del #clubF en Twitter tendrán preferencia.

Cloud Hosting: Bierzeame se va a la nube

Viernes, Mayo 7th, 2010

BierzoPortal.com y sus webs hermanas (Bierzeame, Bierzoweb, BierzoPedia, Bierlaval, etc…) evolucionan hacia el siguiente paso en hosting de páginas web, la nube, para celebrar los 12 años on-line de este proyecto.

Los comienzos fueron humildes, una cuenta de hosting en un proveedor barato fue suficiente para almacenar la primera versión de BierzoPortal.com, unas simples páginas estáticas en html.

Poco a poco el proyecto empezó a crecer en contenidos, visitas y tecnología de edición de contenidos, la misma que ha sido empleada en webs como www.20minutos.es y www.guiadelocio.com… tecnología 100% berciana.

Las webs de BierzoPortal y las de sus clientes se alojan en servidores dedicados con toda la información duplicada para evitar pérdidas de datos y tiempo sin servicio en caso de avería y con un sistema de copia de seguridad bastante simple, amén de tener el tráfico balanceado entre ambas máquinas (o enviando todo el tráfico solo a una si la otra cae).

Y ahora comenzamos nueva andadura tecnológica, que de cara al usuario no supone apenas ninguna diferencia, pero que internamente supone una mejora y más tranquilidad con un coste operativo casi idéntico a tener los dos servidores dedicados, el Cloud Hosting.

El proveedor seleccionado no alquila servidores, alquila nodos de dos tipos, los que incluyen potencia de procesador, memoria y almacenamiento y otros solo de almacenamiento de datos. Los precios son muy competitivos y bastante más económicos que la plataforma EC2 de Amazon.

Poseen 4 centros de datos y los nodos y las vps que se crean con ellos no están limitados a una máquina física, por lo que en caso de que haya un fallo de hardware, la nube se encarga de mover los nodos y la vps a otras máquinas con menos carga de trabajo y que no están dando problemas.

Con estos nodos uno puede construirse servidores virtuales a medida y en apenas unos segundos tenerlo operativo con el sistema operativo que quiera de la amplia selección que tienen disponible (CentOS, Turnkey Linux, Ubuntu, FreeBSD, etc. pero nada de Windows de momento) y con su propia ip fija no compartida.

Adicionalmente permite adquirir direcciones IP públicas, algo más que interesante dado que si borramos nuestra vps y creamos una nueva, perderíamos la IP anterior y se nos asignaría una nueva, así que mejor tener IP propias para ponerlas donde y cuando queramos.

En caso de quedarnos cortos con la configuración de la VPS  podemos añadirle nodos a placer para aumentar su potencia, o reducirla eliminando nodos.

El proceso de adicción de nodos requiere un reinicio de la vps, añadir más procesador y más memoria lleva unos pocos segundos, si se trata de añadir espacio de almacenamiento, dependiendo de la cantidad que ya tenga la vps y de lo ocupada que esté, puede durar hasta 60 minutos.

Por esta razón puedes añadir memoria y procesador y programar que se añada el disco a una hora en suponga un problema menor el tener la vps apagada mientras se amplía.

Adicionalmente disponen de un CDN (Content Delivery Network) en la que cargar los contenidos estáticos y video para streaming en formato Flash en la que pagas por lo que consumes de ancho de banda, el almacenamiento es gratuito.

Para clientes más exigentes pueden solicitar usar Akamai como CDN.

Finalmente, disponen de nodos de almacenamiento Fusion IO, mucho más caros, pero se trata de discos de estado sólido que triplican en velocidad a los más rápidos que tiene Intel ahora mismo en el mercado, ideales para base de datos con mucha carga de transacciones.

El esquema desplegado en esta nube es el siguiente:

1.- Una VPS funcionando como balanceadora de carga y proxy caché con Nginx y Wackamole, hay una segunda VPS idéntica esperando para tomar el control en caso de que algún fallo en la primera la deje colgada.

2.- Dos VPS con Apache 2 y PHP con la carpeta de datos sincronizada entre ambos, cuando tenga tiempo de estudiarme bien como funcionan los rewrites en Nginx, este substituirá a Apache y Varnish se hará cargo de la parte de cacheado en los frontales del punto 1.

3.- Dos VPS para base de datos con MariaDB, un fork de Mysql orientado a InnoDB con las extensiones XtraDB de Percona. Uno actúa como maestro y el otro como esclavo, en caso de caída del maestro se mueve la IP interna al esclavo para que haga las labores del maestro.

4.- En un segundo data center una última VPS de servidor de backup con el software de R1 Enterprise CDP con el que, en caso de pérdida de datos, se perderían unos pocos minutos de trabajo  y no horas o días, además de permitir una restauración “bare-metal”, capaz de restaurar una máquina entera sin necesidad de instalar previamente de nuevo el sistema operativo. También permite ofrecer backup a clientes tan solo comprando licencias del agente de backup adicionales… y más capacidad de almacenamiento.

De las tres opciones de backup que ofrecían, esta era la más cara en cuanto a licencia de software y la necesidad de adquirir nodos adicionales para almacenar las copias.

Otra opcion es el snapshot, que saca una “fotografía diaria” del vps, otra semanal y otra mensual hasta rellenar 4 slots disponibles, pero que solo permite restaurar el snapshot de golpe y no archivos sueltos.

La tercera opción es que te dan espacio de almacenamiento contra el que hacer rsync o usar alguna herramienta tipo Duplicity, se pueden restaurar archivos sueltos, pero solo tenemos la última versión que se haya sincronizado.

Y todo esto sustentado contra un sistema de almacenamiento SAN en Raid 10 y un uplink de 1 Gbps

Gráficamente sería algo más o menos así:

Pincha en la imagen para ampliar
Y todo esto monitorizado desde un vps (no en cloud hosting) en otro proveedor diferente en un datacenter en Francia.
Ahora mismo ya están migradas Bierzeame, Bierzoportal, Bierzopedia y este blog que ha nacido directamente aquí, en los próximos días se vendrán Bierlaval y las webs de los clientes.

Iniciando…

Miércoles, Mayo 5th, 2010

Hace unos 15 años que dejé atrás Ponferrada y El Bierzo para venir a trabajar a Madrid… hay días en que me liaría la manta a la cabeza para volver… pero ya tengo hecha mi vida aquí, aunque no pierdo el contacto con la tierra que tanta morriña me provoca.

Al fin y al cabo Madrid es el barrio más grande en el extrarradio de Ponferrada (aunque ellos aún no lo sepan), pegas una patada y aparece un berciano… ayuntamiento, medios de comunicación… en cualquier lugar, en cualquier empresa hay un berciano.

Recuerdo la ciudad que dejé, sucia, desordenada, sin apenas oferta cultural, con una vergonzosa montaña de escoria de carbón… nada parecido a lo que hay ahora, donde da gusto escaparse un fin de semana para ver a la familia, a los amigos y saludar al Castillo y a la Virgen de la Encina, la misma que corona mi mesa de trabajo y se recorta al atardecer contra la bandera de El Bierzo que decora la pared.

Este blog no pretende ser sobre El Bierzo o Madrid, ni todo lo contrario, simplemente va a ser una válvula de escape de un berciano que emigró con lágrimas en los ojos para seguir un sueño, las mismas lágrimas que brotan al escuchar a Richard y Flaviano interpretar “Nostalgia”.

P.D.: Soy analista de sistemas… informático para los amigos, no esperéis que mi prosa sea buena, o que no os deje ciegos con alguna falta garrafal de ortografía. Espero vuestra indulgencia en estos casos.