12 diciembre 2007

Yo sé más que tú y además soy tu proveedor de hosting.

Ayer fue un día un poco rarillo, las cosas se iban estropeando poco a poco. Nada más llegué a la oficina me comentaron que no funcionaba un foro. Hice un par de pings a la máquina y me respondía, pero no me respondía ningún puerto más, ni http, ni mysql, ni ssh, ni nada de nada.

La analizo con nmap y el mensaje que me da es que presumiblemente está apagada.

Hago un traceroute hasta la ip, y veo cómo llega a destino aunque en me da un mensaje !X. Busco este mensaje en el man del traceroute y me indica que significa communication administratively prohibited (comunicación prohibida administrativamente). Busco en internet esto y me encuentro con el RFC1812 y me indica que ese mensaje es el número 13 y además que se produce cuando un router no puede reenviar un paquete debido a filtros administrativos.

Además de esta información le eché un ojo a las gráficas de zabbix, que lógicamente estaban en blanco, pero las amplié a ocho horas antes, y ¡oh, sorpresa!, todo está correcto, sin subidas, ni sobrecargas, ni consumos, ni nada, y repentinamente se corta la emisión de gráficas.

Me puse en contacto tres veces con el soporte técnico, las conversaciones fueron más o menos:
  • Primera (10:45 am)
Yo: "Hola, que parece que se me ha caído un servidor hace unas horas, no responde ningún servicio, aunque hace ping. Si intentan hacer ssh no lo hagan al puerto 22, háganlo al 1111 que lo tengo configurado ahí"
Soporte: "Dime la ip que vamos a mirar"
Yo: "Pero si se ha bloqueado,..., con que me lo reinicien ya está"
Soporte: "Seguramente será lo que hagamos".
Yo: "Vale gracias".
  • Segunda (11:15 am)
Yo: "Oiga que soy el de antes, que he mirado unas cosilla y por los resultados que tengo pues no tengo claro que se haya caído" (le cuento lo anterior).
Soporte: "Ese mensaje de administrativamente prohibido no vale para nada".
Yo: "Que lo he visto en un rfc"
Soporte: "Da igual, además si no lo contratas no tenemos firewall delante"
Yo: "Ya, pero a lo mejor es el switch"
Soporte: "Que no, que no que estás equivocado"
Yo: "Vale, y si estoy equivocado por qué no me funciona todavía?"
Soporte: "Voy a mirar luego hablamos"
  • Tercera (11:45 am)
Yo: "Hola, que soy el de antes. ¿Me pueden decir algo?, es que para un reinicio y que no funcione me temo lo peor"
Soporte: "Ah sí, precisamente ahora te iba a llamar" (qué casualidad).
Soporte: "Es que no me has dicho exactamente qué pasa"
Yo: "Pues que no responde a nada, sólo al ping"
Sporte: "Ah, sí"
Sporte:" ¿Me puedes decir la contraseña?"
Yo: "Sí claro, pero tiene que entrar como usuario sin privilegios y luego como root"
Soporte: "Oye, que el puerto 22 está cerrado"
Yo: "Le dije en la primera conversación que corre en el 1111"
Soporte: "No me lo dijiste"
Yo: "Vale, no se lo dije"
Sopote: "Da igual, el operador va a entrar directamente a la máquina. ¿Tienes algún firewall?"
Yo: "Yo no he configurado ninguno, pero este equipo se ha configurado hace unos cinco meses y no ha tenido reinicios, así que a lo mejor tiene el firewall del sistema y me haya olvidado de quitarlo de los servicios de arranque".
Soporte: "Ya está, había un firewall" (la culpa es tuya, que lo sé, que yo soy muy listo).
Yo: "Vale, funciona, perdón por las molestias, ahora mismo quito el firewall"
Soporte:"Sí claro, service iptables stop "(pensando, encima le ayudo)
Yo: "Sí claro" (pensando, este es idiota, y lo reinicio y me vuelve a pasar lo mismo).

Ya una vez funcionando estuve revisándolo todo y aparentemente todo iba bien, no había logs raros, lo cual me hace pensar que el problema de madrugada vino del proveedor, aunque la solución del reinicio sin mirar nada fue la que finalmente activó el firewall y pese a que ellos hubieran resuelto su parte, se había estropeado la mía, lo cual abrió la puerta a soporte técnico para insinuar como soy mejor que tú, paso de atender a nada de lo que me digas, lo cual realmente me da exactamente igual, pero me fastidia que por culpa de patanes así se ralenticen las operaciones de soporte, porque al final los únicos que lo sufrimos somos los usuarios.

No hay comentarios: