Bricolaje Informático

Desde hace años, cuando empecé en esto de la informática, he tenido bastantes problemas relacionados con el hardware, unos eran triviales y otros algo mas sutiles, presentando estos últimos un diagnóstico que a veces no quedaba del todo claro, teniendo que recurrir a pruebas por descarte o ensayo y error intercambiando componentes de varias máquinas.

Mi último episodio comenzó a primeros del més de Mayo en el PC de escritorio, que para poner en contexto tiene como principales componentes:

Como suele ser habitual en estos casos, los problemas llegan sin previo aviso, de repente congelación del sistema, ni ratón ni teclado responden, teniendo que echar mano a la Magic SysRq Key REISUB, algo no muy frecuente pero que puede pasar. Despues de volver a iniciar, al rato de estar funcionando el equipo se reinicia solo de repente, quedando claro que algo no va bien, ¿problemas de memoria?.

Al volver a arrancar surge otra sorpresa, problemas con GRUB, mostrando en cada arranque y de forma aleatoria mensajes como “error: hd0,msdos2 out of disk …”, “GRUB Loadgin Read Error”, etc. ¿problemas de disco duro?. En alguno de estos arranques, se inicia GRUB correctamente, cosiguiendo comenzar la carga del sistema operativo, sin embargo la trama se complica, Kernel Panic – not syncing: VFS: Unable to mount root fs on unknown-block y nuevo reinicio forzoso.

Entre todos estos arranques, en alguno de ellos consigo arrancar el sistema correctamente pero al poco rato o se queda congelado o se reinicia solo, entre tanto surge otro problema mas a la lista, durante la carga de la BIOS aparecen unas franjas verticales en la pantalla, ¿la tarjeta gráfica también?.

Este comportamiento aleatorio hace pensar que los problemas procedan de un módulo de memoría dañado, así que procedemos a pasar memtest86 y efectivamente, al llegar al 23% del test #2 el slot0 muestra un número de errores que crece indefinidamente, por lo que paro el equipo y retiro el presunto módulo dañado, vuelvo a arrancar y a pasar mentest86 y ocurre exactamente el mismo problema solo que en el slot1. Pruebo a colocar ambos módulos invirtiendo las ranuras, tanto con los dos conectados como individualmente con todas las combinaciones posibles, obteniendo el mismo resultado, ¿ambos módulos de memoria dañados?, aunque posible sería bastante extraño, aun así pruebo con otro módulo de memoría prestado de otra máquina, y todo sigue igual, por lo que empezaba a imponerse otro presunto culpable, la placa base.

placa.base.estropeada

Una vez que parecía localizada la avería, solo quedaba remplazar la placa por otra con un socket 478, compatible con mi Pentium 4 y en vias de extinción. Como ya dije todo esto ocurrió durante el mes de Mayo, un mal momento para ponerse a trastear, con exámenes a la vuelta de la esquina, por lo que decicí posponerlo y arreglarme con un PC que usaba como servidor de archivos Samba, descargas con Mldonkey, etc, siendo solo preciso instalar las X.Org, KDE y unos cuantos programas mas, ni si quiera tenia que mover mis archivos ya que tenía sincronizados con unison los directorios del $HOME del PC averiado y el netbook con el $HOME del servidor, el cual se encontraba en un volumen lógico LVM sobre un par de discos en RAID 1, sirviéndome así de backup.

No ha sido hasta el mes de Julio, cuando me propuse resucitar el PC averiado, buscando una placa base nueva que cumpliese con los requisitos necesarios para poder reutilizar el resto de componentes, es decir, Socket 478, memoría DDR2 y slot PCIe. Como ya dije, este socket va camino de extinguirse, siendo AsRock el único fabricante que encontré que lo incorpora, por lo que al final la única alternativa era precisamente el mismo modelo de placa base que estaba reemplazando, lo cual no transmite mucha confianza la verdad, pero ¿que remedio?.

placa.base.caja placa.base.nueva

Ahora surge una disyuntiva, seguir utilizando el procesador Pentium 4 3.2 GHz Prescott o el Pentium 4 2.8 GHz Northwood del servidor y sustituirlo por un Pentium 4 1.8 GHz que tengo, el primero pese a rendir algo mas alcanza temperaturas “inquietantes” sobre todo en esta época del año, teniendo que contrarestarlo bien con un ventilador cuyas revoluciones hagan creer que estás a bordo de un Boeing 747 o usando un disipador algo “sobredimensionado” como el de a continuación con 4 heatpipes, que es el que venia usando hasta ahora con el Prescott:

intel.p4.3.2.ghz ventilador.cpu.socket.478

Haciendo un balance entre el rendimiento y la temperatura de ambos procesadores, al final he instalado el Pentium 4 de 2.8 GHz con un ventilador/disipador de un tamaño mas razonable y silencioso. A continuación ensamblamos los componentes para comprobar que todo va bien:

sistema.completo.con.grafica

Arranco el sistema y primer susto, al cargar la BIOS veo en la pantalla las mismas franjas verticales de hace meses, se carga el GRUB, iniciamos el sistema operativo y cuando arrancan las X.Org, sistema congelado con la pantalla tal como se muestra en la segunda imagen de a continuación, teniendo que pulsar PrtScr+Alt+REISUB para el reinicio forzoso.

cargando.BIOS entorno.grafico.congelado

Realizo varios reinicios obteniendo siempre el mismo resultado, sin problemas con GRUB o Kernel Panic, por lo que parece que el comportamiento aleatorio de hace meses ha desaparecido. Teniendo en cuenta que el sistema se congela justo al arrancar el servidor gráfico es probable que el problema sea en la tarjeta gráfica, por lo que desconecto la tarjeta gráfica de la ranura PCIe y utilizo la gráfica Intel GMA 950 integrada en la placa base. Arrancamos el equipo y efectivamente, el sistema y el entorno gráfico arrancan sin problemas:

nvidia.geforce.7300.gt sistema.completo.sin.grafica
entorno.grafico

Se confirma que la avería no se limitaba únicamente a la placa base, sino que la tarjeta gráfica también estaba dañada, ¿por que razón?, no lo se muy bien, puede que por algún pico de tensión que daño la electrónica, puede que por sobrecalentamiento ya que la combinación de este procesador con la pésima refrigeración de la caja en la que se encuentra hace que la temperatura interna de esta sea la de un horno, o puede que por un poco de todo, ¿quien sabe?.

Para descartar que sigan existiendo problemas y así evitar mas sorpresas me recomendaron pasar el memtest86 y ocurrió algo bastante “curioso”, seguía detectando exactamente el mismo error en hace unos meses en ambos módulos de memoría, tanto juntos como por separado para cualquier combinación:

memtest86

A continuación me sugirieron que probara con memtest86+ ya que puede que los errores detectados memtest86 tenga que ver con un bug del propio programa, por lo que era necesario instalarlo:

aptitude install memtest86+

Despues de reiniciar, pasamos memtest86+ que realiza dos pasadas sin errores:

memtest86.plus

Resulta curioso que memtest86 detecte problemas y memtest86+ no, algo seguramente achacable algún bug del propio memtest86, lo que es cierto es que de haberlo reconocido como tal hace unos meses me habría ahorrado algún tiempo sospechando de problemas con la memoria RAM.

De momento el sistema funciona sin problemas, por lo que el paso siguiente será conseguir una tarjeta gráfica PCIe decente, que sea barata y que rinda algo mas que la Intel integrada en la placa base.

Agradecimientos
Gracias a Jan de jabberes.org por sus conocimientos y paciencia ante mi bombardeo de preguntas, puede que muchas de ellas triviales.

Anuncios

6 comentarios sobre “Bricolaje Informático

  1. y… ¿no te hace sospechar que sea la gráfica la culpable desde el inicio de los problemas? ¿o me saltado algo leyendo? digamos que sufrí “fenómenos extraños” en mi viejo amd siendo la culpable la fx5200 de nvidia que estaba en las últimas la pobre (otro fenómeno extraño, en el equipo de un colega sigue funcionando sin problemas, yo le puse una gf6800 al mio y ahi está, misterios de la ciencia!)

    1. Hola Panko.

      Lo que me hizo descartar la gráfica en un principio fué que tras retirarla y ponerme a usar la integrada en la placa base seguia ocurriendo “cosas extrañas”, como los errores con el disco duro, congelaciones y reinicios, por eso la descarté, aunque luego lo que en realidad pasó es que la gráfica también estaba dañada y que sus problemas estaban enmascarados (por lo menos para mi) por los problemas de la placa base.

      Saludos.

      PD: Gracias por el comentario 😀

  2. La próxima vez que pruebes una memoria deshabilita la cache.
    Viendo como te salían las líneas de la pantalla la gráfica tiene un chip de memoria estropeado.
    Yo tengo una fuente nox 450 también pero si vas a tener el ordenador 24×7 te recomiendo comprar una fuente mejor te saldra más económica. Yo la tengo para probar ordenadores.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s