DISEÑO Y EVALUACIÓN DE CONFIGURACIONES

TRABAJO FINAL: DOMINGO LÓPEZ OLLER

COMPARATIVA DE DISCOS DUROS

OBJETIVO DEL TRABAJO

El objetivo de este trabajo es evaluar varios discos duros, ya sean de sobremesa o de portatil, bajo el sistema operativo Windows (al tratarse de disco da igual la versión) para ver cuál de ellos es el mejor para colocarlo en un servidor (ya sea web o de base de datos).

LOS DISCOS DUROS QUE SE VAN A UTILIZAR

Si nos paramos a analizar unas características mínimas de un disco duro para un servidor, sabemos que un servidor de páginas web no va a tener las mismas limitaciones que un servidor de ficheros y ni mucho menos un servidor de base de datos distribuida de un banco.
Actualmente los discos duros ofrecen grandes capacidades (TB) y la tecnología permite tener una gran velocidad de lectura, reducir el tiempo de acceso y mayores prestaciones incluyendo cachés. La decisión de comprar un disco frente a otro dependerá del volumen de transacciones que se vayan a preveer y del servicio que queramos aportar.
En este trabajo voy a analizar diferentes discos duros de compañeros de la facultad que inicialmente no están preparados para ser servidores y tras realizar las pruebas veré cuál de ellos es el mejor para esta tarea.
Estos son los discos duros que yo voy a analizar y el chipset de la placa madre:
SAMSUNG HM100JI TOSHIBA MK3252GSX TOSHIBA MK6025GAS ST9250827AS Hitachi HTS541212H9AT00
CAPACIDAD 100 GB 320 GB 60 GB 250 GB 120 GB
INTERFAZ SATA-II SATA-II ULTRA-ATA/100 SATA-II ULTRA-ATA/100
LATENCIA MEDIA ROTACIÓN 5.6 ms 5.55 ms 7.14 ms 5.6 ms 5.5 ms
VELOCIDAD ROTACIÓN 5400 rpm 5400 rpm 4200 rpm 5400 rpm 5400 rpm
TASA TRANSFERENCIA BÚFER-HOST 100 MB/s 300 MB/s 100 MB/s 300 MB/s 100 MB/s
TIEMPO MEDIO BÚSQUEDA 12 ms 12 ms 12 ms 12 ms 11 ms
CHIPSET Mobile Intel Calistoga-GM i945GM Intel Crestline-GM GM965 Intel Montara-GM+ i855GME Intel Crestline-PM PM965 Mobile Intel Calistoga-PM i945PM
Todos tienen SMART y búfer de 8 MB. He colocado el Chipset porque éste es el responsable de controlar la velocidad de envío y recepción al disco, de hecho un disco en un sistema con distinto chipset va a proporcionar un rendimiento diferente ya que una cosa es sus características y otra muy distinta es la velocidad del bus por la que viajan los datos recogidos de disco y cuyo tiempo se está considerando en la medición.
Nota: La hoja de características de los discos ha sido generada con el programa Everest v5.00.1650 y se puede ver pinchando sobre el nombre del disco. En ese informe aparece un resumen del sistema al que corresponde el disco duro probado. Si se tiene registrado el Everest se obtiene más información, aquí se presenta la información disponible sin registrar (Para el Disco 1 si está completo)

Estos discos presentan características similares en algunos puntos y esto hace que con estos datos no podemos identificar qué disco duro es mejor o peor, a priori se podría decir que el disco 3 es el peor por la arquitectura pero no podemos decir nada del mejor, para conocer cuál es el mejor vamos a someterlos a las pruebas que se detallan más abajo y obtener un resultado.

SELECCIÓN DE MÉTRICAS

Hemos indicado los discos duros que vamos a probar pero hay que ver qué se va a hacer con ellos y con qué objetivo para determinar que uno sea mejor o peor.
Mi objetivo es ver el disco duro que mejor se adaptaría para ser un servidor web que tiene poca carga de almacenamiento pero alta carga de lecturas y de base de datos donde hay tanto inserciones en la base de datos que conlleva escritura en disco como la lectura de los mismos.
Por este motivo se medirá el tiempo que se tarda en la lectura y escritura de ficheros de distinto tamaño y compararemos los resultados entre todos los discos duros. Todas las pruebas de tiempo serán en segundos y considerando que menor es mejor.
También nos interesa que el disco duro no se caliente mucho durante esta operación de hecho si un disco duro ofrece unos resultados un poco peores pero se calienta mucho menos que otro que lo haga más rápido cogeremos el segundo porque nos aportará más fiabilidad, ya que al calentarse menos los mecanimos del disco se deterioran muchos menos. Por ejemplo, la diltación de los discos por el calor pueden estropear el disco y producir muchos errores de lectura o de escritura.
Así pues lo que voy a analizar es: El hecho de considerar diferentes tamaños de ficheros es para ver el comportamiento del disco, ya que no es lo mismo almacenar archivos de 1MB a archivos de 100MB ni tampoco buscarlos si el disco está muy fragmentado o con sectores defectuosos.
Para desarrollar esta tarea voy a utilizar parte del benchmark que utilicé en la práctica 6 para medir el tiempo de realizar escritura y lectura en disco de ficheros de distinto tamaño y por otro lado se presentará el comportamiento del disco y la 'salud' del mismo con el programa HD Tune que además aporta el control de temperatura e información de la unidad. La temperatura en este caso se mide en ºC y también se considera mejor cuanto menor es esta.
El programa HD Tune es un programa de prueba de discos duros que se puede descargar en el siguiente enlace: HD TUNE.

PARÁMETROS QUE PUEDEN AFECTAR A LAS MEDICIONES Y CÓMO AFECTAN

Esta claro que todos los sistemas no son iguales y en concreto los servidores trabajan con lo mínimo para que se obtenga el máximo de rendimiento para atender las peticiones que le llegan.
El rendimiento de un sistema va a depender de lo que tenga instalado, ya que habrá procesos más pesados que otros que consuman muchos recursos y hagan al sistema ir lento, sin embargo estos aspectos afectan más a la RAM o a la CPU que al comportamiento del disco debido a la lentitud del mismo (unas 1000 veces más lento), por lo que para el caso del disco duro lo que verdaderamente afecta a su rendimiento son los siguientes puntos: Pese a que hay discos duros que tienen refrigeración y otros que tienen RAID, los discos duros que estamos probando no poseen de estas características y todos tienen unas características similares. Este aspecto nos permitirá analizarlos mirando una arquitectura y viendo cómo afecta la velocidad de giro, que tenga caché o no, el sistema de archivos que se está utilizando (en este caso todos salvo el disco 5 utilizan NTFS, el disco 5 usa FAT32),..., así se verá cuál de ellos es más apto para estar en un hipotético servidor que hagamos.

PRUEBAS A REALIZAR

La forma de obtener los datos será la siguiente:
  1. Iniciar el benchmark de mi código que puede verse en el siguiente enlace: benchmark.cpp. Se ejecutará en una ventana de Sistema y se redireccionará la salida a un fichero de la forma siguiente: benchmark >salida.txt
  2. Iniciar el benchmark HD Tune para obtener la gráfica del estado del disco duro y la temperatura del mismo
Este procedimiento se realizará en cada sistema o por cada disco duro si es que el sistema tuviera más de uno.

CARGA DE TRABAJO

He decidido tomar las mediciones con el sistema en baja carga, recién arrancado, para así tener un punto de referencia común en todos los sistemas.

REALIZACIÓN DE LAS PRUEBAS

Pasamos a mostrar los resultados de las pruebas realizadas sobre los discos duros:

Resultados del BENCHMARK:

LECTURAESCRITURA TEMPERATURA
1MB 5MB 20MB 50MB 100MB 1MB 5MB 20MB 50MB 100MB ºC
DISCO 1 26,547 0,281 1,266 3,3 5,68 0,766 2,078 12,14 34,656 70,313 43
DISCO 2 8,219 0,234 0,938 2,312 4,672 0,297 1,422 5,688 14,39 28,891 45
DISCO 3 57,272 0,34 1,372 3,435 6,83 2,253 29,993 53,206 83,763 106,473 55
DISCO 4 7,719 0,219 0,875 2,234 4,422 0,25 1,297 5,188 13,015 26,031 40
DISCO 5 27 0,828 3,219 7,844 15,515 0,813 4,015 16,094 39,609 79,984 48
Nota: Estos datos son el resultado de ejecutar dos veces el benchmark y de calcular la media de los dos datos obtenidos para cada caso (excepto temperatura que es del HD TUNE). Marcados están el mejor y peor tiempo para cada prueba
Al principio impacta el valor obtenido para 1MB en lectura, pero sale tanto porque se está contando también el tiempo de llegar al sitio donde están los datos a leer (tiempo de acceso).
Podría haber restado el tiempo de acceso para que fuera más acorde al resto pero puesto que la lectura de 1MB es tan poco tiempo (entre 0.1 y 0.2), he preferido colocar la suma de ese tiempo más el tiempo de acceso y así también se refleja cuánto de bueno es cada disco duro por el tiempo que tarda en acceder. Para el resto ya sí mediré el tiempo de lectura al tratarse de ficheros de mayor tamaño.
En este caso se crea un fichero temporal.txt que contiene todos los datos a leer por lo que una vez se accede para leer 1MB el resto ya leen por donde se quedaron y por eso no se incrementa el tiempo de acceso en cada medida.

A partir de los datos obtenidos cuesta ver qué disco es el peor a simple vista. Lo que sí parece claro es que el mejor es el DISCO 4 por tener los mejores tiempos, recordemos que menos es mejor, y por tener también la menor temperatura medida. En cuanto al peor, se puede ver que la cosa está entre el disco 3 y 5 pero considerando la temperatura el peor es el DISCO 3 a priori por tener mayor temperatura.
En la parte de análisis se presentarán las gráficas para confirmar esto.

Resultados del HD TUNE:

HD TUNE 1HD TUNE 2

HD TUNE 3HD TUNE 4

HD TUNE 5

Nota: Estas imágenes se pueden ver con más detalle en la carpeta archivos adjunta.

A la vista de los resultados se puede ver que tanto el disco 2 como el disco 4 tienen unas tasas de transferencia más altas, pero el disco 4 tiene un tiempo de acceso menor (cuanto mayor sea este tiempo peor es el disco), y que el disco 3 es el que tiene la más baja. De aquí puede verse ya cuál es el más lento y cuál es el más rápido.
También puede verse la temperatura de trabajo y puede verse que tres de ellos trabajan entre 40-45ºC mientras que 2 de ellos trabajan por encima de 50ºC lo cual ya es preocupante (nunca debe llegar a los 60ºC), en concreto el disco 3 ya estaba dando alertas por temperatura mientras se hizo la prueba.
Puede observarse también que esta prueba no hace ninguna sobrecarga en la CPU, además, estamos en baja carga nada más iniciar el sistema. Si hubiera muchos procesos activos se producirían muchas caídas (picos) por las interrupciones o por errores de lectura.
Por lo demás puede verse un comportamiento similar en las gráficas. De nuevo el mejor disco es el 4 y el peor el 3, a continuación se verá el análisis que va a certificar esto.

ANÁLISIS

Vamos a analizar los resultados obtenidos en el apartado anterior enfocándolos en el supuesto caso de montar un servidor.
Nota: En todas las gráficas que presento menos es mejor.

SERVIDOR DE PÁGINAS WEB

Para el caso de querer montar un servidor de páginas web (sin gran carga de base de datos), vamos a trabajar con ficheros que serán de 1MB si es una página muy pequeña, con poca carga de imágenes o estática o de 5 MB si es que ya lleva imágenes y está más elaborada.
Pues bien voy a mostrar las gráficas que se obtienen en escritura y lectura para ambos casos:
GRÁFICAS SERVIDOR WEB
A la vista de estas gráficas se ve que los discos 2 y 4 ofrecen muy buenos resultados pero también vemos que no podemos estimar cuál es el peor puesto que en escritura el peor es el disco 3 pero en lectura es el disco 5 para ficheros de 5MB (y superiores).
Este aspecto sorprende un poco dado que tanto el disco 3 como el disco 5 tienen una arquitectura similar, salvo que disco 3 es más lento en el posicionamiento y esto se refleja en la lectura de 1MB y en todas si consideráramos el tiempo de acceso en todas las medidas.
El hecho de que el disco 5 de valores más altos para la lectura secuencial de un fichero de 5 MB y mayores, como se aprecia en las medidas de la tabla, es debido al sistema de archivos que utiliza. El disco 3 utiliza NTFS mientras que el disco 5 utiliza FAT32 y esto lo explica todo dado que el sistema FAT32 es más lento que NTFS. Se ve por tanto que el sistema de archivos sí influye.
En igualdad de condiciones el peor disco sería el 3 por ser el más antiguo (5 años) y también por la temperatura a la que trabaja.
Por lo tanto aunque en lectura sea mejor que el disco 5 en la gráfica final debe llegarse a la conclusión de que el disco 3 es el peor.

Si tuviera que escoger uno de estos discos para servidor de páginas web, podría escoger tanto el disco 2 como el 4 pero me quedaría con el 4 por tener menor temperatura en funcinamiento y mayores prestaciones como se ve en HD TUNE.

SERVIDOR DE FICHEROS Y BASE DE DATOS

Para el caso de un servidor de ficheros, ya sea ftp o algo tipo megaupload o softonic, y base de datos grandes como en La General o la UGR se necesita tener discos duros de gran tamaño, un gran control de temperatura y seguridad con RAID. No es algo tan simple como el caso de las páginas web donde cualquier ordenador de hoy en día puede realizar esa función.
En este caso la prueba consistirá en medir tiempos sobre ficheros de 20, 50 y 100 MB tanto en lectura y escritura. Obviamente hay descargas de más tamaño pero está claro que a mayor tamaño mayor será el tiempo y he preferido utilizar tamaños de descargas típicas de programas, discos, demos,... para el caso de servidor de ficheros o realización de copias de seguridad de algunas partes del disco en caso de base de datos o para mandar datos en una base de datos distribuida.
Las gráficas que se obtienen para este caso son las siguientes:
GRÁFICAS SERVIDOR ARCHIVOS Y BASE DATOS
Se puede ver el mismo efecto comentado en el apartado anterior sobre la lectura y escritura entre los discos 3 y 5 y se ve de nuevo que el mejor disco sigue siendo el número 4 al tener un valor de tiempo inferior.
Parece claro que el mejor disco duro va a ser el 4 pero pese a lo comentado en apartados anteriores que el disco 3 es peor hay que cerciorarse dado que en lectura el disco 5 está dando peores resultados en estas pruebas. La forma de ver esto es comparar la lectura y escritura en media y ver si el disco 3 tiene peor rendimiento o no.
De la teoría sabemos que considerar por distintas pruebas no es bueno ni es buena medida, hay que tener un sistema de base sobre el que comparar. En este caso voy a considerar como sistema base el disco 3 y sobre él calcularé los valores para obtener una media aritmética que estará ponderada con un peso que será el factor temperatura, es decir, cuanto menor sea la temperatura esta media aumentará y cuanto mayor sea ésta peor resultado en media. La idea es hacer que los discos duros compensen su debilidad en transferencia con la temperatura a la que trabajan, factor que yo considero muy importante para su fiabilidad.

ANÁLISIS MEDIA

La siguiente tabla recoge los datos:
LECTURA NORMALIZADA
DISCO 1DISCO 2DISCO 3DISCO 4DISCO 5
12,166,9717,422,12
51,211,4511,550,41
201,081,4611,570,43
501,041,4911,540,44
1001,201,4611,540,44
TEMPERATURA1,281,2211,381,15
Media geom*Tempe1,713,1413,750,88
ESCRITURA NORMALIZADA
DISCO 1DISCO 2DISCO 3DISCO 4DISCO 5
12,947,5919,012,77
514,4321,09123,127,47
204,389,35110,263,31
502,425,8216,442,11
1001,513,6914,091,33
TEMPERATURA1,281,2211,381,15
Media geom*Tempe6,5711,62114,553,89

Las gráficas que representan estos resultados son las siguientes:
GRÁFICAS MEDIA
Se puede ver en la gráfica de lectura que el disco 5 resulta peor que el disco 3 pero teniendo en cuenta que el acceso a ficheros no va a ser secuencial como en este caso y que va estar siempre el tiempo de acceso, los tiempos del disco 3 serán muy superiores tanto para lectura como para escritura por lo que el peor disco será el 3 sin lugar a dudas. Por lo tanto, el elevado tiempo de acceso del disco 3 compensa la deficiencia del sistema de ficheros. En estas gráficas podemos confirmar también que el mejor disco es el disco 4 como ya habíamos comentado anteriormente.
Los resultados del disco 5 son debidos al sistema de ficheros como ya se ha dicho antes y si no he sumado el tiempo de acceso es porque quiero destacar este aspecto, es un aspecto que afecta a las mediciones como ya se ha comentado en el apartado de Parámetros que pueden afectar a las mediciones.
Así pues, el mejor disco duro es el DISCO 4 y el peor es el DISCO 3 por lo tanto para nuestro servidor hipotético, ya sea de ficheros o de páginas web nos decantaríamos por el disco 4 antes que el resto aunque el disco 2 no dista mucho del 4 y también sería una buena elección.

CONCLUSIONES

En este trabajo se ha podido evaluar diferentes discos duros para ver cuál es el mejor para colocarlo en un servidor. Ya he comentado que ninguno sirve realmente para un servidor de ficheros o de base de datos por las exigencias técnicas pero quería ver cuál es el mejor para el caso de montar un servidor provisional o pequeño.Para servidor de páginas web sí valdría cualquier disco actual.
En este análisis se ha podido ver la importancia de la arquitectura del disco duro al igual que también el sistema de ficheros que tenga de formato para su rendimiento. En este caso no se conoce la ocupación de los discos en el momento de la prueba pero esto es un factor importante dado que ello afecta al tiempo de búsqueda tanto para lectura y escritura.
La temperatura que puede alcanzar un disco duro es también un factor importante ya que afecta a la vida del mismo y la fiabilidad.
También hay que considerar la arquitectura del sistema dado que aunque tengamos un disco duro muy bueno, si el sistema tiene un chipset malo que no da una buena velocidad a los buses estaremos perdiendo ahí rendimiento. Es por esto que la compra de un ordenador conlleva un análisis exhaustivo de cada componente para poder tener así un sistema lo más preparado posible.
Como se ve hay muchos factores que pueden afectar al rendimiento de un disco, yo he analizado aquí los de la arquitectura, la temperatura y el sistema de ficheros aunque puede haber otras pruebas.

Nota: En la carpeta archivos están todas las imágenes y el fichero excell con las gráficas que hay expuestas en este trabajo.

DOMINGO LÓPEZ OLLER
Ingeniero Técnico Informática Sistemas
Trabajo final de Diseño y Evaluación de configuraciones.
Hosted by www.Geocities.ws

1