sexta-feira, 20 de abril de 2007

Tendências das falhas em grandes quantidades de hard disk.

O trabalho que iremos apresentar é obra dos engenheiros, Eduardo Pinheiro, Wolf-Dietrich Weber, e Luiz André Barroso, funcionários da Google Inc.
É estimado que 90% de toda a informação produzida no mundo atualmente são armazenadas em mídia magnética e na sua grande maioria em hard disk.
A despeito da importância dos hard disk há uma enorme escassez de trabalhos publicados que falam a respeito das tendências de falhas dos hard disk bem como dos fatores que afetam sua longevidade. Os maiores parte dos dados existentes são baseados em extrapolações de experimentos em modestos estudos.
Deve-se levar em conta que estudos em grandes números de hard disk são muito difíceis de serem realizados por que são raras as infraestruturas que permitem a coleta de dados dos componentes de um hard disk em funcionamento, para analise de falhas futuras este tipo de pesquisa é fundamental.
Os dados que iremos apresentar são resultados do trabalho de monitoramento de 100.000 hard disks PATA e SATA em um período de 5 anos, os hard disk estudados foram discos que trabalhavam e centros de serviços para internet, estes discos trabalham sem interrupções. Conjuntamente com a observação das estáticas de falhas foram analisadas as correlações de falhas com idade de uso dos hard disk e também os altos níveis de utilização a que estes hard disk são submetidos.
Após cincos anos de monitoramento e estudos estatísticos em centros de trabalho da Google, os pesquisadores não puderam estabelecer um padrão consistente entre as falhas e as altas temperaturas (a alta temperatura que aqui esta considerada é de 100 graus Fahrenheit, isso traduzido para graus Celsius que é a medida que usamos para medir temperatura no Brasil são 38 graus), nem uma correlação com os altos níveis de utilização. Temperatura eles escrevem é um dos fatores que é considerado dos mais importantes para determinar a durabilidade dos hard disk.
Ainda segundo os pesquisadores, foram identificados muitos parâmetros do SMART (Self Monitoring Analysis Report Test) que possuem alta correlação com falhas, mas a despeito dessa correlação eles concluíram que os modelos baseados somente em monitoramento SMART não são eficientes o suficiente para prevenção das falhas dos hard disk.
Surpreendentemente, eles concluíram que a temperatura e altos níveis de uso dos hard disk tem menos correlação com as falhas do que já foi anteriormente reportado.
Não podemos nos esquecer que os discos estudados estavam em centros de trabalhos de alto nível de qualidade e uma vez em funcionamento estes hard disks nunca são desligados e portanto suas condições de uso estão bem próxima das condições considerada ideal para um Maximo aproveitamento dos hard disk em funcionamento e durabilidade.
Os resultados mais interessantes desse estudo vieram de cinco áreas distintas:
A validade dos hard disk dada pelo fabricante através da especificação MTBF.
O dados do SMART
A relação entre o estresse a que o drive é submetido pelo trabalho e sua durabilidade
A relação da idade do disco com a falha
A relação das falhas dos discos e a temperatura.
A nos brasileiros caberá o bom senso de ao lermos esse trabalho transferirmos a experiência para nosso ambiente de trabalho bem como as condições a que nossos discos são submetidos. Para exemplificar quando se fala de temperatura o número apontado na pesquisa como do hard disk em funcionamento é igual ao da temperatura ambiente no Brasil, por isso sempre se fala que as condições de ambiente são variáveis preponderantes para analise de funcionamento dos hard disk.

Será permitido o uso do artigo desde que seja citada a fonte e o autor (LEI Nº 9.610, DE 19 DE FEVEREIRO DE 1998).

Nenhum comentário:

Ads Inside PostM

Teste