As ferramentas de monitoramento SMART podem dizer se o seu SSD está com 100% de integridade ou abaixo disso, mas não podem provar que os arquivos já armazenados no seu NAS ainda estão corretos. É assim que você acaba com uma matriz aparentemente saudável e pastas e mais pastas de arquivos quebrados.
Considerando que você provavelmente usa seu NAS principalmente para servir como um backup seguro, a perda de arquivos devido à corrupção vai contra o propósito do seu armazenamento. Felizmente, existe uma resposta para esse problema que mantém seus backups em boas condições: a limpeza de dados.
Os testes SMART verificam a integridade da unidade, não seus dados
Ainda vale a pena fazê-los, mas não retratam o quadro completo.
Os testes SMART (Tecnologia de automonitoramento, análise e relatórios) são diagnósticos de unidade integrados que monitoram atentamente os contadores de integridade internos de uma unidade. Eles executam rotinas de autoverificação para procurar sinais precoces de falha, o que os torna muito importantes. Embora seja verdade que as unidades podem falhar mesmo com 100% de integridade, as ferramentas SMART ainda são úteis quando você se preocupa com seus dados.
A maioria das caixas NAS pré-construídas permite agendar um teste curto ou um teste estendido. Em seguida, eles apresentam os resultados como um status de integridade, além de vários atributos, incluindo coisas como erros de leitura, setores realocados, temperatura e muito mais.
Eles são terrivelmente úteis. No entanto, eles não são uma ferramenta de monitoramento universal.
SMART é melhor em um trabalho, e apenas em um trabalho. Ele lhe dirá se uma unidade (da qual seu NAS pode ter várias) está se comportando normalmente e se está começando a mostrar sinais de falha. Mas isso não significa que não haja problemas com a integridade dos dados, surgindo logo abaixo da superfície.
Mesmo um relatório SMART claro sobre o seu NAS não garante integridade do início ao fim. Ele opera no nível do dispositivo, portanto não pode realmente validar o que seu sistema de arquivos considera correto, o que sua camada RAID espera ou se os blocos armazenados ainda são consistentes quando você tenta executar um arquivo específico.
Enquanto isso, a corrupção de dados pode atingir você de lugares que a SMART nem sequer olhará. RAM ruim, controlador ou HBA instável, cabeamento marginal, energia instável, problemas de firmware… eu poderia continuar. Você pode ter casos de arquivos corrompidos, mesmo sem saber.
O que um esfregaço realmente verifica (e quando pode ajudar)
Não é a coisa mais divertida de se fazer, mas é a melhor maneira em determinadas situações.
Uma limpeza de dados é uma passagem deliberada e sistemática dos dados armazenados em seu NAS. Em vez de esperar que você abra um arquivo algum dia, o NAS lê os blocos armazenados propositalmente para verificar se o que está no disco ainda corresponde ao que foi gravado originalmente. Scrubs podem trazer à tona todos os tipos de problemas, como erros de leitura latentes, inconsistências que só aparecem durante leituras sustentadas e problemas que de outra forma passariam despercebidos.
Essa é uma passagem em nível de arquivo muito mais detalhada que verifica se seus arquivos estão realmente funcionando bem ou não.
A razão pela qual isso é importante são as somas de verificação. Em sistemas de arquivos que os suportam, seu NAS pode armazenar uma pequena impressão digital para cada bloco de dados e, posteriormente, comparar essa impressão digital com o que ela lê. Se houver algo errado na soma de verificação, isso indica dados corrompidos, mesmo que a própria unidade continue funcionando normalmente.
É também aqui que a limpeza pode passar da detecção ao reparo. Se sua configuração de armazenamento tiver redundância e seu sistema de arquivos puder tirar vantagem disso, uma limpeza geralmente poderá extrair uma cópia correta de outro lugar no pool e corrigir o bloco defeituoso automaticamente. Se você não tiver redundância, uma limpeza ainda poderá detectar o problema antecipadamente, mas não poderá recriar magicamente dados ausentes ou danificados.
Scrubs são especialmente ótimos para dados frios; coisas que você deixa intocadas por meses a fio, o que significa que você não encontrará esses blocos danificados por muito tempo. A limpeza força essas leituras a acontecerem de acordo com uma programação, portanto, mesmo que você não use seus arquivos por muito tempo, seu NAS ainda verificará o que está acontecendo.
A limpeza de dados não resolve tudo
Depende do seu NAS.
Então, a limpeza de dados é uma solução mágica para tudo que pode dar errado com o seu NAS? Ah, se ao menos. Infelizmente, existem algumas limitações.
Uma limpeza só pode verificar o que o seu NAS pode verificar (duh). Se a sua configuração não armazena somas de verificação de dados ou se o recurso de limpeza no seu NAS for realmente mais parecido com uma verificação de consistência de paridade, você poderá não obter muito mais do que uma confirmação de que a estrutura da matriz faz sentido. Não será um tipo de verificação bit a bit.
O outro limite rígido é a redundância. Seu NAS precisa ter um lugar para extrair uma cópia conhecida, uma que você saiba que é 100% boa, porque essa é a única maneira de descobrir corrupção. Em um NAS de disco único, uma configuração JBOD ou qualquer coisa sem duplicação real, uma limpeza ainda pode detectar blocos defeituosos, mas não pode repará-los, pois não terá outro lugar de onde extrair dados.
E mesmo com redundância, um esfoliante não é um escudo mágico. Se a corrupção aconteceu antes dos dados chegarem ao disco, ou se estiver sendo introduzida de forma consistente por hardware instável, a limpeza continuará encontrando problemas até que você corrija a causa raiz.
A maneira ideal de lidar com a limpeza de dados
Configurar uma rotina manterá seus arquivos seguros.
Esfregar é uma ótima maneira de manter o controle sobre seus arquivos e garantir que estejam em bom estado. No entanto, não é realmente uma solução de emergência. É por isso que funciona melhor quando você o trata como parte de sua rotina de manutenção do NAS.
Deve ser frequente o suficiente para detectar problemas em dados frios, mas também espaçado o suficiente para que seu NAS não leia constantemente grandes quantidades de dados em segundo plano. (Isso pode torná-lo muito barulhento.)
Para a maioria das configurações domésticas, isso se resume a fazer uma limpeza mensal e, em seguida, deixar a SMART preencher as lacunas com verificações de saúde mais leves, mais frequentes e mais gerais.
Dica rápida: tente garantir que esses trabalhos não se sobreponham. Uma limpeza já é uma carga de trabalho de leitura sustentada, e acumulá-la com testes longos SMART, verificações de paridade, backups ou indexação de mídia fará com que seu NAS pareça quase inutilizável. Acho que um NAS totalmente SSD pode lidar com isso, mas mesmo assim, você o deixará lento sem motivo.
Por último, trate essas limpezas de dados como apenas uma camada de uma rede de segurança maior. Para os arquivos mais importantes para você, siga a regra 3-2-1 (ou até mesmo nivele-a para 3-2-1-1-0), execute verificações frequentes e mantenha seu NAS em boas condições para garantir que o risco de corrupção de dados seja o mais baixo possível.




