Synology DSM: data scrubbing vs disk replacement
Geplaatst: 12 feb 2019, 16:43
Mijn Synology gaf al een maand of zo af en toe een warning ivm een read error die dan wel gerecovered wordt adhv retries. Heb dan ook wel al een replacement disk gekocht die vandaag toegekomen is. Dacht vandaag ook nog effen rap een Extended SMART test te doen, en die faalde uiteindelijk (een maand geleden liep dat nog goed). Ik zie wel geen kritische SMART parameters. Hoedanook betekent het wel duidelijk dat ik nu direct die schijf moet vervangen.
Ik lees nu dat Synology aanraadt van je RAID eerst te scrubben vooraleer je een disk upgradet. Geldt dat ook voor het vervangen van falende disks ? Hoe ik data scrubbing begrijp, is dat eigenlijk je hele RAID ingelezen wordt en de parity gecheckt wordt, om dus te garanderen dat je nog op 100% van je data redundancy hebt. Wat me niet duidelijk is, is wat er gebeurt als er effectief errors gevonden worden. Is het op dat moment dat er sectors heralloceerd worden en dan adhv de redundancy/parity de onleesbare data terug hersteld wordt op de nieuwe sector ? In dat geval lijkt het me dan essentieel dat ik eerst data scrubbing doe ? Want als ik de schijf nu al vervang, en dan blijken er read errors ergens op een van mijn andere 3 schijven te zitten, betekent dat onherroepelijk data loss op de desbetreffende sectoren.
Klopt mijn redenering ?
EDIT: van wat ik lees is het een mes dat aan 2 kanten snijdt:
Pro = scrubbing kan effectief data issues op een van de andere 3 schijven recoveren door ze op andere blocks weg te schrijven. Dit zorgt er voor dat na replacement van 1 disk je in elk voorkomt dat op dat moment de rebuild ineens faalt omwille van read errors elders.
Con = scrubbing zet extra load op alle disks, wat het juist terug meer waarschijnlijk maakt dat er failures op een andere disk gaan zijn. Anderzijds is dat sowieso al het geval voor de RAID rebuild, en als het dan voorkomt ben je sowieso screwed.
Ik lees nu dat Synology aanraadt van je RAID eerst te scrubben vooraleer je een disk upgradet. Geldt dat ook voor het vervangen van falende disks ? Hoe ik data scrubbing begrijp, is dat eigenlijk je hele RAID ingelezen wordt en de parity gecheckt wordt, om dus te garanderen dat je nog op 100% van je data redundancy hebt. Wat me niet duidelijk is, is wat er gebeurt als er effectief errors gevonden worden. Is het op dat moment dat er sectors heralloceerd worden en dan adhv de redundancy/parity de onleesbare data terug hersteld wordt op de nieuwe sector ? In dat geval lijkt het me dan essentieel dat ik eerst data scrubbing doe ? Want als ik de schijf nu al vervang, en dan blijken er read errors ergens op een van mijn andere 3 schijven te zitten, betekent dat onherroepelijk data loss op de desbetreffende sectoren.
Klopt mijn redenering ?
EDIT: van wat ik lees is het een mes dat aan 2 kanten snijdt:
Pro = scrubbing kan effectief data issues op een van de andere 3 schijven recoveren door ze op andere blocks weg te schrijven. Dit zorgt er voor dat na replacement van 1 disk je in elk voorkomt dat op dat moment de rebuild ineens faalt omwille van read errors elders.
Con = scrubbing zet extra load op alle disks, wat het juist terug meer waarschijnlijk maakt dat er failures op een andere disk gaan zijn. Anderzijds is dat sowieso al het geval voor de RAID rebuild, en als het dan voorkomt ben je sowieso screwed.