IPB

Здравствуйте, гость ( Вход | Регистрация )

 
Ответить в эту темуОткрыть новую тему
> Оценка остаточного ресурса SSD
SuperMax
сообщение 23.8.2016, 11:40
Сообщение #1


Администратор
*****

Группа: Root Admin
Сообщений: 6 276
Регистрация: 7.1.2006
Из: Красноярск
Пользователь №: 1



Осенью 2014ого я поставил SSD PNY Prevail Elite SSD9SC240GEDA-PB 240 Гб
модель SSD2SC240G0LC726B104-297
на сервер базы данных (на котором крутится и этот форум в том числе)

Сейчас, те почти через 2 года я решил оценить остаточный ресурс данных SSD (они стоят у меня в программном зеркале MD )


Для начала я решил достать техподдержку PNY
ибо уж производитель должен знать как проверить их железку

Цитата
Good day, support!

I have 2 in the SSD of your production

Please help assess their residual resource

SMART printing an attachment
----------------
Dear Mr

Could you please explain what do you need to know from those SSD?

Sincerely.
----------------
Good day, tech-sup.

> Dear Mr
> Could you please explain what do you need to know from those SSD?
> Sincerely.

I use your SSD in the server database.
I want to evaluate the residual SSD resource for planning new purchases.

In an attachment listing S.M.A.R.T. these discs

Please help
----------------

Dear Mr

Im not sure to understand what do you need, could you please clarify.

Do you need to check if we have this SSD model on stock?

Sincerely.

----------------

Dear Mr

Thank you for clarifying the query.

The information regarding the maximum number of supported write cycles should be stored in the firmware, with no access for the S.M.A.R.T. ability.
I don't see how that technology would know how to compute the number of remaining write cycles before the SSD go to the read-only status. It would only read for how long the device has run, how many bytes have been read or written.

It is possible to get some data from S.M.A.R.T. reports such as those files you sent us. A big part of it is quite meaningless for the common mortal.
The other part is relevant, provided the viewing utility can clearly show it. Maybe you could use one such as CrystalDiskInfo? You will get for instance the number of total GBytes that have been written on a specific SSD. That number, divided by the capacity of the device, should provide the number of write cycles that have already been used.

Does this help?



--------------------
Живы будем - Не помрем !
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
SuperMax
сообщение 23.8.2016, 12:06
Сообщение #2


Администратор
*****

Группа: Root Admin
Сообщений: 6 276
Регистрация: 7.1.2006
Из: Красноярск
Пользователь №: 1



И так, техподдержка хоть и не в курсе какие данные отдаются через S.M.A.R.T
но однозначно подтвердила гипотезу об оценке ресурса через количество записанной информации

итак
у меня заявлен ресурс:
Код
Ресурс SSD     2.29 петабайт  (иначе говоря 2290ТБ)
Ресурс SSD (циклов стирания/записи)     10K циклов стирания/записи


остается понять сколько записано

начнем
Код

#uptime
11:43:51 up 120 days, 25 min,  4 users,  load average: 0.58, 0.40, 0.35

# iostat
avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           5,34    0,49    0,87    1,28    0,00   92,01

Device:            tps   Blk_read/s   Blk_wrtn/s   Blk_read   Blk_wrtn
sda             269,73      2153,73      2286,57 22333246582 23710756484
sdb             259,43         0,02      2286,57     251024 23710756484

* обратите внимание что чтение идет практически только с SDA, нам потом это пригодится

нас интересует оценка количества записанной информации ГБ в сутки
если исходить из Blk_wrtn/s
то в сутки набегает ~94GB
если исходить из Blk_wrtn
то 11306GB/120=~94GB

значит в год ~34ТБ

всего прошло c 7.09.2014 по 23.08.2016 365+366-15=716дней
те записано должно быть примерно 67ТБ

теперь посмотрим S.M.A.R.T.

sda
Код
231 Temperature_Celsius     0x0013   097   097   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0032   000   000   000    Old_age   Always       -       54497
234 Unknown_Attribute       0x0032   000   000   000    Old_age   Always       -       57879
241 Total_LBAs_Written      0x0032   000   000   000    Old_age   Always       -       57879
242 Total_LBAs_Read         0x0032   000   000   000    Old_age   Always       -       77960



sdb
Код
231 Temperature_Celsius     0x0013   098   098   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0032   000   000   000    Old_age   Always       -       55559
234 Unknown_Attribute       0x0032   000   000   000    Old_age   Always       -       57879
241 Total_LBAs_Written      0x0032   000   000   000    Old_age   Always       -       57879
242 Total_LBAs_Read         0x0032   000   000   000    Old_age   Always       -       15


по информации из сети
параметр 231 означает остаточный ресурс SSD в %
если всего SSD рассчитана на 2290ТБ а у меня записано ~67ТБ что примерно 2.9%
соответственно эту информацию можно считать правдоподобной

теперь посмотрим на параметры, которые явно говорят о связи с количеством записанного и считанного - это 241 Total_LBAs_Written и 242 Total_LBAs_Read
на основании данных iostat мы помним что чтение было почти только с SDA
и тут мы видим подтверждение этого - 242 Total_LBAs_Read у sdb мал!
соответственно у нас есть все основания считать, что информация в параметрах 241 и 242 имеет отношение к делу, остается проверить размерность.
и судя по всему это гигабайты, просто нагрузка за 2 года возрасла и мы получили большую цифру в 67ТБ против 57ТБ

остаются параметры
233 Media_Wearout_Indicator
234 Unknown_Attribute


судя по числам они тоже имеют какое-то отношение к остаточному ресурсу, однако для нас это уже малопринципиально - с оценкой ресурса уже стало понятно
в текущем режиме, ресурс расходуется со скоростью ~1.5% в год, те SSD проживут дольше чем будут заменены из-за морального устаревания







--------------------
Живы будем - Не помрем !
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
SuperMax
сообщение 2.10.2019, 11:41
Сообщение #3


Администратор
*****

Группа: Root Admin
Сообщений: 6 276
Регистрация: 7.1.2006
Из: Красноярск
Пользователь №: 1



На дворе 2019й близится к концу
посмотрим ресурс:

sda
Код

231 Temperature_Celsius     0x0013   086   086   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0032   000   000   000    Old_age   Always       -       165950
234 Unknown_Attribute       0x0032   000   000   000    Old_age   Always       -       286811
241 Total_LBAs_Written      0x0032   000   000   000    Old_age   Always       -       286811
242 Total_LBAs_Read         0x0032   000   000   000    Old_age   Always       -       241350


sdb
Код

231 Temperature_Celsius     0x0013   086   086   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0032   000   000   000    Old_age   Always       -       167384
234 Unknown_Attribute       0x0032   000   000   000    Old_age   Always       -       286811
241 Total_LBAs_Written      0x0032   000   000   000    Old_age   Always       -       286811
242 Total_LBAs_Read         0x0032   000   000   000    Old_age   Always       -       19


осталось ~86% ресурса SSD
средний расход ~2.8% ресурса в год
вообще расход вырос и можно прогнозировать срок службы как минимум еще 10лет при расходе 7% и запасе в 10%


--------------------
Живы будем - Не помрем !
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
SuperMax
сообщение 11.2.2020, 14:33
Сообщение #4


Администратор
*****

Группа: Root Admin
Сообщений: 6 276
Регистрация: 7.1.2006
Из: Красноярск
Пользователь №: 1



Обратил внимание на
Код

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  9 Power_On_Hours          0x0032   084   084   000    Old_age   Always       -       14312 (218 110 0)


походу счетчик Power_On_Hours всего 15bit тк должно быть 47080 часов

ps: и хорошо что у меня не HP
тк у них это проблема https://support.hpe.com/hpesc/public/docDis...-a00092491en_us


--------------------
Живы будем - Не помрем !
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
SuperMax
сообщение 27.9.2021, 21:10
Сообщение #5


Администратор
*****

Группа: Root Admin
Сообщений: 6 276
Регистрация: 7.1.2006
Из: Красноярск
Пользователь №: 1



срез на сегодня

sda
Код
231 Temperature_Celsius     0x0013   079   079   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0032   000   000   000    Old_age   Always       -       232841
234 Unknown_Attribute       0x0032   000   000   000    Old_age   Always       -       429700
241 Total_LBAs_Written      0x0032   000   000   000    Old_age   Always       -       429700
242 Total_LBAs_Read         0x0032   000   000   000    Old_age   Always       -       486172

sdb
Код
231 Temperature_Celsius     0x0013   079   079   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0032   000   000   000    Old_age   Always       -       235117
234 Unknown_Attribute       0x0032   000   000   000    Old_age   Always       -       429700
241 Total_LBAs_Written      0x0032   000   000   000    Old_age   Always       -       429700
242 Total_LBAs_Read         0x0032   000   000   000    Old_age   Always       -       21

те осталось 79%


--------------------
Живы будем - Не помрем !
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
SuperMax
сообщение 14.11.2022, 23:27
Сообщение #6


Администратор
*****

Группа: Root Admin
Сообщений: 6 276
Регистрация: 7.1.2006
Из: Красноярск
Пользователь №: 1



Весной этого года было принято решении о миграции на более толстые SSD тк 240GB стало не хватать под данные. Соответственно сервер с данными SSD был выведен из эксплуатации и работал как тестовый сервер.

И вот сегодня я обнаружил, что одна из SSD 240GB перестала отвечать

осталась вторая
у которой
Код

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x0033   095   095   050    Pre-fail  Always       -       10807210
  5 Reallocated_Sector_Ct   0x0033   100   100   003    Pre-fail  Always       -       0
  9 Power_On_Hours          0x0032   076   076   000    Old_age   Always       -       21297 (181 32 0)
12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       79
171 Unknown_Attribute       0x000a   000   000   000    Old_age   Always       -       0
172 Unknown_Attribute       0x0032   000   000   000    Old_age   Always       -       0
174 Unknown_Attribute       0x0030   000   000   000    Old_age   Offline      -       18
177 Wear_Leveling_Count     0x0000   000   000   000    Old_age   Offline      -       26
181 Program_Fail_Cnt_Total  0x000a   000   000   000    Old_age   Always       -       0
182 Erase_Fail_Count_Total  0x0032   000   000   000    Old_age   Always       -       0
187 Reported_Uncorrect      0x0012   100   100   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0022   029   048   000    Old_age   Always       -       29 (Min/Max 13/48)
195 Hardware_ECC_Recovered  0x001c   120   120   000    Old_age   Offline      -       10807210
196 Reallocated_Event_Count 0x0033   100   100   003    Pre-fail  Always       -       0
201 Soft_Read_Error_Rate    0x001c   120   120   000    Old_age   Offline      -       10807210
204 Soft_ECC_Correction     0x001c   120   120   000    Old_age   Offline      -       10807210
230 Head_Amplitude          0x0013   100   100   000    Pre-fail  Always       -       100
231 Temperature_Celsius     0x0013   075   075   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0032   000   000   000    Old_age   Always       -       276376
234 Unknown_Attribute       0x0032   000   000   000    Old_age   Always       -       486015
241 Total_LBAs_Written      0x0032   000   000   000    Old_age   Always       -       486015
242 Total_LBAs_Read         0x0032   000   000   000    Old_age   Always       -       57


те та которая была основной в зеркале - те и читала и писала, вышла из строя.
в принципе 8лет это хороший срок для SSD. Однако, ресурс по SMART не дает информации о скорой смерти SSD - те до выхода из строя у нее оставался еще огромный ресурс.




--------------------
Живы будем - Не помрем !
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
SuperMax
сообщение 18.12.2023, 14:06
Сообщение #7


Администратор
*****

Группа: Root Admin
Сообщений: 6 276
Регистрация: 7.1.2006
Из: Красноярск
Пользователь №: 1



Сдохла и вторая SSD

вообще за это время я поменял уже несколько SSD и сформировал мнение об этом

Резюме:
- SSD хорошо, но бекапы лучше хранить на физических жестких дисках
- предсказать смерть SSD крайне сложно, SMART не показатель
- для длительного хранения информации без изменения SSD не годятся


--------------------
Живы будем - Не помрем !
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения

Ответить в эту темуОткрыть новую тему
2 чел. читают эту тему (гостей: 2, скрытых пользователей: 0)
Пользователей: 0

 



Текстовая версия Сейчас: 19.3.2024, 15:59