Автор: SuperMax 23.8.2016, 11:40
Осенью 2014ого я поставил SSD PNY Prevail Elite SSD9SC240GEDA-PB 240 Гб
модель SSD2SC240G0LC726B104-297
на сервер базы данных (на котором крутится и этот форум в том числе)
Сейчас, те почти через 2 года я решил оценить остаточный ресурс данных SSD (они стоят у меня в программном зеркале MD )
Для начала я решил достать техподдержку PNY
ибо уж производитель должен знать как проверить их железку
Цитата
Good day, support!
I have 2 in the SSD of your production
Please help assess their residual resource
SMART printing an attachment
----------------
Dear Mr
Could you please explain what do you need to know from those SSD?
Sincerely.
----------------
Good day, tech-sup.
> Dear Mr
> Could you please explain what do you need to know from those SSD?
> Sincerely.
I use your SSD in the server database.
I want to evaluate the residual SSD resource for planning new purchases.
In an attachment listing S.M.A.R.T. these discs
Please help
----------------
Dear Mr
Im not sure to understand what do you need, could you please clarify.
Do you need to check if we have this SSD model on stock?
Sincerely.
----------------
Dear Mr
Thank you for clarifying the query.
The information regarding the maximum number of supported write cycles should be stored in the firmware, with no access for the S.M.A.R.T. ability.
I don't see how that technology would know how to compute the number of remaining write cycles before the SSD go to the read-only status. It would only read for how long the device has run, how many bytes have been read or written.
It is possible to get some data from S.M.A.R.T. reports such as those files you sent us. A big part of it is quite meaningless for the common mortal.
The other part is relevant, provided the viewing utility can clearly show it. Maybe you could use one such as CrystalDiskInfo? You will get for instance the number of total GBytes that have been written on a specific SSD. That number, divided by the capacity of the device, should provide the number of write cycles that have already been used.
Does this help?
Автор: SuperMax 23.8.2016, 12:06
И так, техподдержка хоть и не в курсе какие данные отдаются через S.M.A.R.T
но однозначно подтвердила гипотезу об оценке ресурса через количество записанной информации
итак
у меня заявлен ресурс:
Код
Ресурс SSD 2.29 петабайт (иначе говоря 2290ТБ)
Ресурс SSD (циклов стирания/записи) 10K циклов стирания/записи
остается понять сколько записано
начнем
Код
#uptime
11:43:51 up 120 days, 25 min, 4 users, load average: 0.58, 0.40, 0.35
# iostat
avg-cpu: %user %nice %system %iowait %steal %idle
5,34 0,49 0,87 1,28 0,00 92,01
Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn
sda 269,73 2153,73 2286,57 22333246582 23710756484
sdb 259,43 0,02 2286,57 251024 23710756484
* обратите внимание что чтение идет практически только с SDA, нам потом это пригодитсянас интересует оценка количества записанной информации ГБ в сутки
если исходить из Blk_wrtn/s
то в сутки набегает ~94GB
если исходить из Blk_wrtn
то 11306GB/120=~94GB
значит в год ~34ТБ
всего прошло c 7.09.2014 по 23.08.2016 365+366-15=716дней
те записано должно быть примерно 67ТБ
теперь посмотрим S.M.A.R.T.
sda
Код
231 Temperature_Celsius 0x0013 097 097 010 Pre-fail Always - 0
233 Media_Wearout_Indicator 0x0032 000 000 000 Old_age Always - 54497
234 Unknown_Attribute 0x0032 000 000 000 Old_age Always - 57879
241 Total_LBAs_Written 0x0032 000 000 000 Old_age Always - 57879
242 Total_LBAs_Read 0x0032 000 000 000 Old_age Always - 77960
sdb
Код
231 Temperature_Celsius 0x0013 098 098 010 Pre-fail Always - 0
233 Media_Wearout_Indicator 0x0032 000 000 000 Old_age Always - 55559
234 Unknown_Attribute 0x0032 000 000 000 Old_age Always - 57879
241 Total_LBAs_Written 0x0032 000 000 000 Old_age Always - 57879
242 Total_LBAs_Read 0x0032 000 000 000 Old_age Always - 15
по информации из сети
параметр
231 означает остаточный ресурс SSD в %
если всего SSD рассчитана на 2290ТБ а у меня записано ~67ТБ что примерно 2.9%
соответственно эту информацию можно считать правдоподобной
теперь посмотрим на параметры, которые явно говорят о связи с количеством записанного и считанного - это
241 Total_LBAs_Written и
242 Total_LBAs_Read на основании данных iostat мы помним что чтение было почти только с SDA
и тут мы видим подтверждение этого -
242 Total_LBAs_Read у sdb мал!
соответственно у нас есть все основания считать, что информация в параметрах 241 и 242 имеет отношение к делу, остается проверить размерность.
и судя по всему это гигабайты, просто нагрузка за 2 года возрасла и мы получили большую цифру в 67ТБ против 57ТБ
остаются параметры
233 Media_Wearout_Indicator
234 Unknown_Attribute судя по числам они тоже имеют какое-то отношение к остаточному ресурсу, однако для нас это уже малопринципиально - с оценкой ресурса уже стало понятно
в текущем режиме, ресурс расходуется со скоростью ~1.5% в год, те SSD проживут дольше чем будут заменены из-за морального устаревания
Автор: SuperMax 2.10.2019, 11:41
На дворе 2019й близится к концу
посмотрим ресурс:
sda
Код
231 Temperature_Celsius 0x0013 086 086 010 Pre-fail Always - 0
233 Media_Wearout_Indicator 0x0032 000 000 000 Old_age Always - 165950
234 Unknown_Attribute 0x0032 000 000 000 Old_age Always - 286811
241 Total_LBAs_Written 0x0032 000 000 000 Old_age Always - 286811
242 Total_LBAs_Read 0x0032 000 000 000 Old_age Always - 241350
sdb
Код
231 Temperature_Celsius 0x0013 086 086 010 Pre-fail Always - 0
233 Media_Wearout_Indicator 0x0032 000 000 000 Old_age Always - 167384
234 Unknown_Attribute 0x0032 000 000 000 Old_age Always - 286811
241 Total_LBAs_Written 0x0032 000 000 000 Old_age Always - 286811
242 Total_LBAs_Read 0x0032 000 000 000 Old_age Always - 19
осталось ~86% ресурса SSD
средний расход ~2.8% ресурса в год
вообще расход вырос и можно прогнозировать срок службы как минимум еще 10лет при расходе 7% и запасе в 10%
Автор: SuperMax 11.2.2020, 14:33
Обратил внимание на
Код
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
9 Power_On_Hours 0x0032 084 084 000 Old_age Always - 14312 (218 110 0)
походу счетчик Power_On_Hours всего 15bit тк должно быть 47080 часов
ps: и хорошо что у меня не HP
тк у них это проблема https://support.hpe.com/hpesc/public/docDisplay?docId=emr_na-a00092491en_us
Автор: SuperMax 27.9.2021, 21:10
срез на сегодня
sda
Код
231 Temperature_Celsius 0x0013 079 079 010 Pre-fail Always - 0
233 Media_Wearout_Indicator 0x0032 000 000 000 Old_age Always - 232841
234 Unknown_Attribute 0x0032 000 000 000 Old_age Always - 429700
241 Total_LBAs_Written 0x0032 000 000 000 Old_age Always - 429700
242 Total_LBAs_Read 0x0032 000 000 000 Old_age Always - 486172
sdb
Код
231 Temperature_Celsius 0x0013 079 079 010 Pre-fail Always - 0
233 Media_Wearout_Indicator 0x0032 000 000 000 Old_age Always - 235117
234 Unknown_Attribute 0x0032 000 000 000 Old_age Always - 429700
241 Total_LBAs_Written 0x0032 000 000 000 Old_age Always - 429700
242 Total_LBAs_Read 0x0032 000 000 000 Old_age Always - 21
те осталось 79%
Автор: SuperMax 14.11.2022, 23:27
Весной этого года было принято решении о миграции на более толстые SSD тк 240GB стало не хватать под данные. Соответственно сервер с данными SSD был выведен из эксплуатации и работал как тестовый сервер.
И вот сегодня я обнаружил, что одна из SSD 240GB перестала отвечать
осталась вторая
у которой
Код
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x0033 095 095 050 Pre-fail Always - 10807210
5 Reallocated_Sector_Ct 0x0033 100 100 003 Pre-fail Always - 0
9 Power_On_Hours 0x0032 076 076 000 Old_age Always - 21297 (181 32 0)
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 79
171 Unknown_Attribute 0x000a 000 000 000 Old_age Always - 0
172 Unknown_Attribute 0x0032 000 000 000 Old_age Always - 0
174 Unknown_Attribute 0x0030 000 000 000 Old_age Offline - 18
177 Wear_Leveling_Count 0x0000 000 000 000 Old_age Offline - 26
181 Program_Fail_Cnt_Total 0x000a 000 000 000 Old_age Always - 0
182 Erase_Fail_Count_Total 0x0032 000 000 000 Old_age Always - 0
187 Reported_Uncorrect 0x0012 100 100 000 Old_age Always - 0
194 Temperature_Celsius 0x0022 029 048 000 Old_age Always - 29 (Min/Max 13/48)
195 Hardware_ECC_Recovered 0x001c 120 120 000 Old_age Offline - 10807210
196 Reallocated_Event_Count 0x0033 100 100 003 Pre-fail Always - 0
201 Soft_Read_Error_Rate 0x001c 120 120 000 Old_age Offline - 10807210
204 Soft_ECC_Correction 0x001c 120 120 000 Old_age Offline - 10807210
230 Head_Amplitude 0x0013 100 100 000 Pre-fail Always - 100
231 Temperature_Celsius 0x0013 075 075 010 Pre-fail Always - 0
233 Media_Wearout_Indicator 0x0032 000 000 000 Old_age Always - 276376
234 Unknown_Attribute 0x0032 000 000 000 Old_age Always - 486015
241 Total_LBAs_Written 0x0032 000 000 000 Old_age Always - 486015
242 Total_LBAs_Read 0x0032 000 000 000 Old_age Always - 57
те та которая была основной в зеркале - те и читала и писала, вышла из строя.
в принципе 8лет это хороший срок для SSD. Однако, ресурс по SMART не дает информации о скорой смерти SSD - те до выхода из строя у нее оставался еще огромный ресурс.
Автор: SuperMax 18.12.2023, 14:06
Сдохла и вторая SSD
вообще за это время я поменял уже несколько SSD и сформировал мнение об этом
Резюме:
- SSD хорошо, но бекапы лучше хранить на физических жестких дисках
- предсказать смерть SSD крайне сложно, SMART не показатель
- для длительного хранения информации без изменения SSD не годятся