Проблемный 16-контактный разъем вывел из строя графический процессор H200 Hopper стоимостью 30 000 долларов

nvidia h200,12vhpwr,ремонт gpu,hopper,пайка,серверное оборудование

Техник успешно отремонтировал 16-контактный разъем питания на дорогостоящей серверной видеокарте NVIDIA H200 на архитектуре Hopper стоимостью $30 000. Повреждение возникло из-за ошибки пользователя, и мастеру пришлось перепаивать сигнальные контакты, в итоге обойдя проблемный узел для восстановления работоспособности.

За последние несколько лет зафиксировано множество случаев взрывов 16-контактного разъема питания, как на потребительских игровых картах, так и на профессиональных. И вот теперь эта проблема плохо спроектированного разъема (в некотором роде) коснулась и серверных GPU. Техник по ремонту northwestrepair недавно опубликовал на YouTube видео, где он чинит вышедший из строя серверный GPU H200 Hopper стоимостью 30 000 долларов с поврежденным разъемом 12VHPWR.

В отличие от большинства историй о поломках 16-контактного разъема, повреждение разъема на этом GPU H200 произошло по вине пользователя, а не из-за дефекта конструкции. Northwestrepair обнаружил, что большинство контактов погнуты и повреждены, что указывает на то, что тот, кто работал с GPU, вероятно, слишком агрессивно вставил кабель питания в разъем.

К счастью, технику удалось решить проблему: он взял запасной 16-контактный разъем питания и заменил четыре сигнальных контакта (sense pins) в новом разъеме на поврежденные контакты в 16-контактном разъеме H200. Это потребовало усилий — northwestrepair пришлось обрезать новые контакты по форме старых, а затем припаять их к разъему питания H200.

Ремонт не обошелся без сложностей: в середине процесса northwestrepair случайно припаял сигнальные контакты в неправильном порядке. Чтобы это исправить, он поменял местами сигнальные кабели на вилке, чтобы контакты, идущие к печатной плате (PCB), соответствовали (теперь уже некорректно расположенным) сигнальным контактам.

Несмотря на это, карта не включалась из-за короткого замыкания где-то на самой плате, связанного с сигнальными контактами. Поэтому, вместо того чтобы исправлять *это*, northwestrepair решил полностью обойти эти контакты, отключив резистор, соединяющий сигнальные контакты с картой. Это восстановило подачу питания на карту, и она была возвращена клиенту без дальнейшего тестирования (H200 несовместим с потребительскими настольными материнскими платами). В комментариях northwestrepair отметил, что клиент подтвердил работоспособность GPU, но не оплатил его труд.

H200 — это на данный момент устаревший GPU, основанный на архитектуре Hopper. NVIDIA выпустила несколько вариантов, но тот, что чинили в статье, был PCIe-версией с 16 896 ядрами CUDA, 132 SM, 50 МБ кэша L2, TDP 600 Вт, 141 ГБ памяти HBM3e и интерфейсом PCIe 5.0 x16. Независимо от возраста, GPU Nvidia H200 продается по цене около 30 000 долларов.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.