YouTube / Northwest Repairs
Это долгая история о восстановлении физически сломанной NVIDIA RTX 5090. Вероятно, какую-то другую видеокарту следовало бы выбросить, но эта слишком дорогая.
Существенно поврежденная RTX 5090 оказалась на видео компании Northwest Repairs, которая специализируется на сложных случаях ремонта. Видеокарта была треснувшей и не подавала «признаков жизни». Попытка ремонта перешла в череду приключений с обнаружением новых неисправностей и их успешным преодолением. Трещины на печатной плате могут прерывать сигнальные пути, спрятанные внутри текстолита, и приводить к, казалось бы, случайным и необъяснимым сбоям.
Первая неожиданность открылась уже после снятия системы охлаждения. Контактная пластина памяти не касалась испарительной камеры должным образом, так что теплоотвода практически не было. Модули питания и остальные компоненты казались неповрежденными, поэтому следующим шагом стал тест питания.
Даже в режиме ожидания видеокарта потребляла около 5 А — довольно много, но это может быть нормальным для 5090. Ток был увеличен до 8 А, чтобы видеокарта запустилась: засветились лампочки, вентиляторы вращались, но изображения не было, несмотря на сигнализацию монитора светодиодом о включении. Это означало, что видеокарта работала, но не выдавала изображение, что заставило предположить проблемы с видеопамятью.
Компьютер с процессором, который имел встроенную видеокарту, помог обнаружить недостаток в одном конкретном чипе памяти. Видеокарта не смогла завершить последовательность инициализации DRAM — признак повреждения чипа, вероятно, поврежденной пайки. 2 ГБ модуль Samsung GDDR7 выпаяли и снова припаяли на плату.
Но вентиляторы карты сразу же разгонялись до максимума — свидетельство, что до конца ремонта еще далеко. Также внезапно вышел из строя интерфейс PCIe, это могло произойти из-за попыток выключения и скрытых повреждений, которые привели к дальнейшим проблемам. Графический процессор был подвергнут реболлингу (перепайке) — тщательная работа со многими контактами, которая требует точности и мастерства.
Изменения привели к новой проблеме — недостаток памяти, вероятно, из-за нагрева. Тепловизор и последовательная проверка выявили неисправный модуль — именно тот, который был перепаян. После его полной замены короткое замыкание было устранено, но система по-прежнему не распознавала чип, поскольку протокол PEX на PCIe по-прежнему не работал.
На этом этапе первоначальный дефект платы, вероятно, ухудшился из-за всего нагревания. Только несколько фаз питания VRM фактически работали. Линии напряжения 12V и Vcore работали, но цифровые сигналы «Driver ON» не доходили до половины контроллеров VRM. След вел в толщу платы. Поскольку сигнал не распределялся между фазами, была проведена простая перемычка, чтобы восстановить разорванный путь. Это восстановило полную подачу питания, но PEX не работал. Была добавлена еще одна перемычка, чтобы перекрыть отсутствующий сигнал включения PCIe — это сработало, и карта продемонстрировала видеосигнал.
Но надежды на завершение ремонта все еще не оправдались. Обнаружение PCIe снова не работало, вентиляторы были на максимуме, а одна фаза памяти не включалась. После проверки оказалось, что PEX, поступающий из 3,3-вольтовой шины PCIe слота, не достигает назначения, что фактически приводит к отключению этой фазы. Окончательное исправление заключалось в том, чтобы проложить третий путь, для подачи 3,3 В непосредственно для этого сигнала включения памяти. После этого все заработало.
Соединение PCIe наконец-то стало стабильным, питание было сбалансированным по всем фазам, а видеокарта прошла полный раунд стресс-тестирования в бенчмарках и в играх. Это был один из случаев, когда ее сохранение дорогой видеокарты было не только возможным, но и абсолютно оправданным.
Источник: Tom’s Hardware