Niepokojące usterki systemów z Ryzenem (+ wpływ tzw. bullshit-job na jakość)
07.07.2020 | aktual.: 19.07.2020 00:45
Trochę ponad pół roku składałem system oparty na płycie głównej X570 Phantom Gaming-ITX/TB3, w lipcu pojawiła się wersja 2.30 UEFI i chciałbym się podzielić różnymi spostrzeżeniami...
Instalacja i ilość opcji
Strona producenta podaje, że uaktualniono AGESA Combo-AM4 1.0.0.4 Patch B na AGESA Combo-AM4 V2 1.0.0.2. Pobrałem, zainstalowałem (udało się) i próbowałem wgrać zapis ustawień z wersji 2.00 (płyta nie wstała).
Po kilkunastu restartach i naciskaniu przycisku czyszczącego pamięć CMOS udało się - płyta obudziła się do życia.
Zacząłem się przyglądać opcjom i okazało się, że jest ich MNIEJ, o wiele mniej (szacuję, że co najmniej jakieś 40%). Wyparowały różne opcje konfiguracji chipsetu (np. wyłączanie USB), procesora (np. związane z ilością rdzeni) i RAM (większość).
Proszę sobie wyobrazić sytuację - dosyć sensowny sprzęt został zakupiony z kompletem konkretnych funkcji, które po pół roku zostały wycięte wpień. Nie jest interesujące, czy zawiniła firma AMD czy Asrock - taka praktyka jest haniebna.
Innym problemem było to, że SoC/Uncore OC Mode ustawiało się zawsze na Enabled.
Dokonałem downgrade do wersji 2.00 i zabrałem się do dalszej zabawy.
VCore
System operacyjny, który jest na tym komputerze, to Ubuntu 20.04. Pozwoliłem sobie zainstalować jądro 5.7.7 z https://kernel.ubuntu.com/~kernel-ppa/mainline/ (wystarczy pobrać cztery pakiety DEB, czyli amd64/linux-headers-5.7.7-050707-generic_5.7.7-050707.202007010943_amd..., amd64/linux-headers-5.7.7-050707_5.7.7-050707.202007010943_all.deb, amd64/linux-image-unsigned-5.7.7-050707-generic_5.7.7-050707.202007010... i amd64/linux-modules-5.7.7-050707-generic_5.7.7-050707.202007010943_amd... i następnie użyć "dpkg -i") i skonfigurować czujniki ("sudo sensors-detect"), a następnie zacząłem podglądać sobie parametry (polecenie "sensors").
Okazuje się, że płyta potrafi chwilowo podbić napięcie VCore nawet do 1.48V.
I tu się włącza lampka ostrzegawcza - przy UEFI również mamy 1.44V (wartość już z lekka niebezpieczna).
Popatrzyłem w opcje i okazuje się, że niższe VCore można wymusić na trzy sposoby:
albo
albo
W wypadku pierwszym prędkość procesora jest ustawiona na sztywno 3500 Mhz (w każdym razie np. "watch -n.1 "cat /proc/cpuinfo | grep \"^[c]pu MHz\""" nie podaje, żeby ten zwalniał do ok. 2100 Mhz), tak samo w drugim (przy czym prędkość jest ustawiona na sztywno na podaną wartość), z kolei w przypadku trzecim prędkość się zmienia do ok. 3400 Mhz (a napięcie VCore jest ustawione "na sztywno")
Próbowałem również "włączyć" overclocking, ale...
...w UEFI nie widać możliwości wpisania maksymalnej wartości VCore (jest wartość dla natężenia prądu ICCMAX, ale nie ma VCORE MAX)
Co to oznacza?
Teoretycznie możemy ustawić różne limity, ale (przynajmniej w tej płycie) nie ma możliwości założenia kagańca na maksymalne napięcie VCore tak, żeby zachować zmienną prędkość procesora i zmniejszanie jego napięcia przy bezczynności (jeżeli zaś opcja jest, to jest ukryta w naprawdę przedziwny i skomplikowany sposób)
Czy to jest duża wada?
Na pewno jest to niepokojące zachowanie (jak wspomniałem, przy UEFI mamy 1.44V na stałe, podobnie zdarza się przy obciążeniu jednego rdzenia), z drugiej strony podczas stałego obciążenia wszystkich rdzeni VCore w wersji "zmiennej" stabilizuje się na ok. 1.25V.
Nie jest może tragicznie, ale dobrze też nie jest (proszę nie komentować, że się czepiam - spodziewam się, że płyta główna NIGDY nie będzie stosować wartości, które według wielu źródeł mogą prowadzić do degradacji procesora)
Przypomnę, obecnie możemy mieć:
- dynamiczne zmienianie prędkości i napięcia VCORE procesora (ale bez możliwości ustawienia górnej granicy VCORE)
- ustawienie VCORE na stałe i prędkości procesora na stałe
- ustawienie VCORE na stałe i zmienianie prędkości procesora max. do 3500 Mhz
A inne wady?
Pisałem już w grudniu, że problem chłodzenia chipsetu X570 jest rozwiązany w katastrofalny sposób - zamiast chłodzenia jak w laptopie (tzn. płaski wentylator pobierający zimne powietrze z tynelu panelu i wywiewający tam powietrze ogrzane) mamy wentylator pobierający ciepłe powietrze ze środka komputera i wdmuchujące je na chipset. Zastosowane rozwiązanie jest nie tylko mało efektywne, ale również wysokie, co powoduje brak kompatybilności z różnymi układami chłodzenia.
Innym problemem jest to, że X570 pobiera więcej prądu niż wcześniejsze chipsety, a opcje wyłączające nieużywane elementy (teoretycznie powinno to zmniejszyć temperaturę) wyparowały wraz z UEFI 2.30. Nie wiem, czy jest to związane z wielkością pamięci na UEFI, ale chcę przypomnieć, że już dawno temu istniały komputery z (pseudo) graficznym BIOSem i jakoś nie było problemu z wielkością kości (wideo ok. 12:02)
Czy naprawdę nie można okroić wyglądu UEFI, a nie usuwać opcji?
Cały ten cyrk z B550 i X570 generalnie mówiąc nie buduje zaufania do platformy, teraz jeszcze te napięcia...
To nie jest pierwszy tego typu problem, mieliśmy już fałszowanie wartości przekazywanych do procesora ( https://www.instalki.pl/aktualnosci/hardware/42253-plyty-glowne-oszuku... i parametr Power Reporting Deviation w HWInfo), mieliśmy problemy ze zbyt wysokimi napięciami przynajmniej na niektórych płytach (np. https://wccftech.com/amd-ryzen-cpu-gigabyte-x370-damage-burning-bios-u...), były przepychanki z włączaniem obsługi PCI4 i no i przede wszystkim ze zgodnością z procesorami.
Czy AMD nie powinno wprowadzić możliwości ograniczenia nie tylko dla TDC, EDC i PPT (pisałem już, jak tego używać), ale również napięć? Czy nie możnaby dać jasnego definiowania wartości granicznych w jednym miejscu? Po co obecnie aż trzy miejsca?
A teraz ogólnie (w oderwaniu od wspomnianego systemu)
To mnie troszeczkę prowokuje do głębszych rozważań na temat tego, jak tzw. bullshit-job wpływa negatywnie na nasze życie.
Tak się składa, że ostatnio widziałem wiele "odkrywczych" "artykułów" typu narzekanie na zamknięcie PCLab, ubolewanie nad reklamami w najdroższych flagowcach Samsung czy abonamentami w BMW.
Jeśli mam być szczery, to coraz częściej przy czytaniu czegokolwiek mam w głowie słowo "hiperinflacja". Od razu przypominają mi się opisy Niemiec po 1918 (gdzie marki traciły wartość z minuty na minutę, zaś na fali wielkiego rozczarowania po traktacie wersalskim popularność zdobyła partia pewnego kaprala) albo obrazki z USA (gdzie maklerzy rzucali się z okien wieżowców, a ludzie stali w kilometrowych kolejkach po talerz zupy).
Przypadek PCLab pokazuje jedną prostą rzecz - na hurtowe testowanie sprzętu mogą pozwolić sobie tylko nieliczni. Żeby firmy skłonne były pożyczyć dziesiątki płyt, procesów, kości RAM, itp., trzeba mieć kontakty lub wyrobioną markę (dodatkowo problemem jest to, że takie recenzje nie mogą być niepochlebne).
Oj Zdzisiu Zdzisiu, idę ci na rękę, a ty mi takie problemy robisz.
W dobie Internetu rację bytu ma co najwyższej kilka stron czy kanałów (a i tak ich treść będzie się powtarzać), może jeszcze miejsca prowadzone przez hobbistów, którzy publikują coś od czasu do czasu.
Narzekanie, że DP też obniżyły poziom, nie zmieni tego, że elektronika obecnie jest tylko i wyłącznie domeną wielkich firm, które dosyć starannie kontrolują, co i jak będzie o niej pisane.
Firmy te często i gęsto wydają się wykonywać chaotyczne ruchy.
Myślę, że przyczyną tego jest to, że hołdujemy zasadzie 8+8+8 (8 godzin pracy, 8 odpoczynku, 8 snu). Ludzie są zmuszani, że siedzieć cały dzień w biurze (dochodzi do tego oczywiście dojazd). Nie są przez szczęśliwi, co powoduje trzy problemy:
- ich produkty na rzecz firmy są co najwyżej średniej jakości
- frustracja wylewa się na wszelkich stronach przez bite 24h
- pracownicy nie mają zbyt mocno ochoty na żadne sensowne hobby (nie jest nim gapienie się w telewizor)
Brak rozwoju u poszczególnych osób powoduje stagnację, stagnacja powoduje problemy z jakością i ze zdrowiem, a pogorszenie zdrowia pogłębia problemy. Dochodzimy do sytuacji, gdy negatywy zaczynają się napędzać (powstaje swoista hiperinflacja), co powoduje wysyp kolejnych "rewelacyjnych" pomysłów na finansowanie całego tego cyrku (BMW z abonamentem i Samsung z reklamami).
W kraju, który podobno przoduje w trendach wolnościowych, ludzie już nie wytrzymali i doszli do rewolucji (bo jak inaczej nazwać BLM ?).
A w innych miejscach?
Doszliśmy do tego, że bardzo dużo "pracy" to obecnie przekładanie papierków albo wymyślanie rzeczy na siłę, żeby tylko cokolwiek pokazać. Wiele stanowisk jest tworzone tylko po to, żeby były - ci ludzie tworzą głównie "nowoczesne" idee, które prowadzą do dalszego powiększania frustracji.
Wróćmy teraz do przykładu AMD.
Jednym z topowych tematów IT AD 2020 są ich sukcesy, ale... firma nie jest jeszcze do końca wiarygodna. Dosyć chaotyczne ruchy z chipsetami, średnio udany X570 i raczej niespecjalnie udane wejście na rynek mobilny (wiele firm teraz wprowadza na rynek laptopy z Ryzeny 3xxx, a oferta z 4xxx jest wciąż dosyć skromna i często gęsto nie wykorzystuje nowych opcji procesorów).
Ktoś powie, że się czepiam, ale Hyperbook L14 z Intelem ma baterię 73WH. Ile takich modeli z Ryzen jest na rynku? Ile biznesowych Lenovo się pojawiło? Ile laptopów jest z dobrymi i matowymi ekranami?
Opóźnienia są spowodowane taką sobie jakością albo tym, że firmy dalej chcą promować Intela (w obu wypadkach jest to niekorzystne dla użytkowników).
Czy w tej sytuacji można bezwarunkowo ufać czerwonym? W domu to być może nie jest problem, ale w zastosowaniach profesjonalnych droga jeszcze daleka.
Na pewno w 2020 mamy ciekawą sytuację:
- Apple chce zrezygnować z Intela (krążą pogłoski, że chodzi o złą jakość) i na pewno przewróci rynek do góry nogami, ale obecnie powoduje to dylemat, czy kupować ich laptopy z tego roku (nie wiadomo, jak długo będą wspierane i mają problemy z USB 2.0) czy czekać na ARM (pierwsza generacja niekoniecznie będzie dopracowana)
- W pięknym wizerunku AMD pojawiają się skazy
- Intel i Samsung nadal idą w ceny i swoje strategie strategie
- Chińczycy atakują na wszystkich frontach
Wróćmy teraz do mojej tezy - korporacje to ludzie, nierzadko bardzo zmęczeni i sfrustrowani. Wielu z nich pracuje, żeby pracować, chociaż mogłoby wykorzystać ten czas lepiej.
Wyobraźmy sobie teraz, że dostajemy tyle samo pieniążków za 4h pracy dziennie (ewentualnie w systemie: "jak zrobisz, to idź"). Takie rzeczy już próbowano robić i wtedy wzrastała:
- efektywność (wszystko było zrobione na czas)
- zadowolenie (nikt się nie frustrował)
Żeby tego jednak dokonać, nie można zrobić takiego eksperymentu, a potem powiedzieć "ok, skoro 4h wystarczy, to pozostałe 4h będą służyć na inne nowe zadania".
Myślę, że w obszarze technologii doszliśmy w wielu sprawach do ściany i rozwiązania są "more than enough". Czeka nas rewolucja, bez której niedaleko zajdziemy... a rewolucją tą jest usunięcie 8+8+8.
Dziękuję (pisane przy średnim stanie umysłu).
Update 19.7: w przypadku tej płyty konieczne jest również użycie
sudo su echo "options nct6683 force=1" >> /etc/modprobe.d/sensors.conf
Dopiery wtedy widać też wpisy z układu monitorującego.