Samsung SSD probléma

Fórum: 

Az utóbbi időben gyakran előfordul a számítógépemen (Linux Mint 21.3 [bár korábban 21.2-n is úgy emlészem, tapasztaltam már]) egy különös jelenség. Megállnak az alkalmazások, amiket használok, néha összeomlanak, és közben az ikonok tűnnek el a start menüről és a panelről (tálcáról), az asztalon is eltűnnek az ikonok, és egyik gomb sem reagál, kivéve, ha egy alkalmazás még be van töltve a cache-be (például a YouTube a böngészőben még elmegy egy ideig). A terminál sem jön be, és a start menüből sem lehet kikapcsolni a gépet: fizikailag kell újraindítani. Újraindítás után rendesen működik minden újra, amíg újra meg nem történik egy idő után ugyanez.

Nem egyszeri eset, és nem egy frissítés után kezdte el, mindig is volt ezzel probléma, amióta Linux-ra, és vele együtt új SSD-re váltottam. Azonban mostanra megelégeltem, de egyelőre nem találtam megoldást, úgyhogy hozzátok fordulok.

Olvasgattam kicsit, és felmerült a gyanú, hogy az SSD lehet a ludas. Egy Samsung 980 Pro 1TB SSD-t használok, titkosítás nélkül. Valóban olyan, mintha zárolna az SSD, mivel semmit nem ér el a gép onnan, és a logokban sem találtam semmi különöset (bár tény, hogy logok olvasásában nem vagyok túl gyakorlott). A firmware verziója a legfrissebb, amit a Samsung oldalán találok hozzá (bár így volt a dobozban, kézzel nem nyúltam bele a firmware-be). Ezen kívül nem rossz SSD, úgyhogy csak akkor szeretném lecserélni, ha feltétlenül muszáj. Mit javasoltok?

Log fájlok

Számomra ez inkább memória problémának tűnik, de a logokból ki fog derülni.
A logokat kell megnézni, hiszen arra valók. Ha nem vagy benne gyakorlott, utána lehet olvasni.
Esetleg a gépről is írhatsz valamit. Milyen a színe, mennyire hangos a ventilátor, meg ilyesmit.

Amikor legközelebb előjön a hiba, jegyezd meg az időt.
Ha kell indítsd újra a gépet, aztán nyiss egy terminált, és írd be ezt a parancsot:

journalctl --since "2024-03-25 17:27:00" --until "2024-03-24 17:30:00"

Az első idő a kiakadás előtti néhány perc legyen, a második az újraindítás előtti.
Csak azt nézd, ami pirossal jelenik meg, és másold ide.
De ha valamit százszor kiír, azt elég egyszer idemásolnod.

 

Értékelés: 

0
Még nincs értékelve

dmesg, fáljrendszer ellenőzés

Terminálba dmesg, mi piros esetleg?

Beállítások (Settings) -> Lemezek (Disks) -> Fogaskerék ikon, fájlrendszer javítása (Repair Filesystem) .

Előfordulhat, hogy zárolás miatt nem tud javítást eszközölni, ha futó rendszer alól indítod, lehet Live alól kell futtatni, ott angolul vannak a menüpontok.

Ugyancsak a Lemezek felületén három függőleges pont, SMART adatok, és öntesztek elérhető. Öntesztet viszont csak azután indíts, ha lementettél minden fontos adatot. Nekem volt szerencsém Samu EVO 960 SSD-hez, ami minden ilyen teszt során reallokált szektorokat, és rossznak jelölte amit reallokált, amit az érintett, annak kakukk volt. Minden önteszt után 5-6 rossz szektor. Garis volt, visszaküldtem, egy hónapig molyoltak vele, aztán visszafizették az árát.

Persze, lehet ez olyan random dolog, amit mondjuk napkitörés okoz, és nem reprodukálható, szoktam én is találkozni ilyennel, Cinnamon lefagy, majd elindul csökkentett módban, ilyenkor Gnome menüje van, panel eltűnik, és hasonlók, újraindítás után aztán hónapokig semmi, memtest, lemezek tesztje, minden rendben. (mondjuk az is Samu EVO 970 SSD-n van, ahol ezt tapasztalom, másik Crucial BX SSD-n levő rendszer még nem csinált ilyent.)

Értékelés: 

0
Még nincs értékelve

dmesg, fáljrendszer ellenőzés Log fájlok

#2

#1 Ezt írja a journalctl a megadott időben (bár nem piros):

Mar 25 19:23:04 kalevii-Mint kernel: [UFW BLOCK] IN=enp3s0 OUT= MAC=01:00:5e:00:00:01:5c:e9:31:19:f0:40:08:00 SRC=192.168.0.1 DST=224.0.0.1 LEN=32 TOS=0x00 PREC=0x00 TTL=1 ID=43321 DF PROTO=2 
Mar 25 19:23:24 kalevii-Mint kernel: [UFW BLOCK] IN=enp3s0 OUT= MAC=e0:d5:5e:a8:17:42:5c:34:00:fd:ed:79:08:00 SRC=192.168.0.128 DST=192.168.0.193 LEN=323 TOS=0x00 PREC=0x00 TTL=64 ID=13886 DF PROTO=UDP SPT=1900 DPT=53296 LEN=303 
Mar 25 19:23:25 kalevii-Mint kernel: [UFW BLOCK] IN=enp3s0 OUT= MAC=e0:d5:5e:a8:17:42:5c:34:00:fd:ed:79:08:00 SRC=192.168.0.128 DST=192.168.0.193 LEN=323 TOS=0x00 PREC=0x00 TTL=64 ID=14069 DF PROTO=UDP SPT=1900 DPT=53296 LEN=303 
Mar 25 19:23:26 kalevii-Mint kernel: [UFW BLOCK] IN=enp3s0 OUT= MAC=e0:d5:5e:a8:17:42:5c:34:00:fd:ed:79:08:00 SRC=192.168.0.128 DST=192.168.0.193 LEN=323 TOS=0x00 PREC=0x00 TTL=64 ID=14298 DF PROTO=UDP SPT=1900 DPT=53296 LEN=303 
Mar 25 19:23:27 kalevii-Mint kernel: [UFW BLOCK] IN=enp3s0 OUT= MAC=e0:d5:5e:a8:17:42:5c:34:00:fd:ed:79:08:00 SRC=192.168.0.128 DST=192.168.0.193 LEN=323 TOS=0x00 PREC=0x00 TTL=64 ID=14395 DF PROTO=UDP SPT=1900 DPT=53296 LEN=303

#2 dmesg-gel csak egy nvidiás cucc piros (bár ugyanez többször ismétlődik):

[   12.011280] [drm:nv_drm_master_set [nvidia_drm]] *ERROR* [nvidia-drm] [GPU ID 0x00000100] Failed to grab modeset ownership

Értékelés: 

0
Még nincs értékelve

dmesg, fáljrendszer ellenőzés Log fájlok

#2.1 Jó hogy írtál sok infót, mert az sohasem árt.

Az UFW blokkolja a bejövő forgalmat. Ez nem hiba, hanem jelzés.

Ugye látod, hogy az NVIDIA kártyára panaszkodik?
Ha ez az én gépem lenne, akkor kivenném belőle.
Ha úgy nem jelentkezik a hiba, akkor visszatenném, és újratelepíteném a drájverét.
Esetleg megpróbálnék néhány másikat is.
 

Értékelés: 

0
Még nincs értékelve

dmesg, fáljrendszer ellenőzés Log fájlok

#2.1.1 Megpróbáltam váltani egy újabb Nvidia driverre (535-ről 545-re), de a hiba ugyanúgy megmaradt.

Értékelés: 

0
Még nincs értékelve

dmesg, fáljrendszer ellenőzés Log fájlok

#2.1.1.1 Azzal nem segítesz, ha azt írod, megpróbáltál valamit, de nem lett jó.
Mondjam azt, hogy akkor próbálj meg mást?

Miért nem írsz néhány információt arról az Xboxról?
A súlyát, színét, meg ilyeneket.
Milyen gép?
Milyen videokártya?
Nem gondolod, hogy a típusa fontos lehet?

Nyiss egy terminált, és írd be ezt:

inxi -Fxxx

A választ meg másold be ide.
Ez a parancs információkat szolgáltat a gépedről.
Terminálba a Ctrl+Shift+V kombinációval tudsz bemásolni.

Értékelés: 

0
Még nincs értékelve

Specifikációk

#2.1.1.1.1

Asztali gép, néhány specifikáció:

5.15.0-101-generic kernel, Linux Mint 21.3

Alaplap: Gigabyte B360M DS3H

Videókártya: Nvidia GeForce GTX 1650 Super

CPU: Intel Core i7-9700

32 GB memória

Jó a hűtés, biztos, hogy nem az a baj, hogy felmelegszik.

Viszont megbizonyosodtam róla, hogy minden összeomlásnál ez az UFW-hívás az utolsó a logban.

Értékelés: 

0
Még nincs értékelve

Specifikációk hiánya

#2.1.1.1.1.1 Köszönöm, hogy elküldted az inxi -Fxxx kimenetet!
Sokat segített.

Ha a tűzfalra gyanakszol, mi lenne, ha kikapcsolnád?
Nálam 14 éve ki van kapcsolva, talán te is kibírod néhány órán át. Pláne, hogy arra panaszkodik a rendszered.

A grafikai elemek eltűnése miatt a videokártya még mindig gyanús.
Az NVIDIA az 550.67 drivert kínálja, de én megpróbálnám a nouveau drivert.

Értékelés: 

0
Még nincs értékelve

Specifikációk hiánya

#2.1.1.1.1.1.1 Ha a tűzfalra gyanakszol, mi lenne, ha kikapcsolnád?
Nálam 14 éve ki van kapcsolva, talán te is kibírod néhány órán át. Pláne, hogy arra panaszkodik a rendszered.

Egyfelől nem panaszkodik arra a rendszer, azok LOG bejegyzések, amit amúgy GUFW felületen lehet szabályozni (le is lehet tiltani, ha nem akarod látni)

Ha ez a terület gyanús, akkor nem a tűzfal az, ami rendszert megakasztja, hanem az, amit a tűzfal naplóz. Bár nem erre indulnék el, de ha de, akkor azt gondolnám, hogy a helyi hálón levő másik eszköz próbál betörni, és az akasztja meg a rendszert. Minek az IP címe 192.168.0.128, az micsoda? Egy másik gép? Windows van rajta? Vagy telefon? arra gondolnék azon van valami huncutság, ami be akar jutni a helyi gépre. Nem gondolnék elsőre virnyára, mert ahhoz elég béna, mert ugyanazokat a portokat használja, legalábbis, abban a részben ami ide lett másolva. Lehet valami bugos cucc a másik gépen. (az 1900-as portot kifejezetten az UPnP protokoll használja felderítésre)

Kapcsold le a 192.168.0.128-as eszközt, és figyeld, hogy akkor is kiakad-e a rendszered.

Értékelés: 

0
Még nincs értékelve

Specifikációk hiánya

#2.1.1.1.1.1.1.1 Lehet okoskodni, de felesleges.
Én már öt napja kikapcsoltam volna a tűzfalat, és kiszedtem volna az NVIDIA kártyát.
Akkor most sokkal többet tudnánk.

Persze lehet találgatni is, például újra lehet pasztázni mindent, aminek hűtőbordája van.

Értékelés: 

0
Még nincs értékelve

Specifikációk hiánya

#2.1.1.1.1.1.1.1

Még valami, ami talán hasznos lehet:

Használat közben nyitva hagytam a logs alkalmazást, és az összeomlás előtt volt még egy bejegyzés, ami újraindítás után már nem jelent meg, de telefonnal le tudtam fénykézeni (akkor már a gépen semmi nem reagált).

pcieport 0000:00:1b.0: [ 0] RxErr
pcieport 0000:00:1b.0: [ 0] RxErr
pcieport 0000:00:1b.0: device [8086:a32c] error status/mask=00000001/00002000
pcieport 0000:00:1b.0: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)
pcieport 0000:00:1b.0: AER: Corrected error received: 0000:00:1b.0

Értékelés: 

0
Még nincs értékelve

Specifikációk hiánya

#2.1.1.1.1.1.1.1.2 Nyomj egy

lspci

parancsot, mit mutat.

Értékelés: 

0
Még nincs értékelve

Specifikációk hiánya inxi -Fxxx

#2.1.1.1.1.1.1

Az inxi -Fxxx ezt írja:

System:
  Host: kalevii-Mint Kernel: 5.15.0-101-generic x86_64 bits: 64 compiler: gcc
    v: 11.4.0 Desktop: Cinnamon 6.0.4 tk: GTK 3.24.33 wm: muffin vt: 7
    dm: LightDM 1.30.0 Distro: Linux Mint 21.3 Virginia
    base: Ubuntu 22.04 jammy
Machine:
  Type: Desktop System: Gigabyte product: B360M-DS3H v: N/A
    serial: <superuser required>
  Mobo: Gigabyte model: B360M DS3H serial: <superuser required>
    UEFI: American Megatrends v: F17 date: 11/05/2021
CPU:
  Info: 8-core model: Intel Core i7-9700 bits: 64 type: MCP
    smt: <unsupported> arch: Coffee Lake rev: D cache: L1: 512 KiB L2: 2 MiB
    L3: 12 MiB
  Speed (MHz): avg: 800 min/max: 800/4700 cores: 1: 800 2: 800 3: 800
    4: 800 5: 800 6: 800 7: 800 8: 800 bogomips: 48000
  Flags: avx avx2 ht lm nx pae sse sse2 sse3 sse4_1 sse4_2 ssse3 vmx
Graphics:
  Device-1: NVIDIA TU116 [GeForce GTX 1650 SUPER] vendor: Gigabyte
    driver: nvidia v: 545.29.06 pcie: speed: 2.5 GT/s lanes: 16 ports:
    active: none off: DVI-D-1,HDMI-A-1 empty: DP-1 bus-ID: 01:00.0
    chip-ID: 10de:2187 class-ID: 0300
  Display: x11 server: X.Org v: 1.21.1.4 driver: X: loaded: nvidia
    unloaded: fbdev,modesetting,nouveau,vesa gpu: nvidia display-ID: :0
    screens: 1
  Screen-1: 0 s-res: 3200x1200 s-dpi: 96 s-size: 847x318mm (33.3x12.5")
    s-diag: 905mm (35.6")
  Monitor-1: DVI-D-0 pos: primary,left res: 1920x1200 hz: 60 dpi: 94
    size: 518x324mm (20.4x12.8") diag: 611mm (24.1")
  Monitor-2: HDMI-0 pos: right res: 1280x1024 hz: 60 dpi: 96
    size: 338x270mm (13.3x10.6") diag: 433mm (17")
  OpenGL: renderer: NVIDIA GeForce GTX 1650 SUPER/PCIe/SSE2
    v: 4.6.0 NVIDIA 545.29.06 direct render: Yes
Audio:
  Device-1: Intel Cannon Lake PCH cAVS vendor: Gigabyte driver: snd_hda_intel
    v: kernel bus-ID: 00:1f.3 chip-ID: 8086:a348 class-ID: 0403
  Device-2: NVIDIA TU116 High Definition Audio vendor: Gigabyte
    driver: snd_hda_intel v: kernel pcie: speed: 8 GT/s lanes: 16
    bus-ID: 01:00.1 chip-ID: 10de:1aeb class-ID: 0403
  Sound Server-1: ALSA v: k5.15.0-101-generic running: yes
  Sound Server-2: PulseAudio v: 15.99.1 running: yes
  Sound Server-3: PipeWire v: 0.3.48 running: yes
Network:
  Device-1: Realtek RTL8111/8168/8411 PCI Express Gigabit Ethernet
    vendor: Gigabyte driver: r8169 v: kernel pcie: speed: 2.5 GT/s lanes: 1
    port: 3000 bus-ID: 03:00.0 chip-ID: 10ec:8168 class-ID: 0200
  IF: enp3s0 state: up speed: 1000 Mbps duplex: full mac: e0:d5:5e:a8:17:42
Drives:
  Local Storage: total: 3.64 TiB used: 1.35 TiB (37.0%)
  ID-1: /dev/nvme0n1 vendor: Samsung model: SSD 980 PRO 1TB
    size: 931.51 GiB speed: 63.2 Gb/s lanes: 4 type: SSD
    serial: S5GXNX0W682063Y rev: 5B2QGXA7 temp: 38.9 C scheme: GPT
  ID-2: /dev/sda vendor: Western Digital model: WD10EZEX-07M2NA1
    size: 931.51 GiB speed: 6.0 Gb/s type: HDD rpm: 7200
    serial: WD-WCC3F1CCF1L4 rev: 1A01 scheme: MBR
  ID-3: /dev/sdb vendor: Western Digital model: WD20EZAZ-22L9GB0
    size: 1.82 TiB speed: 6.0 Gb/s type: HDD rpm: 5400 serial: WD-WXH2AB0FZFEF
    rev: 0A80 scheme: GPT
Partition:
  ID-1: / size: 915.32 GiB used: 535.67 GiB (58.5%) fs: ext4
    dev: /dev/nvme0n1p2
  ID-2: /boot/efi size: 511 MiB used: 6.1 MiB (1.2%) fs: vfat
    dev: /dev/nvme0n1p1
Swap:
  ID-1: swap-1 type: file size: 2 GiB used: 0 KiB (0.0%) priority: -2
    file: /swapfile
Sensors:
  System Temperatures: cpu: 27.8 C pch: 56.0 C mobo: 16.8 C gpu: nvidia
    temp: 50 C
  Fan Speeds (RPM): N/A gpu: nvidia fan: 38%
Info:
  Processes: 290 Uptime: 1h 27m wakeups: 0 Memory: 31.13 GiB
  used: 2.23 GiB (7.2%) Init: systemd v: 249 runlevel: 5 Compilers:
  gcc: 11.4.0 alt: 11/12 clang: 14.0.0-1ubuntu1.1 Packages: 2999 apt: 2967
  flatpak: 32 Shell: Bash v: 5.1.16 running-in: gnome-terminal inxi: 3.3.13

Nem sikerült azonosítanom a 192.168.0.128-as eszközt, dinamikusan vannak kiosztva az IP-címek, de ez mindig ugyanarról az IP-ről jön. A ping nem jön vissza. Viszont máskor is megtaláltam már a logban, nem mindig akasztja meg a rendszert - bár tény, hogy minden összeomlásos log ezzel végződik.

A nouveau driverrel próbálkoztam, de még nem töltöttem vele annyi időt, ami alatt ki lehet szűrni, hogy fennáll-e ugyanez a probléma, mivel NAGYON lassú. Nem nagy videókártya-igényű (11 éves!) programokat próbáltam vele használni, és körülbelül 1 képkocka volt másodpercenként.

EDIT: Nouveau driverrel is összeomlik, de ezzel csak a bejelentkezési képernyőre dob vissza. Közben felfigyeltem még egy dologra a logban:

GetManagedObjects() failed: org.freedesktop.DBus.Error.TimedOut: Failed to activate service 'org.bluez': timed out (service_start_timeout=25000ms)

Ez valami Bluetooth-nak tűnik, annak ellenére, hogy nem tudok róla, hogy lenne Bluetooth adapterem.

Értékelés: 

0
Még nincs értékelve

dmesg, fáljrendszer ellenőzés Log fájlok

#2.1 Secure boot kikapcsolása BIOS-ban, majd újra dmesg?

Értékelés: 

0
Még nincs értékelve

Információ hiány

Vannak, akik nem adnak semmi információt se a gépükről, se a hiba körülményeiről, és nem válaszolnak a kérdésekre sem. Aztán, ha ezt valaki szóváteszi, akkor megsértődnek.

Van ugyan egy nem túl használható leírás az oldalon arról, hogy hogyan kell hibát jelenteni, de még azt sem tartják be sokan: https://linuxmint.hu/informaciogyujtes-hibajelenteshez
És még akkor is csak vonakodva adnak információt, ha megkérik rá őket.

Ez például a te esetedben azt jelenti, hogy én azt ajánlottam, hogy szedd ki az NVIDIA kártyát, és próbáld ki anélkül.
Ha azzal kezdted volna, hogy információt szolgáltatsz a gépről, akkor nem ajánlottam volna ilyet, mivel az alaplapodon nincs integrált videovezérlő.
Így most én vagyok a hülye.

De nem csak a gépről kellene információ ahhoz, hogy hathatós segítséget nyújtson valaki, hanem a hiba körülményeiről is.
Nagyon nem mindegy ugyanis, hogy a hiba lett, vagy már eleve volt:
„Az utóbbi időben gyakran előfordul…”
„Linux Mint 21.3 bár korábban 21.2-n is úgy emlékszem...”
„nem egy frissítés után kezdte el, mindig is volt ezzel probléma, amióta Linuxra, és vele együtt új SSD-re váltottam”

De hagyjuk a múltat.
Én amatőr linuxos vagyok, és csak azt tudom neked megírni, hogy én mit csinálnék.

Először elindítanék egy live rendszert, és azt használnám egy ideig.
Bebútolsz a telepítőmédiáról, és a kipróbálást választod.

Ha így nem jelentkezik a hiba, akkor én nem szaroznék, és újratelepíteném a gépet. Tekintettel arra, hogy lehet, hogy azóta rossz.
Ha felmerült benned, hogy az SSD a hibás, akkor kiszedheted azt is, és visszateheted az előző lemezt.
Ha nincs, és nem tudsz szerezni, adok neked kölcsön egy tökéletesen működő 120 GB-os Kingston SSD, ha hajlandó vagy 40 percet utazni érte Szárligetre.

Amúgy, ha jól tudom, a Live rendszer működik úgy is, ha kiveszed az SSD-t.
Elindítod, használod, és teszteled. Menteni nem tudsz, bár a memóriádban elfér akár 10 film is.
Nem kapcsolod ki, csak készenlétbe kapcsolsz.

Én már 25-én megtettem volna ezt.
A tűzfalat letiltanám, és megnézném milyen alkalmazások indulnak el automatikusan, és mindent letiltanék, ami nem kell.

Értékelés: 

0
Még nincs értékelve

Információ hiány Információ hiány

#3

#3

Elnézést, hogy sokáig nem válaszoltam a posztomra. Kísérleteztem, megpróbáltam kitalálni, mi csinálhatja, és azt figyeltem meg, hogy miután kihúztam a merevlemezeimet, a hiba eltűnt. Majd visszadugtam, és szintén nem jött elő egészen tegnapig, amikor telepítettem (apt-tal) egy új csomagot, és sokszor kellett a gépnek képernyővédőre állnia. Ez a kettő különbség volt az előző héttől, amikor végig problémamentesen működött, minden hardverrel. Mivel a HDD-kkel van (úgy tűnik) baj, ezért inkább a csomagtelepítésre gyanakszok.

Tehát újra előjött a hiba, újra leválasztottam a HDD-ket, kicsit használtam a gépet, majd a HDD-ket újra vissza, és még mindig tökéletesen működik a gép.

Remélem, ez segít, és még egyszer elnézést kérek a kevés információ szolgáltatásáért és az inaktivitásért.

EDIT: Ha már információszolgáltatás, a git nevű csomagot telepítettem.

Értékelés: 

0
Még nincs értékelve