[Seek Help] 【求救】系统卡死,是SSD挂了吗?
Tofloor
poster avatar
gaokens
deepin
2022-06-13 04:43
Author

最近很郁闷,频繁卡死,有时一小时内要卡死7~8次,只能拔点重启才行,卡死时:

1、风扇狂转、本子发烫

2、有时无法通过CTRL+ALT+F2切换到tty2,有时能。

如果成功切换到了tty2,不断输出下图内容,但对键盘无响应。以前曾经怀疑跟搜狗输入法有关,但目前看来不像了,难道是SSD硬盘坏了?有没有人碰到类似问题?

Reply Favorite View the author
All Replies
灵兮之
deepin
2022-06-13 05:42
#1

看看是否是内存条问题

SSD挂掉的话一般是无法直接进入系统了

Reply View the author
dgmenghuan
deepin
2022-06-13 16:20
#2

大部分这是在线升级的后果

Reply View the author
wtz
deepin
2022-06-13 17:36
#3

有可能,建议检查一下SMART状态(可以用smartctl)。

当然也不排除主板上控制硬盘的芯片坏了。

Reply View the author
yitiaofish
deepin
2022-06-13 22:43
#4

建议:

  1. 先备份好数据
  2. 贴一下smart信息: smartctl -a /dev/nvme0n1p4
  3. 提供完整的内核日志(包含第一条出错日志)
  4. 尝试格式化分区并重新使用

上游有过类似问题,也没有很好的答案,大概得具体情况具体分析,所以日志和设备信息很重要

Reply View the author
gaokens
deepin
2022-06-14 04:01
#5
yitiaofish

建议:

  1. 先备份好数据
  2. 贴一下smart信息: smartctl -a /dev/nvme0n1p4
  3. 提供完整的内核日志(包含第一条出错日志)
  4. 尝试格式化分区并重新使用

上游有过类似问题,也没有很好的答案,大概得具体情况具体分析,所以日志和设备信息很重要

smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.15.34-amd64-desktop] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Number: Lenovo X800 NVMe M.2 2280s 1T SSD
Serial Number: 8S16010518X94300585
Firmware Version: EDFM00E2
PCI Vendor/Subsystem ID: 0x1987
IEEE OUI Identifier: 0x6479a7
Total NVM Capacity: 1,024,209,543,168 [1.02 TB]
Unallocated NVM Capacity: 0
Controller ID: 0
Number of Namespaces: 1
Namespace 1 Size/Capacity: 1,024,209,543,168 [1.02 TB]
Namespace 1 Formatted LBA Size: 512
Local Time is: Mon Jun 13 20:00:46 2022 CST
Firmware Updates (0x12): 1 Slot, no Reset required
Optional Admin Commands (0x001f): Security Format Frmw_DL NS_Mngmt Self_Test
Optional NVM Commands (0x005e): Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Timestmp
Maximum Data Transfer Size: 64 Pages
Warning Comp. Temp. Threshold: 68 Celsius
Critical Comp. Temp. Threshold: 70 Celsius

Supported Power States
St Op Max Active Idle RL RT WL WT Ent_Lat Ex_Lat
0 + 7.90W 0.0790W - 0 0 0 0 600 600
1 + 7.90W 0.0790W - 1 1 1 1 600 600
2 + 7.90W 0.0790W - 2 2 2 2 600 600
3 - 0.1000W 0.0790W - 3 3 3 3 1000 1000
4 - 0.0050W 0.0790W - 4 4 4 4 5000 100000

Supported LBA Sizes (NSID 0x1)

=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART/Health Information (NVMe Log 0x02)
Critical Warning: 0x00
Temperature: 29 Celsius
Available Spare: 100%
Available Spare Threshold: 5%
Percentage Used: 1%
Data Units Read: 22,592,768 [11.5 TB]
Data Units Written: 19,787,320 [10.1 TB]
Host Read Commands: 364,141,623
Host Write Commands: 409,084,996
Controller Busy Time: 7,053
Power Cycles: 2,657
Power On Hours: 7,510
Unsafe Shutdowns: 133
Media and Data Integrity Errors: 0
Error Information Log Entries: 3,214
Warning Comp. Temperature Time: 0
Critical Comp. Temperature Time: 0

Error Information (NVMe Log 0x01, max 16 entries)
Num ErrCount SQId CmdId Status PELoc LBA NSID VS
0 3214 0 0x101a 0x4005 0x028 0 0 -

Reply View the author
gaokens
deepin
2022-06-14 04:52
#6
It has been deleted!
gaokens
deepin
2022-06-14 05:42
#7
dgmenghuan

大部分这是在线升级的后果

也不知道是不是在线升级引起的,自从升级到V20.6的确碰到了许多问题。

Reply View the author
gaokens
deepin
2022-06-14 05:46
#8
It has been deleted!
gaokens
deepin
2022-06-14 05:48
#9
yitiaofish

建议:

  1. 先备份好数据
  2. 贴一下smart信息: smartctl -a /dev/nvme0n1p4
  3. 提供完整的内核日志(包含第一条出错日志)
  4. 尝试格式化分区并重新使用

上游有过类似问题,也没有很好的答案,大概得具体情况具体分析,所以日志和设备信息很重要

内核日志.zip

这个是导出的内核日志。

Reply View the author
joo
deepin
2022-06-15 00:12
#10

你是不是机器休眠过或待机过,20.6的待机和休眠有问题,起码在电脑有问题

Reply View the author
gaokens
deepin
2022-06-15 00:29
#11
joo

你是不是机器休眠过或待机过,20.6的待机和休眠有问题,起码在电脑有问题

有时开机的时候我人走开了,然后在输入密码的界面一直没输入过会就待机了(屏幕黑了),然后无论如何动鼠标和按键盘都没法唤醒。有过几次按电源键关机重启的。

Reply View the author