SCSI Fixed Disk Diagnostic Error Return Codes

SCSI Fixed Disk Diagnostic Error Return Codes

In many cases, unnecessary replacement of SCSI fixed disk drives may be avoided by interpreting the Error Return Code that is provided by the Advanced Diagnostics.

The SCSI error codes for Advanced Diagnostics are different from the SCSI Power On System Test (POST) error codes provided in the hardware maintenance manuals. If SCSI errors occur during POST, the Advanced Diagnostics should be run prior to any parts being replaced.

When the SCSI Fixed Disk Diagnostic Test detects a failure in a hard file, a 12-character error code is generated, consisting of the 8-digit SCSI Error Code plus the 4-digit Error Return Code.

The following example illustrates how to decode and analyze Error Code 0210401H 9231, which was provided by the Advanced Diagnostics during an actual service incident.

Decode using the following format:

   0210401H 9231 (Error Code example)
   0210PLSC 9XYY (decoding key)
   ---+|||| ||-+
      ||||| || |
      ||||| || + Additional sense code (00-5D are valid codes
      ||||| ||   see 'Additional Sense Code' table
      ||||| ||
      ||||| |+-- Sense key (see 'Sense Key' table)
      ||||| +--- Unit reference code. (Important, see note below)
      ||||+----- Capacity code of the specific fixed disk being tested
      |||+------ Micro Channel slot of the SCSI adapter
      ||+------- LUN (logical unit number; on fixed disks)
      |+-------- PUN (physical unit number, that is, SCSI ID=4)
      +--------- Non removal fixed disk media (hard file)

The information contained in the first 8 characters is not error specific and points only to the device under test. The Return Code is more specific to the failure and may be decoded by referring first to the Sense Key and then the Additional Sense Codes. Some of the Sense Key and Additional Sense Codes represent a probable software problem. Operating System software has the capability of receiving this information and using it to provide detailed error information to the user, or to execute error recovery processes. The use of this capability varies by design from one operating system to another.

***** Note *****

If the Unit Reference Code is other than a '9' the Sense Key and Additional Sense Codes referred to in the Tables have DIFFERENT meanings and SHOULD NOT be used.

Sense Key

    Code      Interpretation
     0        No Sense Key. No sense key information is available
     1        Recovered Error. The last command completed successfully with
              recovery action performed by the device
     2        Not Ready. The logical unit addressed cannot be selected
     3        Media Error. The command terminated with a non recoverable
              error condition caused by either an error in the recorded data,
              or a flaw in the media (disk)
     4        Hardware Error. The device detected a non recoverable hardware
              error either while performing a command or during a
              diagnostic test
     5        Illegal Request. There was an illegal parameter in the command
              descriptor block or an additional parameter was supplied as
              data. This is a probable software error
     6        Unit Attention. The device has been reset by one of the
                       a Power-On sequence;
                       a bus Device Reset message;
                       a hard reset;
                       removable media was removed/inserted;
                       or a Mode Select command was issued
     7-A      N/A. Unused
     B        Aborted Command. The device aborted the command
     C-D      N/A. Unused
     E        Miscompare. Indicates that the source data did not match the
              data read from the media on a Write Verify or Verify command
     F        N/A. Unused
Additional Sense Code

    Code      Interpretation
     00       No additional sense information is available
     01       No index or sector was found. Low-level format the drive.
              If the diagnostics then run error-free, the drive is
     02       Seek is incomplete. The time required to physically move the
              head/arm assembly or switch heads exceeds the specified
              limits. Probably a hardware failure.
     03       Write fault. Occurs when a track position or write circuit
              fault is detected during a  write operation. This is not
              always a hardware failure. A physical jolt to the drive
              during a write operation could cause this situation. An
              isolated occurrence does not indicate a hardware failure.
     04       Drive is not ready. Occurs when the spindle motor speed is
              out of specification, or if the  device requires a
              motor start command and the  command was not issued.
              Perform Power-Off-On and retest the drive.
     09       Track following error. Occurs when the actuator position
              cannot be maintained over a given track. This is probably
              a hardware failure.
     0C       Write error. A failure occurred during write operation
              (probably with Verify on) and auto-reallocation of the
              sector failed or is not supported on this type of drive.
              A low-level format should be performed, or the sector
              re-assigned. If the diagnostics then run error-free, the
              drive is serviceable.
     10       ID CRC. A read error was detected in the ID field of the
              sector during a read or write operation. A low-level
              format should be performed. If the diagnostics then run
              error-free, the fixed disk is serviceable.
     11       Unrecoverable read error. Occurred in the data field of the
              sector that could not be corrected. The sector should be
              re-written or re-assigned, or a low-level format should
              be performed. If the diagnostics then run error-free, the
              drive is serviceable.
     14       No record found. Occurs when the SCSI device cannot find the
              requested record. Low-level format the drive, then
              re-test. If no error occurs, the drive is serviceable.
     15       Seek positioning error. Occurs when the positioning of the
              head/arm assembly to a new location failed. This is
              probably a hardware failure.
     16       Data synchronization mark error. Occurs when the sync. byte
              at the data field cannot be detected. A low-level format
              should be performed. If diagnostics then run error-free,
              the fixed disk is serviceable.
     17       Recovered read data without ECC. Occurs when the ECC check
              bytes, calculated from the read data during the first
              read operation, do not match the ECC check bytes appended
              to the data field, but did match on a subsequent read
              operation. This can result from a minor media defect.
              Rewrite or re-assign the sector, or low-level format the
              drive and re-run diagnostics. If no error is detected,
              the fixed disk is serviceable.
     18       Recovered read data with ECC. Occurs when the ECC check
              bytes, calculated from the read data during the first
              read operation, do not match the ECC check bytes appended
              to the data field, but had ECC correction applied on a
              subsequent read. Possibly a minor media defect. Rewrite
              or re-assign the sector, or low-level format the drive
              and re-run diagnostics. If no error is detected, the
              fixed disk is serviceable.
     19       Defect list error. Occurs when a data error is detected
              while reading the manufacturing defect list or while
              reading or writing the grown defect list. Ignore the
              grown defect list, low-level format the drive and
              re-test. If no error occurs, the drive is serviceable.
     1A       Parameter list length error. Occurs when the command
              operation code received by the device is invalid.
              Probably a software problem.
     1B       Synchronous data transfer error. An error occurred during
              data transmission. Check cable connections, cable
              termination, and for excessive cable length, then re-test.
     1D       Compare error. Occurs when the data read from the media does
              not match the data written to the media on a Write Verify
              command. Probably a hardware problem.
     20       Invalid command operation code. Occurs when the command
              operation code received by the device is not supported.
     21       Illegal logical block address. Occurs when the logical block
              address requested is outside the range supported by the
              device. Probably a software problem.
     24       Illegal field in the Command Descriptor Block (CDB). Occurs
              when the device detects unexpected values in any field of
              the CDB. Probably a software problem.
     25       Illegal LUN. Occurs when the LUN field  in the CDB is not
              supported.  Probably a software problem.
     26       Illegal field in the parameter list. Occurs when the device
              detects values other than expected in any field of the
              parameter list. Probably a software problem.
     28       Removable medium changed. (Not applicable for fixed disk
     29       Power-On Reset or Bus Device Reset. Indicates that the
              device (drive) was reset. A reset may have been issued
              by software or may caused by defective hardware.
     2A       Mode select parameters changed. This error is not a hardware
              failure, but could be due to either software or
              diagnostic code problems.
     31       Media format corrupted. The format of the media appears to
              be corrupted, or was interrupted (for example, by a
              Power-Down or a Reset) prior to completion of a Format
              Unit command. The Format Unit command should be re-issued
              and must complete successfully for this error condition
              to be removed.
     32       No defect spare location available. Indicates that the
              Reassign Block command cannot complete successfully
              because all available spare sectors have been used.
              Ignore the grown defect list, low-level format the drive
              and re-test. If no error occurs, the drive is serviceable.
     3F       Operating condition on the device has been changed. This is
              probably a software error.
     40       Component failure. The drive self-test diagnostics detected
              a failure (hardware) in the device.
     43       Message reject error. Occurs when an inappropriate or
              unexpected Message Reject is received from the SCSI
              Adapter/A or the SCSI Adapter/A rejects a message twice.
     44       Internal controller error. Occurs when an internal micro-
              processor detects incorrect status or receives an illegal
              request from the device electronics. This is a hardware
     45       Select/Re-Select Failed. Occurs when the SCSI Adapter
              fails to respond to a re-selection within 250
              milliseconds after the device gains bus arbitration. The
              re-selection is attempted a second time before setting
              'Select/Re-Select Failed' status.
     47       SCSI interface parity error. Occurs when the device detects
              incorrect parity on the SCSI data bus (cable). Check
              cable connections, cable termination, and cable length
              (maximum 6 meters, or approximately 20 feet).
     48       Initiator-detected error. Occurs when the SCSI Adapter/A
              detects an error, sends a message to retry, detects the
              error again, and sends the retry message a second time.
              This is probably a hardware problem.
     49       Inappropriate/illegal message. Occurs when the SCSI
              Adapter/A sends a message that either is not supported or
              is not in a logical sequence.  Probably a software error.
     4C       Logical Unit failed self-configuration. This is probably a
              hardware failure in the device being tested.
     4E       Overlapped commands attempted. This is probably a software
     5D       Predictive failure analysis threshold reached. When a
              predetermined number of errors is reached, this error
              message will prompt the user to take action to prevent
              loss of data. Backup the data and have the fixed disk
              serviced or replaced, as appropriate.

Back to  Jump to TOP-of-PAGE

Please see the LEGAL  -  Trademark notice.
Feel free - send a Email-NOTE  for any BUG on this page found - Thank you.