Основным источником информации о надежности РЭО и СА на всех этапах жизненного цикла являются сведения об отказах, поэтому анализ отказов имеет исключительно важное значение для системы управления надежностью. В процессе анализа отказы классифицируют, определяют причины их возникновения, раскрывают механизм отказов и разрабатывают технические и организационные мероприятия по их предотвращению.
Классификация отказов на этапе разработки и производства приборов имеет своей целью определение факторов, которые играют доминирующую роль в выявлении причин отказов. Такими факторами могут быть конструктивные недоработки, дефекты материалов, нарушения технологического режима и установленных процедур контроля и испытаний. Причины отказов могут быть организационными и техническими. Для устранения организационных причин необходимо уточнить процедуры контроля и самоконтроля операторов, процедуры испытаний, совершенствовать технологический процесс. Для устранения технических причин следует изучить механизмы отказов с целью выработки технических мероприятий по исключению их действия.
Особое внимание при анализе отказов уделяется систематическим, или повторяющимся, отказам. Они возникают под воздействием неслучайного сочетания неблагоприятных факторов, и поэтому причины, их вызывающие, должны быть выявлены и устранены.
Методика анализа отказов предусматривает ряд последовательных действий, направленных на выявление причин и механизмов отказов. Согласно этой методике, прежде всего, проводится тщательный анализ условий возникновения отказа, при этом детально изучаются рабочие режимы.
Основные виды отказов классифицируют по:
- характеру изменения параметров объекта - постепенный, внезапный;
- связи с отказами других объектов - независимый, зависимый;
- стадии возникновения причины отказа - конструкционный, производственный, эксплуатационный, деградационный;
- устойчивости неработоспособности - самоустраняющийся, перемежающийся,
- способу обнаружения - явный, скрытый.
При постепенном отказе изменение параметра происходит без резкого скачка. Например, качество поддерживающей жидкости гирокомпаса с течением времени постепенно снижается. Такие отказы вызываются износом и старением элементов изделия, особенно изоляции токоведущих частей и подвижных электрических и механических соединений. Старение изоляции, т. е. необратимое изменение ее структурного и химического состава, происходит под действием различных эксплуатационных факторов: температуры, влажности, вибрации, электродинамических сил и др. Износ элементов подвижных электрических контактов электрических машин (коллекторов, контактных колец и щеток) вызывается механическим трением, биением рабочих поверхностей, нагревом в контакте и искрением.
Постепенное изменение электрических параметров полупроводниковых приборов и интегральных микросхем обусловлено неравномерным распределением примесей в полупроводниковом кристалле, применением структур с резко отличающимися физическими характеристиками. Возможность изменения параметров и пределы этих изменений учитываются критериями отказа. Предельные изменения параметров приборов учитываются при конструировании аппаратуры, чтобы исключить чувствительность ее выходных характеристик к этим изменениям.
В качестве примеров постепенных отказов можно привести отказы приборов, происходящие в результате возрастания обратных токов р-п-переходов за счет токов утечек, уменьшения коэффициента усиления транзисторов, возрастания прямого падения напряжения диодов, изменения уровня нуля или единицы цифровых интегральных микросхем и порогового напряжения МДП-приборов.
Внезапный отказ характеризуется скачкообразным изменением значений одного или нескольких параметров объекта. Так, перегорание предохранителя в цепи питания силового трансформатора в усилителе эхолота приводит к мгновенному выходу из строя линии приема сигналов. Такие отказы происходят в основном в результате короткого замыкания или обрыва электрической цепи (жил кабеля и приводов, резисторов, конденсаторов, полупроводниковых приборов, ИМС и др.). К общим причинам внезапных отказов РЭО и СА относятся конструкционные недостатки, низкое качество изготовления, неправильные действия судового обслуживающего персонала.
Причинами внезапных отказов могут быть как естественные постепенные изменения физической структуры прибора, которые при определенных условиях приобретают лавинообразный характер, приводящий к отказу, так и условия функционирования прибора в аппаратуре. При использовании прибора в электрическом режиме в его структуре в результате локальных флуктуаций плотности тока и перегревов могут возникать микроповреждения, которые, накапливаясь, при очередной неконтролируемой кратковременной перегрузке приводят к внезапному отказу. Характерными примерами внезапных отказов являются обрывы в структуре прибора и короткие замыкания (КЗ), возникающие в результате пробоя диэлектрических изолирующих слоев или проплавления p-n-переходов, вызываемых перегрузками. За коротким замыканием, как правило, следует обрыв, так как в местах пробоя резко возрастает плотность тока, происходит значительный разогрев образовавшейся проводящей перемычки и ее перегорание.
Деление отказов на внезапные и постепенные носит достаточно условный характер и определяется, в основном, возможностями контроля параметров объекта. Отказ классифицируется как внезапный, если ему не предшествует направленное изменение какого-либо из наблюдаемых эксплуатационных параметров, и, значит, практически невозможно прогнозировать время возникновения такого отказа. Постепенному отказу предшествует закономерное изменение эксплуатационного параметра, что позволяет прогнозировать время возникновения отказа.
Для ряда элементов постепенные отказы составляют значительную часть всех отказов.
Вероятность появления постепенных и внезапных отказов некоторых радиоэлементов представлена в табл. 3.1.
По взаимосвязи между элементами отказы принято разделять на независимые и зависимые. Если отказ определенного элемента прибора не обусловлен повреждением или отказами других элементов, его называют независимым. Например, в гирокомпасе отказ системы ускоренного приведения гиросферы в меридиан не может быть обусловлен выходом из строя системы охлаждения, так как эти системы работают независимо друг от друга.
Отказ узла пройденного расстояния в лаге может быть связан с неисправностью в узле скорости. Так как эти узлы между собой сопрягаются, то этот отказ является зависимым. Выход из строя блока питания (при отсутствии защиты от КЗ) из-за короткого замыкания в потребителе электроэнергии также может служить примером зависимого отказа.
Отказы электронных приборов, возникающие в результате процессов, происходящих в их внутренней структуре, называют независимыми. Однако весьма часты случаи, когда повреждения приборов связаны с выходом из строя предохранителей цепей защиты от перегрузок и пассивных ограничительных элементов.
Отказы приборов по указанным причинам также называют зависимыми.
При рассмотрении причин выхода из строя полупроводниковых приборов и интегральных микросхем в аппаратуре необходимо установить степень зависимости отказа приборов от отказов других элементов. Это очень важно при выборе мер по устранению последующих отказов.
По характеру устранения различают самоустраняющиеся (сбой) и перемежающиеся отказы. В судовых условиях при кратковременном выключении судовой сети может нарушиться работоспособность любого судового электрорадионавигационного прибора (ЭРНП) и средства связи. Однако при подаче питания отказ может самоустраниться. Это пример сбоя, т. е. однократно возникающего и самоустраняющегося отказа или отказа, устраняемого оператором. Если несколько сбоев одного и того же характера следуют друг за другом, происходит перемежающийся отказ прибора. Простейшим примером таких отказов служат сбои, появляющиеся в приборах из-за наличия в объеме герметичного корпуса токопроводящих частиц, способных создавать кратковременные замыкания между внутренними выводами и отдельными токопроводящими дорожками.
Самоустраняющиеся отказы могут возникать вследствие кратковременного воздействия на некоторый элемент (или элементы) устройства или системы внешних помех, а также в результате кратковременного изменения параметров элементов (кратковременное нарушение контактов, подвижных связей и т. п.).
Самоустраняющийся отказ ЭВМ сопровождается искажением информации при операциях передачи, хранения и обработки, поэтому, если не устранить последствия такого отказа, задача может оказаться неправильно решенной из-за искажения данных, промежуточных результатов или непосредственно программ. При самоустраняющемся отказе РЭО и СА, построенных на базе микропроцессоров и ЭВМ, необходимо восстанавливать достоверность информации, например, путем повторного пуска программы или ее части; в этом случае ремонт или регулировка аппаратуры, как правило, не требуется.
По степени обнаружения различают отказы:
• явные - обнаруживаются визуально или штатными методами и средствами контроля и диагностирования при подготовке объекта к использованию или в процессе его применения по назначению;
• скрытые - не обнаруживаются визуально или штатными методами и средствами контроля и диагностирования, но выявляются при техническом обслуживании или с помощью специальных методов диагностирования.
При возникновении отказа или повреждения следует выявить признаки (критерии) нарушения работоспособности объекта, выяснить причину их появления, определить характер и последствия.
Конструкционные отказы происходят в результате несовершенства или нарушения установленных правил и (или) норм конструирования объекта. Причинами, вызывающими такие отказы, могут быть неправильная оценка возможностей приборов при их выборе для изготовления аппаратуры, ошибки при ее конструировании. В результате приборы могут подвергаться перегрузкам и преждевременно выходить из строя.
Производственные отказы возникают вследствие несовершенства или нарушения установленного процесса изготовления или ремонта объекта, который выполняется на ремонтном предприятии.
При производстве радиоэлектронной аппаратуры приборы могут повреждаться в процессе входного контроля из-за неправильного выбора режимов измерений и испытаний, при установке в аппаратуру вследствие нарушения технологических режимов сборки.
Эксплуатационные отказы связаны с нарушением установленных правил и (или) условий эксплуатации объекта. Приведем пример эксплуатационного отказа. Правила включения гирокомпаса требуют, чтобы перед пуском все выключатели находились в положении «Выключено». Если оператор, нарушив это требование, оставит выключатель затухания в положении «Без затухания», что соответствует состоянию «Включено», то гирокомпас в меридиан не придет, несмотря на то, что все операции пуска будут выполнены строго в соответствии с правилами. В результате неправильных действий оператора произойдет отказ, который следует квалифицировать как эксплуатационный.
Деградационный отказ обусловлен естественными процессами старения, изнашивания, коррозии и усталости при соблюдении всех установленных правил и (или) норм проектирования, изготовления и эксплуатации.
Ресурсный отказ возникает тогда, когда объект достигает предельного состояния.
Критерий отказа - это признак или совокупность признаков нарушения работоспособного состояния объекта, установленного в нормативно-технической и (или) конструкторской (проектной) документации (например, контрольные амперметры показывают ненормальные токи в цепи питания моторов гирокомпаса). Кроме того, к критериям отказов относятся качественные признаки, указывающие на нарушение нормальной работы объекта: конкретные изменения в приборе, связанные с возникновением отказа (например, обрыв провода, деформация детали, обгорание контактов и т. п.).
Причина отказа - это явления, процессы, события и состояния, приведшие к возникновению отказа объекта. Причинами отказов могут быть нарушения правил и норм, допущенные при конструировании, производстве и технической эксплуатации, а также естественные процессы изнашивания и старения.
Последствия отказа - явления, процессы, события и состояния, обусловленные возникновением отказа объекта. Например, последствием отказа волновода в РЛС является выход из строя радиолокатора.
Классификация отказов имеет большое значение в практике эксплуатации РЭО и СА, так как позволяет определять причины отказа и устранять их.
Рассмотренные выше термины отражены в Государственных стандартах и нормативно-технической документации и являются обязательными при классификации отказов.
В процессе эксплуатации представляется возможным обнаружить и устранить ряд повреждений, которые могли бы привести к отказам, называемым предотвращаемыми. К ним относятся в основном постепенные отказы, при которых удается контролировать предшествующее им изменение характеристик РЭО.
Некоторые повреждения объекта не могут быть обнаружены и в конечном счете могут привести к непредотвращаемым отказам. К ним относятся внезапные отказы, статистические закономерности возникновения которых неизвестны.
Следует иметь в виду, что не все постепенные отказы можно предотвратить, так как часто весьма трудно определить медленные изменения параметров различных элементов РЭО и СА. Не все внезапные отказы относятся к непредотвращаемым, так как появление некоторых внезапных отказов может быть предсказано на основе изучения статистических закономерностей их возникновения во времени. Деление отказов на предотвращаемые и непредотвращаемые является условным, используется при оценке эффективности профилактических работ. Совершенствование методов контроля радиоаппаратуры приводит к тому, что все большая часть изменений параметров аппаратуры может быть обнаружена и предупреждена.
Соотношение между количеством предотвращаемых и непредо-твращаемых отказов различных типов радиоаппаратуры оценивается коэффициентом характера отказов:
где - количество предотвращаемых и непредотвра-щаемых отказов в данном типе радиоаппаратуры.
На значение коэффициента характера отказов любого типа аппаратуры большое влияние оказывают конструкционные, технологические и эксплуатационные факторы: свойства материалов и технология изготовления элементов, физические и химические воздействия на аппаратуру при эксплуатации, длительность эксплуатации и т. д.
Коэффициент характера отказов A(t) может быть определен для конкретных типов радиооборудования на основании статистических данных по отказам. Ниже приведены значения коэффициента характера отказов (в %) некоторых элементов радиоаппаратуры:
В процессе эксплуатации значительное количество отказов радиооборудования можно предотвратить путем своевременного выявления неисправностей и их устранения (настройка, регулировка и т. д.). Количество предотвращаемых отказов зависит от качества выполнения работ. Кроме того, совершенствование методов и средств контроля способствует тому, что большая часть изменений параметров ТС может быть обнаружена, а значит, и предупреждена.
Анализ отказов аппаратуры показывает, что примерно 40 - 45% всех отказов происходит из-за ошибок, допущенных при конструировании, 20% - из-за ошибок в процессе производства, 30% - в результате неправильной эксплуатации, 5 -10% - вследствие естественного износа и старения.
Причины отказов интегральных схем. В настоящее время уделяется большое внимание контролю качества электронного оборудования, однако, несмотря на это, в процессе эксплуатации часто происходят отказы отдельных компонентов или целых систем.
Выход из строя компонента может произойти по целому ряду причин, в частности из-за перегрузок по току или напряжению, чрезмерного нагревания, воздействия агрессивных химических веществ или повышенной влажности, а также некоторых условий производства и эксплуатации оборудования. Так, на начальном этапе эксплуатации отказы являются результатом производственных дефектов, ошибок проектирования или неправильного использования компонентов, а также применения дефектных компонентов, которые не были выявлены на этапе входного контроля. Большинство отказов в активный период эксплуатации происходит из-за высокой температуры и влажности, перегрузок по току и напряжению, вибрации, тепловых и механических воздействий, в дальнейшем - в результате старения компонентов. Причинами отказов, возникающих в процессе эксплуатации, могут служить коррозия, электрическая утечка, пробой изоляции, перемещение металлических ионов в направлении тока под воздействием электрического поля, а также разрушение материалов и проводников. Отказы механических компонентов, например, разъемов, происходят в результате износа контактов и увеличения их сопротивления.
Среди факторов, которые наиболее часто являются причиной выхода из строя электронного оборудования, можно выделить следующие:
• электрические перегрузки. Повреждения, вызванные электрическими перегрузками в процессе работы устройства, возникают под воздействием повышенного напряжения, тока или мощности. К таким повреждениям относятся:
- разрушение переходов и областей металлизации, а также обугливание и разрушение, связанные с перегревом отдельных областей кристаллов (в полупроводниковых устройствах);
- разрушение резистивного слоя или перегорание (плавление) провода в проволочных резисторах, появление разломов и изменение цвета корпуса (в резисторах);
- пробой диэлектрического материала и выделение тепла (в конденсаторах);
- плавление провода в обмотках, приводящее к короткому замыканию витков, чрезмерному выделению тепла в них, перегоранию или обугливанию компонента (в трансформаторах и катушках);
• электростатические разряды. Происходят из-за накопления заряда на выводах микросхем. При соприкосновении заряженного объекта с проводящей поверхностью возникает электрический разряд, приводящий к кратковременному потоку большого количества электронов в проводнике. Если при этом происходят необратимые изменения во внутренней структуре микросхемы, она выходит из строя.
К повреждениям, вызываемым электростатическими разрядами, относятся:
- разрыв тонких оксидных пленок в полупроводниковых устройствах как следствие пробоя диэлектрика;
- плавление проводников и областей металлизации из-за перегрева под воздействием высокого напряжения;
- запирание КМОП-устройств вследствие возникновения паразитных /?-и-р-и-структур;
- ухудшение параметров или скрытые дефекты в структуре компонентов, которые не приводят к немедленному выходу устройства из строя, но делают работу системы неустойчивой и провоцируют эксплуатационные отказы в жестких условиях;
- наведение мощных электрических полей, приводящих к возникновению помех и сбоев в работе расположенных рядом электронных устройств.
Чувствительность устройств к электростатическим разрядам зависит от используемой технологии. Так, для биполярных устройств разрушающий потенциал составляет от 300 до 7.000 В, для КМОП-устройств - от 150 до 3.000 В. Некоторые меры защиты оборудования от электростатических разрядов разработчики предусматривают уже на этапе проектирования электронных схем, а именно: введение специальных защитных устройств в наиболее критические точки схемы, оптимизация проекта печатной платы с целью уменьшения длин проводников и предотвращения возникновения паразитных петель, правильный выбор используемой компонентами технологии и экранирование схемы от внешних электрических полей;
• электромагнитные помехи и тепловой удар. Быстроменяющиеся электрические и магнитные поля способствуют появлению электромагнитных помех в проводниках. Наиболее часто источниками таких помех являются флуоресцентные лампы, промышленное и медицинское электронное оборудование, а также электробытовые приборы, использующие электродвигатели. К естественным источникам такого рода помех можно отнести грозовые разряды. Электромагнитные помехи в объекте становятся проблемой, когда имеется их источник, среда, передающая или ответвляющая помехи, и чувствительная к ним система. Электромагнитный сигнал от источника помех передается на чувствительное устройство благодаря явлениям проводимости и излучения. В первом случае помехи проникают в устройство через прямой проводящий тракт, во втором - через окружающую среду. Для того чтобы уменьшить электромеханические помехи, необходимо уже на стадии проектирования выбрать правильные схемотехнические решения и соответствующие им компоненты, правильную разводку печатных плат, специальные приемы заземления и экранирования.