Crowdstrike Internet Outage: методы разработки, которые могли бы это предотвратить.

ГлавнаяДругие контенты, Новости, ТехнологииCrowdstrike Internet Outage: методы разработки, которые могли бы это предотвратить.
Crowdstrike Internet Outage: методы разработки, которые могли бы это предотвратить.
Crowdstrike Internet Outage: методы разработки, которые могли бы это предотвратить.
В моем последнем видео. В начале прошлой недели мы говорили о том, как исследование показало, что 90% всех катастрофических сбоев программного обеспечения были вызваны плохим кодом обработки ошибок.

На этой неделе давайте посмотрим, сможем ли мы подумать о каком-то событии, которое мы могли бы использовать в качестве примера плохой обработки ошибок, и поговорить о типичных проблемах в нашей отрасли, которые позволяют таким вещам случаться, и поговорить о ряд стратегий (точнее, семнадцать), которые должны были быть использованы, чтобы предотвратить возникновение такого кошмара, но, очевидно, этого не произошло.

00:00 Клоун (Толпа?) Удар провалился
00:45 После вступления к каналу
01:22 То, что мы знаем, произошло
03:28 Бизнес-причины, по которым это может произойти
06:28 Технические причины, по которым это может произойти
07:12 Для кого это видео?
07:56 Методы обработки ошибок
08:23 /"На МОЕЙ машине работает!/"
09:11 Юнит-тесты БЕСПОЛЕЗНЫ
10:01 Веб-программистам тоже есть чему поучиться
11:09 Как вы проверяете подобные вещи?
12:12 Что, если эти тесты не выявят это?
12:59 Поэтапное/медленное внедрение
13:33 Централизованный сбор журналов программного обеспечения
14:48 Проверяйте файлы на работоспособность перед их выполнением
15:17 Обращайте внимание на странное поведение, а не просто /"посмотрите, повторится ли это снова"
15:58 Выделение кода высокого риска, например синтаксического анализа новых файлов драйверов, в другой процесс.
16:18 Минимизируйте код, который выполняется в пространстве ядра, при загрузке или с повышенными разрешениями.
18:15 Почему обновление не откатилось при сбое загрузки?
19:54 Итог
22:26 Эти навыки не сможет заменить ИИ

Ссылки:
Статья в Википедии об отключении электроэнергии (на случай, если вы посмотрите это в будущем и не знаете, о каком отключении мы говорим):
https://en.wikipedia.org/wiki/2024_CrowdStrike_incident

Группа открытого исходного кода, которая знает, как откатить плохое обновление (в отличие от Microsoft) и как они это делают:
https://slimbootloader.github.io/security/firmware-resiliency-and-recovery.html

Мое предыдущее видео на тему «Почему бизнесы позволяют этому случиться»:
https://www.youtube.com/watch?vhKqqU1J-WXk

Мое видео, снятое в начале прошлой недели, о том, как «Проектирование программного обеспечения/» должно, но не включает в себя обработку ошибок:
https://www.youtube.com/watch?v4xqkI953K6Y

Статья (и презентация) о том, как 90% катастрофических сбоев программного обеспечения вызваны плохим кодом обработки ошибок:
https://www.usenix.org/conference/osdi14/technical-sessions/presentation/yuan

Миниатюры изображений из:
Автор Smishra1 — собственная работа, CC BY-SA 4.0, https://commons.wikimedia.org/w/index.php?curid150535443.
и/или
https://flickr.com/photos/84539227@N00/53867936421

Пожалуйста, воспользуйтесь возможностью подключиться и поделиться этим видео со своими друзьями и семьей, если вы считаете его полезным.

No Comments

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *