Японские ученые случайно удалили 77 Тбайт данных со своего суперкомпьютера

суперкомпьютер
Фото: Киотский университет

Исследователи потеряли 34 млн файлов из-за изъяна системы резервного копирования, подключенной к основной системе.

В середине декабря система резервного копирования (СРК) суперкомпьютера Киотского университета (Япония) дала сбой, в результате которого исчез большой объем данных. Об этом стало известно недавно. Ученые считают, что причиной потери файлов стало некорректное обращение с СРК, сообщает издание gizchina.com.

Как сообщают в университете, из-за ошибки в работе СКР данных, разработанной Japan Hewlett Packard LLC, система суперкомпьютера перегрузилась. В итоге, часть данных из хранилища была случайно удалена, а именно — около 77 ТБ, которые составляли 34 млн файлов. Пострадали файлы 14-ти групп пользователей, однако большинство файлов (для 10-ти групп) подлежат восстановлению, но вот файлы 4-х групп — нет.

"Приносим искренние извинения за доставленные неудобства. Мы постараемся сделать так, чтобы впредь подобная ситуация не повторилась", — говорится в официальном сообщении Киотского университета.

Ученые полагают, что при обновлении bash-скрипта, задействованного в процессе резервного копирования и отвечающего за удаление старых журналов, фиксирующих действия программы, была допущена ошибка "по невнимательности".

суперкомпьютеры, схема, Киотский университет Fullscreen
Группа суперкомпьютеров Киотского университета

Новую версию скрипта записывали поверх старого как раз в тот момент, когда старый скрипт уже начал работать. Эксперты из Japan Hewlett Packard говорят, что из-за этой накладки значения переменных были утеряны, новый скрипт загрузился не полностью, поэтому удалились файлы, а не старые журналы. Ошибку никто не заметил, что и привело к плачевным последствиям, сотрудники Japan Hewlett Packard признают свою вину.

В настоящее время процесс резервного копирования остановлен. Сотрудники университета планируют возобновить резервное копирование к концу января после исправления проблемы и принятия мер по предотвращению подобной ошибки.

"Поскольку массив определенных данных не подлежит восстановлению, в будущем мы реализуем не только резервное копирование путем зеркалирования, но и будем хранить инкрементные резервные копии некоторое время. Мы будем работать над улучшением не только функциональности, но и управления операциями", — отметили ученые.

"Однако сложно исключить все риски, включая возможность потери файлов из-за отказа оборудования или аварии. Поэтому, даже если вы обычный пользователь, сделайте резервную копию важных файлов в другой системе", — резюмирует СМИ.

Ранее мы сообщали о том, что американские ученые намерены преодолеть экзафлопсный барьер и запустить мощный суперкомпьютер в следующем году.