Бесплатно Экспресс-аудит сайта:

29.06.2023

Минцифры России научится обезличивать данные для ИИ

Минцифры России намерено создать в 2024 году специальную инфраструктуру внутри своей информационной системы, которая будет обезличивать персональные данные для различных целей, в том числе для обучения моделей искусственного интеллекта. Об этом сообщил заместитель руководителя ведомства Александр Шойтов.

«У нас в планах построение центра обезличивания – специальной инфраструктуры внутри ГИС Минцифры. Он будет брать исходные данные и делать из них обезличенные. Для того, чтобы создать центр, необходимо создать его макет - программно-аппаратный комплекс, и в процессе провести соответствующие исследования по обезличиванию», - сказал Шойтов.

Он уточнил, что макет будет разрабатываться на базе Национального технологического центра цифровой криптографии. “Первый вариант должен появиться в конце этого года. И уже полноценный макет, в котором будет реализовано много различных вариантов исходных данных, будет подготовлен к концу 2024 года… Центр обезличивания будет создаваться параллельно. Думаю, также в 2024 году”, - отметил Шойтов.

Замглавы Минцифры также отметил, что при обезличивании данных есть две задачи. Одна из них - сделать так, чтобы по обезличенным данным нельзя было точно определить исходные данные конкретного человека. Другая - сохранить качество данных для дальнейшего использования, например, для обучения искусственного интеллекта.

Он также заявил, что вопрос обезличивания достаточно сложный не только с технической точки зрения, но и с нормативной. Сейчас в Госдуму внесен проект федерального закона, в котором предусматривается нормативное регулирование одного из подходов.

“Это этап, когда мы обезличиваем данные и из них формируем дата сеты под конкретные задачи внутри информационной системы Минцифры — в центре обезличивания. Туда приходят разработчики искусственного интеллекта и обучают свои модели на специально подготовленных для них наборах данных, не выходя за пределы системы”, - подытожил Шойтов, отвечая на вопрос, где будут использоваться обезличенные данные.