Бесплатно Экспресс-аудит сайта:

28.09.2023

Следующий виток эволюции ИИ: свет превратит нейросети в суперэффективный мозг

Ученые из Массачусетского технологического института ( MIT ) и других учебных заведений представили новый метод обучения оптических нейронных сетей (optical neural network, ONN), который значительно превосходит современные электронные микропроцессоры по энергоэффективности и плотности вычислений.

Прогресс может привести к увеличению энергоэффективности в 100 раз при обучении нейросетей, таких как ChatGPT, открывая горизонт для дальнейшего улучшения в будущем.

Искусственные нейронные сети, имитируя обработку информации биологическим мозгом, стали неотъемлемой частью современных технологий. Такие нейросети используются в различных областях, включая распознавание изображений и речи, игры, медицину и химию. Современные модели ИИ, включающие сотни миллиардов искусственных нейронов, продемонстрировали экспоненциальный рост, что ставит под угрозу возможности существующего аппаратного обеспечения.

Новый подход, основанный на оптических нейронных сетях, предлагает решение текущих проблем. Согласно исследованию, подход оптических нейронных сетей (ONN) «с высокими тактовыми частотами, параллелизмом и передачей данных с низкими потерями» может преодолеть текущие ограничения.

ONN используют свет, который может переносить большое количество информации одновременно благодаря большой оптической полосе пропускания и передаче данных с низкими потерями. Кроме того, для масштабирования систем можно интегрировать множество фотонных схем.

Команда учёных использовала множество лазерных лучей для перемещения света в вычислениях, метод описан как «нейронное кодирование с помощью серийно производимого лазера поверхностного излучения с вертикальным резонатором микронного масштаба». Схема аналогична архитектуре «аксон-синапс-дендрит» в биологических нейронах.

Авторы работы объяснили, что современные модели, такие как ChatGPT, ограничены мощностью существующих суперкомпьютеров, делая экономически невыгодным обучение более крупных моделей. Однако новая технология может сделать возможным переход к моделям машинного обучения, которые иначе были бы недостижимы в ближайшем будущем.