Новости и мнения

Система распознавания объектов AI работает со скоростью света

Исследователи создали искусственную нейронную сеть с 3D-печатью, которая использует световые фотоны для быстрой обработки информации.

Если вы хотите, чтобы чрезвычайно быстрая система распознавания изображений или объектов обнаруживала движущиеся объекты, такие как ракета или автомобили на дороге, цифровая камера, подключенная к компьютеру, просто не годится, считает инженер-электрик Айдоган Озкан из университета. Калифорния, Лос-Анджелес. Таким образом, используя машинное обучение, инструменты оптики и 3-D печать, он и его коллеги создали систему, которая работает быстрее, работает с использованием света и, в отличие от компьютеров, не требует источника питания, отличного от исходного источника света и простой детектор. Их результаты опубликованы сегодня (26 июля) в журнале Science .

«Это очень инновационный подход к построению физической искусственной нейронной сети, состоящей из сложенных слоев оптических элементов», – пишет в электронном письме The Scientist Деметрий Псалтис , профессор оптики и электротехники в Fédérale de Lausanne Политехнической школы Швейцарии. ,

Новым здесь является не углубленное изучение, а оптическая инженерия и способность «делать слепки» из искусственной нейронной сети с использованием трехмерной печати, отмечает Олекса Биланюк , аспирант групп Ролана Мемизевича и Йошуа Бенгио. в университете Монреаля, который изучает машинное обучение и искусственные нейронные сети. «Предыдущая работа по созданию такой оптической сети была либо теоретической, либо построением гораздо более простых и небольших систем», – добавляет он.

Озкан хотел бы использовать систему для имитации различных глаз животных, которые обрабатывают свет и изображения не так, как человеческий глаз. Он может также использовать изобретение для микроскопических применений и медицинских изображений, если оно реализовано на более коротких длинах волн, используемых в оптической микроскопии.

Чтобы создать свою систему распознавания, Озкан и его коллеги сначала использовали подход, известный как глубокое обучение, при котором компьютеру дают аудио- или визуальные данные и обучают распознавать определенные шаблоны. Затем алгоритм создает правила для заданных данных и применяет их для описания новых входных данных.

В этом случае команда обучила свою сетевую модель распознаванию различных типов данных, включая изображения рукописных цифр от 0 до 9 и различные предметы одежды. В каждом случае компьютер создавал модель, состоящую из нескольких слоев пикселей. Каждый пиксель может передавать свет и представляет собой искусственный нейрон, соединенный с другими нейронами в том же или прикрепленном слоях.

Затем для каждого типа данных исследователи выполнили физическое представление модели, используя пять слоев пластика с трехмерной печатью, который затем мог обрабатывать каждый тип изображения с помощью лазера – монохроматического света с 0,4 терагерцовым излучением, а не видимого света.

Печатная полимерная нейронная сеть воспринимает свет, отражающийся от объекта, и обрабатывает его со скоростью света, исходя из физической структуры нейронной сети, и быстро сортирует объект или его изображение в нужную категорию, фокусируя свет на нужный детектор в выход из сети.

Печатный продукт похож на «физический мозг с нейронными связями, за исключением того, что здесь свет соединяет нейроны так, что информация может перетекать из одного слоя нейронов в другой», объясняет Озджан.

«Это чрезвычайно эффективная реализация нейронной сети, потому что после того, как пассивные дифракционные поверхности 3D-отпечатаны, они не используют электричество, а обрабатывают свой ввод« со скоростью света », без задержки», – пишет Биланюк в электронном письме . Ученый

В настоящее время исследователи работают над улучшением производительности модели компьютерного обучения. В случае обучающего набора цифр их искусственная сеть имела точность распознавания рукописных цифр примерно на 91,75%. Они также хотели бы масштабировать свою печатную сеть до более крупных размеров, чем напечатанные слои 8 см на 8 см, о которых сообщалось в документе. «Благодаря большему количеству слоев мы можем потенциально выполнять более сложные задачи с повышенной точностью», – говорит Озкан .

Для Psaltis новая работа ставит больше вопросов, чем ответов. «Можно ли сделать эту систему более надежной, можно ли увеличить скорость, какова стоимость моделирования и 3-D печати и как мы можем потенциально интегрировать этот инструмент с существующими цифровыми системами?», – пишет он.

По словам Биланюка, если бы система могла быть адаптирована для обычного освещения и миниатюрной, потенциальными приложениями могли бы быть обнаружение лица в камерах сотового телефона и автоматическая фокусировка без разряда батареи, как это необходимо для цифровых устройств.

X. Лин и др., «Всеоптическое машинное обучение с использованием дифракционных глубоких нейронных сетей», Science , doi: 10.1126 / science.aat8084, 2018.

Обсуждение

Ваш e-mail не будет опубликован. Обязательные поля помечены *