Специалисты по искусственному интеллекту (ИИ) и компьютерным наукам Университета Альберты успешно решили проблему катастрофического забывания, которая существенно ограничивала возможности современных нейронных сетей для обучения на новых данных. Это достижение описано в статье, опубликованной в журнале Nature, и позволяет ИИ продолжать обучение бесконечное время.
Проблема катастрофического забывания заключается в том, что при обучении на новой задаче нейронные сети теряют способность выполнять предыдущую задачу. Это также актуально для больших языковых моделей (LLM), включая серии GPT, которые были разработаны на основе фиксированных наборов данных.
В процессе обучения нейросетей происходят сложные математические вычисления, которые изменяют веса связей между искусственными нейронами. Подобно силе синапсов в биологическом мозге эти веса определяют важность передаваемой через них информации. Современные методы обучения основаны на алгоритмах, таких как стохастический градиентный спуск и обратное распространение ошибки, однако они не способны эффективно объединять старые и новые данные, что остается не полностью изученным.
В новой работе ученые использовали стандартные алгоритмы обучения в сочетании с модифицированными наборами данных ImageNet и CIFAR-100 для непрерывного обучения. Было показано, что методы глубокого обучения теряют свою эффективность при непрерывном обучении, что приводит к потере пластичности.
Для решения этой проблемы и обеспечения бесконечной сохраняемости знаний исследователи предложили сбрасывать веса менее используемых узлов в нейросетях между сеансами обучения. Новая методика, называемая непрерывным обратным распространением ошибки, предполагает повторную инициализацию небольшого числа менее используемых и случайно выбранных единиц с использованием тех же подходов, которые применялись при первичной настройке системы.
Этот новый алгоритм успешно демонстрирует способность нейросетей продолжать обучение на новых наборах данных без утраты ранее приобретенных знаний. Это открытие открывает новые горизонты для развития искусственного интеллекта, позволяя ему адаптироваться к изменяющимся условиям и обрабатывать большое количество информации в течение неограниченного времени.
Источник: https://lenta.ru/news/2024/08/26/ii-nachnet-obuchatsya-beskonechno/