Apple недавно обнародовала несколько моделей больших языков (LLM) с открытым исходным кодом, способных работать локально, а не полагаться на облачные серверы. Эти модели, получившие название OpenELM (эффективные языковые модели с открытым исходным кодом), доступны на Hugging Face Hub, платформе, предназначенной для обмена кодами искусственного интеллекта.
🚀 Хочешь улететь на Луну вместе с нами? Подписывайся на CryptoMoon! 💸 Новости крипты, аналитика и прогнозы, которые дадут твоему кошельку ракетный ускоритель! 📈 Нажмите здесь: 👇
CryptoMoon Telegram
Согласно информации, представленной в официальном документе (который вы можете найти в формате PDF), всего существует восемь моделей OpenELM. Четыре из этих моделей изначально были обучены с использованием библиотеки CoreNet, а остальные четыре модели были доработаны на основе инструкций. Apple использует послойный подход к масштабированию для повышения точности и эффективности.
Apple поделилась кодом, записями обучения и различными итерациями модели, а не только готовым продуктом для проекта искусственного интеллекта на естественном языке, с целью, чтобы эта прозрачность могла ускорить прогресс и способствовать «надежным выводам» в этой области.
OpenELM — это усовершенствованная языковая модель с открытым исходным кодом, отличающаяся эффективностью на уровне слоев. Используя стратегический метод масштабирования для каждого уровня модели трансформатора, OpenELM достигает превосходной точности. Например, при примерно одном миллиарде параметров OpenELM превосходит OLMo на 2,36 %, используя лишь половину необходимого количества токенов предварительного обучения.
Вместо того, чтобы просто предлагать веса моделей и программное обеспечение для вывода, как раньше, и проводить частное обучение на нераскрытых наборах данных, наша новая версия оснащена полной системой для обучения и оценки языковой модели на общедоступных наборах данных. Этот пакет включает в себя записи тренировок, различные контрольные точки и настройки предварительной подготовки.
Apple объявляет о распространении моделей OpenELM для стимулирования и расширения исследований в открытом сообществе с использованием передовых языковых моделей. Сделав эти модели общедоступными, исследователи смогут изучить потенциальные риски, данные и предвзятости. Разработчики и предприятия имеют возможность напрямую использовать модели или настраивать их в соответствии со своими потребностями.
Открытый обмен информацией теперь имеет решающее значение для Apple, чтобы привлечь элитных инженеров, ученых и специалистов. Такой подход позволяет получить доступ к результатам исследований, которые могли быть скрыты в соответствии с предыдущими правилами конфиденциальности Apple.
Apple пока не внедряла подобные функции искусственного интеллекта в свои гаджеты. Однако есть ожидания, что iOS 18 будет оснащена несколькими новыми возможностями искусственного интеллекта. Более того, ходят слухи, что Apple намерена использовать свои обширные языковые модели на самих устройствах для повышения конфиденциальности.
Смотрите также
- Infinity Nikki — костюмы способностей, домен Curio и многое другое подробно в новом обзорном трейлере
- Объяснение полностью фронтальной обнаженной сцены «Дом дракона» Юэна Митчелла
- Elden Ring: Shadow of the Erdtree – все комплекты брони и их расположение
- Властелин колец: как выглядит Король-Чародей Ангмара в реальной жизни
- Как на самом деле выглядит ведьма из Блэр?
- Морская полиция: Майкл Уэзерли выпустил большое обновление Тали для сериала «Тони и Зива»
- Почему Люк Кляйнтанк покинул ФБР: International
- Черный сирота: Эхо, третий сезон Шорси и другие новые сериалы на этой неделе
- Связан ли Грогу с Йодой? Все имеющиеся на данный момент доказательства
- Лучшие цитаты из «Человека-паука: Через вселенные»
2024-04-25 01:52