Apple недавно обнародовала несколько моделей больших языков (LLM) с открытым исходным кодом, способных работать локально, а не полагаться на облачные серверы. Эти модели, получившие название OpenELM (эффективные языковые модели с открытым исходным кодом), доступны на Hugging Face Hub, платформе, предназначенной для обмена кодами искусственного интеллекта.
🚀 Хочешь улететь на Луну вместе с нами? Подписывайся на CryptoMoon! 💸 Новости крипты, аналитика и прогнозы, которые дадут твоему кошельку ракетный ускоритель! 📈 Нажмите здесь: 👇
CryptoMoon Telegram
Согласно информации, представленной в официальном документе (который вы можете найти в формате PDF), всего существует восемь моделей OpenELM. Четыре из этих моделей изначально были обучены с использованием библиотеки CoreNet, а остальные четыре модели были доработаны на основе инструкций. Apple использует послойный подход к масштабированию для повышения точности и эффективности.
Apple поделилась кодом, записями обучения и различными итерациями модели, а не только готовым продуктом для проекта искусственного интеллекта на естественном языке, с целью, чтобы эта прозрачность могла ускорить прогресс и способствовать «надежным выводам» в этой области.
OpenELM — это усовершенствованная языковая модель с открытым исходным кодом, отличающаяся эффективностью на уровне слоев. Используя стратегический метод масштабирования для каждого уровня модели трансформатора, OpenELM достигает превосходной точности. Например, при примерно одном миллиарде параметров OpenELM превосходит OLMo на 2,36 %, используя лишь половину необходимого количества токенов предварительного обучения.
Вместо того, чтобы просто предлагать веса моделей и программное обеспечение для вывода, как раньше, и проводить частное обучение на нераскрытых наборах данных, наша новая версия оснащена полной системой для обучения и оценки языковой модели на общедоступных наборах данных. Этот пакет включает в себя записи тренировок, различные контрольные точки и настройки предварительной подготовки.
Apple объявляет о распространении моделей OpenELM для стимулирования и расширения исследований в открытом сообществе с использованием передовых языковых моделей. Сделав эти модели общедоступными, исследователи смогут изучить потенциальные риски, данные и предвзятости. Разработчики и предприятия имеют возможность напрямую использовать модели или настраивать их в соответствии со своими потребностями.
Открытый обмен информацией теперь имеет решающее значение для Apple, чтобы привлечь элитных инженеров, ученых и специалистов. Такой подход позволяет получить доступ к результатам исследований, которые могли быть скрыты в соответствии с предыдущими правилами конфиденциальности Apple.
Apple пока не внедряла подобные функции искусственного интеллекта в свои гаджеты. Однако есть ожидания, что iOS 18 будет оснащена несколькими новыми возможностями искусственного интеллекта. Более того, ходят слухи, что Apple намерена использовать свои обширные языковые модели на самих устройствах для повышения конфиденциальности.
Смотрите также
- Бобби умрет в 9-1-1? Объяснение дикой концовки 7 сезона
- Обзор Motorola Moto G75: много функций, но есть недостатки
- Настоящая причина, по которой Сандра О не вернется в «Анатомию страсти»
- Месяц, 150 фотографий – мой вердикт камерам OnePlus 13
- Большая обнаженная сцена в «Доме Дракона» была чем-то большим, чем просто выстрел в член
- Руководство EA Sports FC 25 — лучшая тактика построения, защиты и нападения
- Обнаженные сцены Антихриста Уиллема Дефо потребовали дублера, чтобы решить большую проблему
- Что случилось с Джимом Стритом Алекса Рассела в сериале S.W.A.T. Седьмой сезон?
- Объяснение полностью фронтальной обнаженной сцены «Дом дракона» Юэна Митчелла
- Объяснение смерти Джона Казале: его болезнь и сколько лет ему было, когда он умер
2024-04-25 01:52