Шокирующие болоты Суперкубка Сири: 33 победы за Орлов?

Не слишком шокирует, что недавнее исследование понимания Сири о истории Суперкубка обнаружило некоторые несоответствия, намекая на то, что у виртуального помощника Apple все еще есть место для улучшения, когда дело доходит до предоставления точных и надежных данных.

🚀 Хочешь улететь на Луну вместе с нами? Подписывайся на CryptoMoon! 💸 Новости крипты, аналитика и прогнозы, которые дадут твоему кошельку ракетный ускоритель! 📈 Нажмите здесь: 👇

CryptoMoon Telegram

В систематическом расследовании Пол Кафасис из Tsunami One Foot поинтересовался победителями каждого Суперкубка от I до LX и записал ответы Siri. Результаты были удивительно разочаровывающими, поскольку Сири точно определила победителей только в 34% случаев, то есть она получила всего 20 правильных ответов из 58 команд, которые играли в этих Суперкубках.

Стоит отметить, что Сири часто допускала ошибку, утверждая, что Филадельфийские Орлы выиграли 33 Суперкубка, когда на самом деле у них только один чемпионат под их поясом. Вместо того, чтобы предоставлять точную информацию или соответствующую информацию, Сири часто обсуждала неверные матчи Суперкубка и не связанные с не связанными футбольными фактами.

Хотя Siri время от времени давала серию правильных ответов, например три подряд в Суперкубке с V по VII, она также показывала впечатляющую серию ошибок: 15 прямых неправильных ответов от Суперкубка с XVII по XXXII.

После того, как я спросил о Суперкубке XVI, я обнаружил, что изящно отошел в сторону и указываю на ЧАТГПТ на ответ. Ясность и точность его информации послужили резким напоминанием о огромных различиях в базах знаний между системами искусственного интеллекта, такими как Siri, и более сложными системами ИИ, такими как CHATGPT.

Тест был проведен на версии iOS 18.2.1 с активированной интеллектом Apple, и были отмечены последовательные результаты в предварительной версии iOS 18.3 и MacOS 14.7.2. Это указывает на то, что проблема, по -видимому, влияет на несколько систем Apple. Кафасис подготовил отчет об этих результатах как в форматах Excel, так и в PDF, к которым вы можете получить здесь.

Сам по себе Джон Грубер из Daring Fireball решил проверить возможности Siri по спортивным вопросам, аналогично оригинальному тесту Кафасиса. Затем он сравнил ответы Сири на ответы Catgpt, Kagi, Duckduckgo и Google. Интересно, что все остальные платформы были успешными, где Сири потерпела неудачу.

Для Apple это потенциально более хлопотно, что, по словам Грубера, более старая версия Siri (до Apple Intelligence) была превосходной, не отвечая на вопросы напрямую, а вместо этого предлагая серию соответствующих веб -ссылок. Верхняя ссылка из этих результатов дала ответ, хотя и неполный, который был точным. Напротив, новый Siri, управляемый Apple Intelligence, работал плохо по сравнению с этим. Грубер уточняет это.

Новая версия Siri, в настоящее время обусловленная Apple Intelligence и интегрированной с CHATGPT, может иногда предоставлять ответы, которые являются неверными, но убедительными, что является наиболее вводящим в заблуждение способом ошибки. Более того, он, как правило, предлагает противоречивые ответы — я представлял один и тот же запрос четыре раза, только чтобы получать разные, неверные ответы каждый раз. По сути, этот новый Siri не может предоставить точную информацию последовательно.

Грубер заметил: «Трудно поверить, как мало Сири знает о такой широко известной теме. Если бы вы думали, что Сири правильно ответит на половину вопросов Суперкубка, вы ошибались, и конкурса не было.

Безусловно, Siri уже сталкивалась с критикой за общее представление, но комментарии Грубера о неточных ответах на вопросы викторины подчеркивают текущую проблему: чат -боты ИИ часто предоставляют вводящую в заблуждение или неверную информацию с непоколебимой уверенностью, явление, известное как «галлюцинация» в кругах искусственного интеллекта.

Apple работает над обновленной версией Siri, используя сложные модели большого языка, стремясь сделать ее более эффективной в конкуренции с чат-ботами, такими как ChatGPT. Разговорная Siri потенциально могла бы поддерживать непрерывные диалоги и предлагать помощь, аналогичную ChatGPT или Claude, но успех интеграции может быть сомнительным, учитывая прошлые трудности Siri.

Ожидается, что Apple представит Siri следующего поколения, получившую название LLM Siri, на своей Всемирной конференции разработчиков (WWDC) в 2025 году. Однако важно отметить, что Apple не выпустит эту новую версию сразу после ее анонса. Вместо этого пользователи могут ожидать обновления для iOS 19, которое принесет LLM Siri, ориентировочная дата запуска которого назначена на весну 2026 года.

Смотрите также

2025-01-24 14:31