Когда я смотрю на свое рабочее пространство, немного неприятно слышать дружеский голос ИИ, предлагающего мне организовать этот хаос из устройств и распутать паутину проводов. Несмотря на чувство гордости, нельзя отрицать, что давно пора навести порядок.
🚀 Хочешь улететь на Луну вместе с нами? Подписывайся на CryptoMoon! 💸 Новости крипты, аналитика и прогнозы, которые дадут твоему кошельку ракетный ускоритель! 📈 Нажмите здесь: 👇
CryptoMoon Telegram
1) Моя сестра тоже согласна. Более широкая идея заключается в том, что ИИ может определить мой захламленный стол, предложить способы уборки и даже действовать самостоятельно — это будущее, о котором мы говорим, и чат-бот Google Gemini AI способен на многое из этого.
Ключевое нововведение, которое мы внедряем – это новая функция под названием Project Astra, разработка которой велась в течение довольно длительного времени. Она стала доступной для использования ранее в этом месяце. Основная идея заключается в предоставлении ИИ на вашем мобильном устройстве, который всезнающий, вездесущий и исключительно умный.
Google представляет свои выдающиеся возможности под неброским названием: ‘Gemini Live от Google’, предусматривающим обмен данными с камеры и экрана. Продукт, возникший из подразделения DeepMind компании Google, первоначально задумывался как «универсальный ассистент AI». Жаль, что выбранное название не соответствует его высоким амбициям.
Для начала давайте обсудим аспект доступности. Вот хорошая новость: новый набор инструментов теперь доступен для пользователей Pixel 9 и Galaxy S25. Однако если ваше устройство Android оснащено подпиской на Gemini Advanced, вы можете насладиться ранним доступом к этому инновационному инструменту.
Как исследователь, недавно я открыл удивительную услугу стоимостью 20 долларов в месяц, которую успешно реализовал на своем OnePlus 13. К моему удивлению, настройка прошла без особых усилий — не требовалось никаких сложных технических манипуляций!
С помощью нескольких простых действий — либо нажав комбинацию кнопок питания/регулировки громкости, либо проведя пальцем от угла экрана — вы можете без труда вызвать Gemini, независимо от того, какое приложение используется в данный момент. Эта новая функция камеры и совместного использования экрана будет доступна как оверлей во всей операционной системе, делая ее легко доступной по всем углам.
Понимание окружающего мира
Как любитель искусства и технологий, я начал процесс путем направления камеры на привлекательное произведение искусства. К моему удовольствию, Gemini Live быстро распознал это как захватывающую картину Мадхубани, поражая меня своей способностью различать живую цветовую палитру и характерные мотивы животных в этом уникальном стиле.
После этого он предоставил мне краткое изложение исторических событий и эволюций, которые произошли с течением времени. Детали были точными даже в мельчайших деталях. К счастью, вы также можете участвовать во взаимодействии на текстовой основе с Gemini, если говорить не подходит для вашей текущей ситуации.
Среди аспектов, которые мне нравятся больше всего в последнем аватаре камеры и экранного режима от Gemini Live, это его минимальная разговорчивость. Он позволяет легко перебивать, делая взаимодействия более натуральными и менее спланированными.
Я пробовал Gemini в различных ситуациях, и был не готов к этому.
Как аналитик, я считаю, что предоставляемая информация обычно кратка, словно побуждает меня задавать дополнительные вопросы вместо того, чтобы забрасывать меня излишними деталями. Она исключительно универсальна для различных тем и визуальных контекстов, но все же есть области, в которых возможны улучшения.
На данном этапе функциональность Google Lens не доступна для Gemini, поэтому она не может сравнивать изображения на вашем телефоне с онлайн-изображениями. Кроме того, если вы попросите Gemini узнать самые последние новости по определенной теме или об отдельном человеке, он не сможет предоставить актуальную информацию.
Проще говоря, я задавал вопросы о различных видах растений, рекомендовал рестораны, собирал информацию с досок объявлений и разбирался в инструкциях по новому лекарству после гриппа. К моему удивлению, Gemini справился с этой задачей лучше, чем я ожидал ранее, что весьма впечатляет для чат-бота на базе ИИ.
Раскрытие банка знаний
После этого я попросил Gemini понять сложный научный материал. Я положил книгу о машинном обучении в поле зрения камеры. К моему удивлению, не только Gemini Live распознал её, но и предоставил мне резюме основных тем книги и ключевых вопросов.
Сначала я обнаружил, что просматриваю главы книги. ИИ ощутил мой прогресс и замолчал, спросив, есть ли у меня предпочтение какой-либо конкретной главе, так как теперь я изучал оглавление.
Я был застигнут врасплох в этот момент.
Я попросил ИИ упростить некоторые сложные темы, и он справился замечательно, не только придерживаясь информации с страницы, но также используя дополнительные данные из своей обширной базы данных.
Когда я спросил о главных моментах, затронутых на начальной странице об влиятельном романе Бишама Сахни ‘Тамас’, ИИ правильно отметил упоминание награды Сахати Акедеми. Кроме того, он предоставил информацию, не указанную непосредственно на странице, такую как год получения этой престижной литературной премии и краткое содержание содержания книги.
С другой точки зрения, произношение языка хинди на Gemini Live было ужасающим. Проблема была не только в плохом акценте, но и в том, что Gemini постоянно произносил бессмысленные фразы и повторял несуществующие слова. Несмотря на это, система справлялась относительно хорошо с чтением урду, персидского и арабского языков, однако часто путалась со словами из разных строк.
В моей первой попытке сочинить урдускую поэзию программа сумела распознать как текст, так и суть стихотворения, что было весьма впечатляюще. Однако я обнаружил самую большую проблему — рассказ (повествование). Слушать англизированную версию урду оказалось дискомфортным для моих ушей.
Превосходит ожидания в неожиданных местах.
ИИ является исключительным инструментом для решения разнообразных задач, и его эффективность подтверждена многочисленными тестами. В моих собственных испытаниях я сравнил её с физическими вопросами, связанными с термодинамикой, электрохимическими уравнениями и статистическими проблемами, найденными в тетради. Система ИИ, Gemini Live, показала себя исключительно хорошо в этих заданиях.
Не только выполняла свои обычные задачи исключительно хорошо, но и прекрасно справлялась с творческими начинаниями. Моя сестра, талантливый дизайнер одежды, показала один из своих эскизов на экране камеры и попросила предложений по улучшению. Gemini Live похвалила дизайн, заметила сходства с определенными философиями дизайна некоторых брендов одежды и предложила несколько вдумчивых улучшений.
Когда меня попросили предоставить больше деталей, ИИ не только предложил моей сестре оптимальные инструменты для преобразования ручных эскизов в цифровые проекты, но также предоставил полезные ресурсы вроде рекомендаций по программному обеспечению и учебных материалов о том, где их найти.
Поместив несколько батареек Duracell в мою камеру, я не только получил точную идентификацию устройства, но и был предложен местным электронным торговым сервисом, который мог доставить их мне всего за несколько минут.
Эти сервисы, известные как Блинкит и Свайджи Инстамарт, в настоящее время можно найти исключительно в Индии, преимущественно в городских районах. В умеренно темной обстановке он сумел выделить пару проводных наушников с первого раза.
Осознание ситуации — его сильная сторона.
В сравнении с обычными разговорами в Gemini или информацией из обзоров ИИ в Google Поиске, живые беседы Gemini кажутся более осторожными при передаче знаний, особенно по чувствительным темам. Например, обсуждение предложений по питанию и медицинских процедур осуществляется с возросшей осторожностью, побуждая пользователей обращаться к специализированным ресурсам вместо этого.
Несколько знакомых ловушек
Что действительно выделяется для меня — это впечатляющая трансформация проекта Астра Gemini. Он предлагает дразнящий взгляд на то, что мобильные устройства могут стать способными в будущем. Если внести некоторые корректировки и дополнения, а также оптимизировать процессы между приложениями, он может легко сделать Google Поиск устаревшим. Однако сейчас есть несколько заметных проблем, которые требуют решения.
Иногда я замечаю сбои в системе памяти. Например, когда меня просят определить объект на изображении с камеры как фитнес-браслет, система верно идентифицирует его как Samsung Galaxy Fit 3. Но при последующем вопросе об этом же объекте она ошибочно интерпретирует его как фитнес-браслет Huawei.
У ИИ есть способность к прямой и достаточно смелой лжи, что было продемонстрировано, когда я попросил его суммировать мой отзыв об устройстве носимого типа. Вместо точного описания резюме он заявил, что Digital Trends еще не опубликовал обзор продукта. На самом деле статья была опубликована за неделю до этого.
После включения общего доступа к экрану, я попросил Gemini ознакомиться со статьями на моей авторской странице. В целом, он предоставил удовлетворительное резюме рассказов; однако иногда испытывал трудности с пониманием контекста. Например, ошибочно утверждал, что только Intel и AMD могут производить NPU для получения значка Copilot+, что неверно, так как другие компании также производят соответствующие NPU.
Напротив, в статье особо отмечено, что Qualcomm стала пионером в выполнении этих требований, опередив своих конкурентов. Только к концу прошлого года AMD и Intel сумели догнать и соответствовать минимальному стандарту для ИИ-чипов благодаря новому поколению процессоров.
Во время нашей беседы по статье произошел момент, когда казалось, что возникли проблемы с памятью и вместо продолжения обсуждения текущей темы, она вернулась к рассказу о первой статье, которая была показана через совместное использование экрана. Я прервал её как раз в конце этого рассказа, после чего Gemini исправил свою ошибку.
Одной из проблем с озвучкой на неанглийских языках является то, что Gemini Live иногда меняет тон и скорость голоса во время повествования. Это внезапное изменение было довольно пугающим, а произношение казалось роботизированным, резко контрастируя с его плавными и человекоподобными разговорными способностями на английском языке.
Проблемы с машинным зрением столь же заметны при работе со стилями креативных шрифтов. В некоторых случаях оно ошибочно предоставило неверные данные, и когда его попросили исправить ошибку, искусственный интеллект признал, что не имеет доступа к актуальной информации по этому конкретному вопросу. Хотя такие случаи нечасты, ошибки Gemini продолжают оставаться.
В заключение считаю, что Gemini Live с функцией видеозвонков и демонстрацией экрана представляет собой значительное достижение в области ИИ-технологий. Это одно из наиболее практически полезных примеров генеративного ИИ на сегодняшний день. Однако ему могли бы помочь увеличение разнообразия данных и решение проблемы чрезмерной уверенности и случайной нечестности.
Прогресс несомненно движется вперед, причем весьма значительно, однако все еще остаются некоторые ключевые ориентиры, которые нам необходимо преодолеть прежде чем достичь идеала ИИ-друга, как это описано в техновизуалистических устремлениях.
Смотрите также
- Бобби умрет в 9-1-1? Объяснение дикой концовки 7 сезона
- Обзор Motorola Moto G75: много функций, но есть недостатки
- Руководство EA Sports FC 25 — лучшая тактика построения, защиты и нападения
- Большая обнаженная сцена в «Доме Дракона» была чем-то большим, чем просто выстрел в член
- Месяц, 150 фотографий – мой вердикт камерам OnePlus 13
- Объяснение полностью фронтальной обнаженной сцены «Дом дракона» Юэна Митчелла
- Обнаженные сцены Антихриста Уиллема Дефо потребовали дублера, чтобы решить большую проблему
- В 12-м сезоне «Полиции Чикаго» будет момент Берджесса и Рузека, которого ждали фанаты
- Настоящая причина, по которой Сандра О не вернется в «Анатомию страсти»
- Что случилось с Джимом Стритом Алекса Рассела в сериале S.W.A.T. Седьмой сезон?
2025-04-14 02:59