«Gemini — убийца дешевых копирайтеров» — так звучал бы кликбейтный заголовок этой статьи для «Яндекс.Дзен» или тизерных сайтов. Нейросеть хорошо прокачана под генерацию текстов и способна решить многие задачи по контенту. Но есть нюансы. О них, а также о перспективах Gemini в российском сегменте интернета — в нашем обзоре.
- Что такое нейросеть Gemini
- Что умеет нейросеть Gemini
- Как получить доступ к Gemini
- Как начать работу с Gemini
- Как составить рабочий промпт для Gemini
- Клоны Gemini
- Коротко о главном
Что такое нейросеть Gemini
Gemini — это семейство мультимодальных генеративных моделей искусственного интеллекта от Google. Ее главное отличие от традиционных (негенеративных) AI — более сложные алгоритмы и, как следствие, высокая вариативность ответов на запросы.
Чем шире база данных для обучения нейросети, тем полнее и креативнее ответы она выдает — это касается всех генеративных моделей искусственного интеллекта. Gemini доступен колоссальный массив данных из сервисов Google. Модель относится к категории мультимодальных, которые работают с разными типами данных: тексты, изображения, аудио, видео, программный код.
До февраля 2024 года нейросеть от Google называлась Bard. Но это был не просто ребрендинг, а полноценная эволюция. Архитектуру Bard основательно переработали под взаимодействие со всеми сервисами экосистемы Google. Ответы на запросы стали более подробными, точными и персонализированными, то есть учитывают предыдущую активность пользователя в сервисах Google.
Разработчик, компания Google, высоко оценивает потенциал нейросети. Согласно данным из презентации Gemini, тест версии Ultra по параметру MMLU (массовое многозадачное понимание языка) показал результат в 90 %. Это позволило сделать вывод, что точность и полнота ответов Gemini Ultra превосходит ответы живых людей — продуктовых экспертов. По данным анонса Google, Gemini показал преимущество над GPT‑4 в ряде бенчмарков, включая MMLU. Методики и результаты тестов обновляются, а итоги зависят от версий моделей и условий замеров — сверяйте детали в официальном источнике.
Gemini — это мощный универсальный инструмент от Google, который работает с текстом, изображениями и кодом. У него есть перспективы стать нейросетью № 1 для бизнеса, как минимум — в западном сегменте интернета, как максимум — в мире.
Что умеет нейросеть Gemini
Мультимодальная нейросеть способна не только выдать ответ на запрос, но и обучаться на данных разных типов. Соответственно, она выдает более быстрые и осмысленные результаты, чем унимодальные нейросети, которые ограничены одним типом информации — например, Kandinsky, которая нарисует вам красивую картинку, но не напишет текст.
Какие задачи можно решить с помощью нейросети Gemini:
- Написать коммерческий или художественный текст с нуля.
- Отредактировать авторский текст.
- Создать изображение в заданном стиле (с ограничениями, о них ниже).
- Транскрибировать аудио в текст или создать субтитры к видео.
- Найти информацию в интернете по запросу, в том числе, используя данные с камеры устройства.
- Управлять работой сервисов Google — например, найти файл в Google Docs или проложить маршрут на карте.
- Поддержать диалог на заданную тему.
Рассмотрим подробнее каждую из ее возможностей в рамках решения рутинных задач по контенту, которые могут возникнуть у маркетолога или владельца бизнеса.
Написание текстов и поиск информации
Gemini пишет связные и грамотные тексты на основе информации, которая есть в Google. Можно задать источники, на которые стоит ориентироваться. Нейросеть не проводит собственную аналитику. Но если у вас есть собственные цифры, факты или другие наработки, можно предоставить их в качестве дополнительной информации к запросу, и Gemini включит их в текст.
В коммерческих текстах важна уникальность — смысловая и техническая. Что до первого, Gemini не выдает ничего сверх того, что уже есть в интернете. Нейросеть выбирает источники по целому ряду параметров, включая экспертность и актуальность, а не берет верхушку выдачи Google, как дешевые рерайтеры.
Техническая уникальность результатов не идеальная, но и плохой ее не назвать. Например, по запросу «напиши уникальный текст для страницы сайта про забивку буронабивных свай с описанием процесса» Gemini показал результат почти в 87 % по сервису text.ru.
Создание уникальных изображений
Gemini может сделать любые изображения для коммерческих текстов на основе исходников из Google. Генерация изображений с людьми может быть ограничена и зависит от региона и настроек аккаунта. Сервис может отклонять запросы на создание лиц/силуэтов в соответствии с политиками безопасности и недопущения предвзятости. Зато неодушевленные объекты получаются вполне естественно.
Программирование
Здесь прогресс пока шагнул не так далеко. Полноценный сайт или приложение по одному запросу Gemini, как и любая другая нейросеть, не сделает. Но она может написать «рыбу» программного кода, которую можно доработать до вменяемого результата.
ИИ задает наводящие вопросы, которые помогут ему выдать релевантный ответ. Эта функция делает Gemini неплохим тренажером для начинающих разработчиков.
От возможностей перейдем к тому, как использовать сервис:
Линейка моделей включает Flash/Pro (в чате) и расширенные модели в подписке Gemini Advanced. Доступность функций зависит от региона и аккаунта.
- Flash: быстрые ответы и простые мультимодальные задачи.
- Pro: сбалансированная модель для большинства ежедневных запросов.
- Расширенные модели (в Advanced/API): повышенные возможности и контекст для сложных сценариев.
| Параметр | Бесплатно | Gemini Advanced |
|---|---|---|
| Модели по умолчанию | Flash/Pro (зависит от региона) | Доступ к более мощным моделям |
| Контекст/лимиты | Базовые квоты | Расширенные квоты и функции |
| Мультимодальность | Текст + базовый визуальный ввод | Расширенные сценарии (там, где включено) |
| Интеграции | Базовые | Глубже в экосистеме Google |
| Стоимость | 0 ₽ | Зависит от страны/аккаунта |
| Доступность функций и цены зависят от страны и аккаунта. Сверяйте на официальной странице тарифов Google. | ||
У платной версии возможностей больше:
- Расширенные алгоритмы генерации изображений.
- Редактирование и выполнение программного кода на Python.
- Интеграция со всеми сервисами Google, включая хранилище Drive.
- Ранний доступ к новым функциям нейросети, которые Google добавляет почти еженедельно.
Контекстное окно и лимиты в подписке Gemini Advanced существенно шире, чем в бесплатной версии. Актуальные лимиты и стоимость зависят от страны и типа аккаунта — сверяйте на официальной странице тарифов Google. Пробный период может быть доступен, если это предусмотрено условиями вашего региона и способа оплаты.
Как получить доступ к Gemini
У нейросети есть браузерная версия и мобильные приложения для iOS и Android. В «яблочном» варианте нейросеть уже встроена в приложение Google. Официальная эмблема Gemini — синяя звездочка-квадрат.
Получить доступ к расширенным возможностям Gemini на особых условиях можно через сервисы Google для разработчиков — Google AI Studio и Google Colab. Там можно найти подсказки и готовые решения по использованию нейросети в программировании, а также приложить руку к улучшению архитектуры Gemini.
FAQ: частые проблемы с доступом из России
Сайт пишет «Gemini не поддерживается в вашей стране»
Подключите VPN, очистите кэш/куки, создайте чистый профиль браузера, перезапустите сессию и повторите вход в аккаунт Google.
Какой регион VPN выбрать?
Подключение к поддерживаемой стране. Избегайте частой смены стран в одной сессии, чтобы снизить риск подозрительной активности.
Как оплатить подписку Gemini Advanced?
Оплата доступна при наличии подходящего способа оплаты и региона аккаунта. Рассматривайте варианты с иностранным способом оплаты, учитывая условия сервиса и возможные проверки.
Почему не проходят российские карты/номера?
Действуют региональные ограничения. Используйте допустимые способы оплаты и номер, соответствующие поддерживаемому региону.
Как снизить риск бана аккаунта при использовании VPN?
Не нарушайте условия сервиса, не делитесь аккаунтом, избегайте частой смены IP/стран, включайте двухфакторную аутентификацию.
Оговорка: Используйте VPN и способы оплаты в соответствии с законодательством вашей страны и условиями сервиса.
- Подберем кейсы под вашу отрасль. У нас их много!
- Расскажем о новых тенденциях в коммуникациях: ML, RFM-сегментации
- Покажем, как CRM-маркетинг может сочетаться с другими каналами привлечения
- Проведем аудит ваших коммуникаций
Как начать работу с Gemini
Что следует знать в первую очередь: нейросеть не доступна с российских IP-адресов, хотя русский язык в ней поддерживается. Зайти в нее можно так же, как в «Нельзяграм», через VPN-сервис.
Алгоритм работы с нейросетью:
- Авторизуйтесь в аккаунте Google и зайдите в браузерную или мобильную версии Gemini.
- Сформулируйте запрос к нейросети.
- Дождитесь ответа. Изучите контекстные подсказки от нейросети и уточните свой запрос, если это необходимо.
Google предупреждает, что ответы Gemini нельзя использовать в качестве профессиональных рекомендаций: медицинских, юридических и т. д. Из FAQ по нейросети четко следует, что вся ответственность за интерпретацию и использование результатов работы с нейросетью лежит на пользователе.
Как составить рабочий промпт для Gemini
Промпт — это задача, которую вы ставите нейросети в виде текстового запроса. Его логическая структура включает основной и уточняющие компоненты. Основной формулирует требования к форме и содержанию, например «напиши обзор на вторую часть „Джокера“». Уточняющие компоненты задают детали, например «без спойлеров» или «с рецензиями критиков». Другими словами, промпт — это техническое задание для нейросети. Здесь тоже работает правило «без четкого ТЗ результат ХЗ».
Чтобы продуктивно работать с Gemini, не нужно быть промпт-инженером. Gemini понимает запросы, сформулированные простым языком, и задает наводящие вопросы. Например, если вы спросите, «сколько лет Гарри», нейросеть выдаст информацию про персонажа в разные периоды книжной вселенной о Гарри Поттере и вдобавок уточнит возраст актера. А если в вашей истории взаимодействия с Gemini есть запросы про певца Гарри Стайлза или шахматиста Анатолия Карпова, нейросеть уточнит и про них.
На Google Workspace есть гайд по созданию рабочих промптов. В нем указано, что эффективный запрос включает четыре компонента:
- Объект (персона).
- Задача.
- Контекст.
- Формат.
Не обязательно использовать все четыре, но минимум три должны быть отражены в промпте. Вот примеры функциональных запросов к Gemini для решения бизнес-задач непосредственно от Google:
- Вы являетесь менеджером программы Google Cloud. Составьте электронное письмо с кратким описанием на такой-то адрес на основе таких-то документов. Ограничьтесь пунктами списка.
- Вы являетесь менеджером службы доставки. Предложите 10 альтернативных вариантов вместо ускоренной доставки, чтобы уменьшить разочарование клиента от получения поврежденной посылки.
- Составьте список лучших практик общения с клиентами, которые можно использовать для обучения новых членов команды. Опишите три раздела, в том числе, как обрабатывать обращения довольных, недовольных и нейтральных клиентов.
Общие рекомендации от Google по формулированию промптов:
- Используйте естественный язык, приближенный к тому, который используете в общении с живыми людьми. Одна мысль — одно законченное предложение.
- Основной запрос должен быть четким и конкретным («напиши», «отредактируй», «переведи», «найди ссылку»). Избегайте жаргона и метафор.
- Задавайте ограничения на количество символов, пунктов в списке, вариантов ответа и т.д.
- Обозначьте роль ИИ, с позиции которой он выполнит ваш «заказ». «Вы руководитель креативного отдела ведущего рекламного агентства. Придумайте 5 вариантов слогана для…» .
Не ждите, что нейросеть выдаст идеальный результат с первого промпта. Используйте контекстные подсказки, которые помогут улучшить результат. В рамках диалога с Gemini можно наладить обоюдный обмен информацией — и в этом нейросеть от Google максимально приближена к «живому» общению.
Если ответ кажется неполным или неточным, можно прямо попросить ИИ задать уточняющие вопросы. Gemini отлично понимает формулировки вроде «Какие вопросы для достижения наилучшего результата есть у тебя ко мне?».
Клоны Gemini
Как мы писали выше, нейросеть не доступна с российских IP-адресов. Пользоваться оригинальной Gemini можно только через VPN. Но на просторах Рунета можно встретить нейросеть-копию на российском домене.
Лже-Gemini представляет собой кустарную нейросеть с открытым кодом, скорее всего, от российских или китайских разработчиков. На главной странице полно тизерного контента и сомнительных ссылок. Качество обработки промптов не выдерживает конкуренции с оригинальной Gemini: алгоритмы примитивные и подвязаны на контекст предыдущих запросов. Если попросить нейросеть сначала написать карточку товара для кафельной плитки, а потом на шариковую ручку, получите результат про ручку для кафельной плитки. Лучше не тратить время.
Коротко о главном
- Gemini — это языковой бот и мультимодальная нейросеть от Google. Она эффективно решает рутинные задачи по контенту: от написания SEO-текстов и создания иллюстраций до редактуры и переводов. Также нейросеть умеет писать программный код.
- С помощью Gemini можно закрывать многие рутинные задачи, к которым ранее привлекали технических писателей.
- Существует бесплатный вариант и платная подписка с продвинутыми алгоритмами. Для использования в любом случае нужен аккаунт Google. Также у нейросети есть клон на российском домене, который не выдерживает конкуренции с оригиналом.
- У Gemini есть браузерная и мобильная версии. В России обе доступны только через VPN-сервисы.
- Нейросеть постоянно совершенствуется и обучается, в том числе, на запросах пользователей. Google регулярно обновляет алгоритмы Gemini, благодаря чему она выдает более точные и объемные ответы.
- Главное преимущество Gemini — контекстные подсказки, которые нейросеть пишет в конце ответов. Они помогают искусственному интеллекту лучше понять запрос пользователя и выдать максимально релевантный результат.
- Gemini может помочь с наполнением сайта контентом, в том числе визуальным. Нейросеть работает со всеми форматами текстов: информационные статьи, карточки товаров, коммерческие предложения, слоганы, email-рассылки.
Комментарии (5)
Оставить комментарий