«Gemini — убийца дешевых копирайтеров» — так звучал бы кликбейтный заголовок этой статьи для «Яндекс.Дзен» или тизерных сайтов. Нейросеть хорошо прокачана под генерацию текстов и способна решить многие задачи по контенту. Но есть нюансы. О них, а также о перспективах Gemini в российском сегменте интернета — в нашем обзоре.
Что такое нейросеть Gemini
Gemini — это мультимодальная генеративная модель искусственного интеллекта от Google. От традиционной (негенеративной) она отличается более сложными алгоритмами принятия решений, и, как следствие, большей вариативностью ответов на запросы.
Чем шире база данных для обучения нейросети, тем полнее и креативнее ответы она выдает — это касается всех генеративных моделей искусственного интеллекта. Gemini доступен колоссальный массив данных из сервисов Google. Она относится к категории мультимодальных нейросетей, которые работают с разными типами данных: тексты, изображения, аудио, видео, программный код.
До февраля 2024 года нейросеть от Google называлась Bard. «Называлась» — условно понятие, потому что по факту случился не только ребрендинг, но и эволюция. Архитектуру Bard основательно переработали под взаимодействие со всеми сервисами экосистемы Google. Ответы на запросы стали более подробными, более точными и более персонализированными, то есть учитывают предыдущую активность пользователя в сервисах «Гугла».
Создатели нейросети высоко оценивают ее потенциал. Согласно данным из презентации Gemini в блоге Google, тест версии Ultra по параметру MMLU (массовое многозадачное понимание языка) показал результат в 90 %. Это позволило сделать вывод, что точность и полнота ответов Gemini Ultra даже превосходит ответы живых людей — продуктовых экспертов Google. Также по результатам бенчмаркинга (многоэтапного теста производительности) «Гемини» уделывает ближайшего конкурента GPT-4 с результатом 32 против 30.
Простыми словами, Gemini — это нейросеть универсального назначения от Google, которая работает как с текстом, так и изображениями и кодом. У нее есть перспективы стать нейросетью № 1 для бизнеса, как минимум — в западном сегменте интернета, как максимум — в мире.
Что умеет нейросеть Gemini
Мультимодальная нейросеть способна не только выдать ответ на запрос, но и обучаться на данных разных типов. Соответственно, она выдает более быстрые и осмысленные результаты, чем унимодальные нейросети, которые ограничены одним типом информации — например, Kandinsky, которая нарисует вам красивую картинку даже без шести пальцев на руках, но не напишет текст.
Какие задачи можно решить с помощью нейросети Gemini:
- Написать коммерческий или художественный текст с нуля.
- Отредактировать авторский текст.
- Создать изображение в заданном стиле (с ограничениями, о них ниже).
- Транскрибировать аудио в текст или создать субтитры к видео.
- Найти информацию в интернете по запросу, в том числе, используя данные с камеры устройства.
- Управлять работой сервисов Google — например, найти файл в Google Docs или проложить маршрут на карте.
- Поддержать диалог на заданную тему.
Рассмотрим подробнее каждую из ее возможностей в рамках решения рутинных задач по контенту, которые могут возникнуть у маркетолога или владельца бизнеса.
Написание текстов и поиск информации
Gemini пишет связные и грамотные тексты на основе информации, которая есть в Google. Можно задать источники, на которые стоит ориентироваться. Собственную аналитику нейросеть не делает. Но если у вас есть собственные цифры, факты или другие наработки, можно предоставить их в качестве дополнительной информации к запросу, и «Гемини» включит их в текст.
В коммерческих текстах важна уникальность — смысловая и техническая. Что до первого, «Гемини» не выдает ничего сверх того, что уже есть в интернете. Нейросеть выбирает источники по целому ряду параметров, включая экспертность и актуальность, а не берет верхушку выдачи «Гугла», как дешевые рерайтеры.
Техническая уникальность результатов не идеальная, но и плохой ее не назвать. Например, по запросу «напиши уникальный текст для страницы сайта про забивку буронабивных свай с описанием процесса» «Гемини» показал результат почти в 87 % по сервису text.ru.
Создание уникальных изображений
Gemini может сделать любые изображения для коммерческих текстов на основе опять же исходников из «Гугла». Но на этих картинках не будет людей — такова политика компании. Официально Google отменила генерацию человеческих лиц и силуэтов из-за расовой предвзятости. Обработать фото с камеры также не получится по этой же причине. Зато неодушевленные объекты получаются вполне естественно.
Программирование
Здесь прогресс пока шагнул не так далеко. Полноценный сайт или приложение по одному запросу «Гемини», как и любая другая нейросеть, не сделает. Но она может написать «рыбу» программного кода, которую можно доработать до вменяемого результата.
ИИ задает наводящие вопросы, которые помогут ему выдать релевантный ответ. Эта функция делает «Гемини» неплохим тренажером для начинающих кодеров.
От возможностей перейдем к тому, как использовать сервис:
Спектр возможностей нейросети зависит от используемой модели. По состоянию на октябрь 2024 года их две: бесплатная Gemini Flash и платная Gemini Advanced. Первая поддерживает работу с текстами и простые задачи по генерации визуального контента. У платной возможностей больше:
- Расширенные алгоритмы генерации изображений.
- Редактирование и выполнение программного кода на Python.
- Интеграция со всеми сервисами Google.
- Ранний доступ к новым функциям нейросети, которые в Google прикручивают едва ли на каждую неделю.
Контекстное окно, то есть часть массива Big Data, которое нейросеть использует для обработки конкретного запроса, у платной версии почти в 30 раз шире (1 миллион токенов против 32 тысяч). Тарификация помесячная, в октябре Gemini Advanced стоил 21,99 евро в месяц. Можно бесплатно протестировать в течение 1 месяца, но для этого нужно добавить банковскую карту или другой способ оплаты в аккаунт.
Как получить доступ к Gemini
У нейросети есть браузерная версия и мобильные приложения для iOS и Android. В «яблочном» варианте нейросеть уже встроена в приложение Google. Официальная эмблема «Гемини» — синяя звездочка-квадрат.
Получить доступ к расширенным возможностям Gemini на особых условиях можно через сервисы Google для разработчиков — Google AI Studio и Google Colab. Там можно найти подсказки и готовые решения по использованию нейросети в программировании, а также приложить руку к улучшению архитектуры «Гемини».
Как начать работу с Gemini
Что следует знать в первую очередь: нейросеть не доступна с российских IP-адресов, хотя русский язык в ней поддерживается. Зайти в нее можно так же, как в «Нельзяграм», через . ">VPN-сервис
Алгоритм работы с нейросетью:
- Авторизуйтесь в аккаунте Google и зайдите в браузерную или мобильную версии «Гемини».
- Сформулируйте запрос к нейросети.
- Дождитесь ответа. Изучите контекстные подсказки от нейросети и уточните свой запрос, если это необходимо.
Google предупреждает, что ответы «Гемини» нельзя использовать в качестве профессиональных рекомендаций: медицинских, юридических и т. д. Из FAQ по нейросети четко вытекает, что вся ответственность за интерпретацию и использование результатов работы с нейросетью лежит на пользователе.
Как составить рабочий промпт для Gemini
Промпт — это задача, которую вы ставите нейросети в виде текстового запроса. Его логическая структура включает основной и уточняющие компоненты. Основной формулирует требования к форме и содержанию, например «напиши обзор на вторую часть «Джокера». Уточняющие компоненты задают детали, например «без спойлеров», или «с рецензиями критиков». Другими словами, промпт — это техническое задание для нейросети. Тут тоже работает правило «без четкого ТЗ результат ХЗ».
Чтобы продуктивно работать с Gemini, не нужно быть промпт-инженером. «Гемини» понимает запросы, сформулированные простым языком и задает наводящие вопросы. Например, если вы спросите, “сколько лет Гарри”, нейросеть выдаст информацию про персонажа в разные периоды книжной вселенной о Гарри Поттере и в довесок уточнит возраст актера. А если в вашей истории взаимодействия с «Гемини» есть запросы про певца Гарри Стайлза или шахматиста Анатолия Карпова, Gemini уточнит и про них.
На Google Workspace есть гайд по созданию рабочих промптов. В нем указано, что эффективный запрос включает четыре компонента:
- Объект (персона).
- Задача.
- Контекст.
- Формат.
Не обязательно использовать все четыре, но минимум три должны быть подсвечены в промте. Вот примеры функциональных запросов к Gemini для решения бизнес-задач непосредственно от Google:
- Вы являетесь менеджером программы Google Cloud. Составьте электронное письмо с кратким описанием на такой-то адрес на основе таких-то документов. Ограничьтесь пунктами списка.
- Вы являетесь менеджером службы доставки. Предложите 10 альтернативных вариантов вместо ускоренной доставки, чтобы уменьшить разочарование клиента от получения поврежденной посылки.
- Составьте список лучших практик общения с клиентами, которые можно использовать для обучения новых членов команды. Опишите три раздела, в том числе, как обрабатывать обращения довольных, недовольных и нейтральных клиентов.
Общие рекомендации от Google по формулированию промптов:
- Используйте естественный язык, приближенный к тому, который используете в общении с живыми людьми. Одна мысль — одно законченное предложение.
- Основной запрос должен быть четким и конкретным («напиши», «отредактируй», «переведи», «найди ссылку»). Избегайте жаргона и метафор.
- Задавайте ограничения на количество символов, пунктов в списке, вариантов ответа и т.д.
- Обозначьте роль ИИ, с позиции которой он выполнит ваш «заказ». «Вы руководитель креативного отдела ведущего рекламного агентства. Придумайте 5 вариантов слогана для…» .
Не ждите, что нейросеть выдаст идеальный результат с первого промта. Используйте контекстные подсказки, которые помогут улучшить результат. В рамках диалога с Gemini можно наладить обоюдный обмен информацией — и в этом нейросеть от Google максимально приближена к «живому» общению.
Если ответ кажется вам недостаточно полным или точным, разрешите ИИ задавать вам уточняющие вопросы. «Гемини» отлично понимает формулировки вроде «Какие вопросы для достижения наилучшего результата есть у тебя ко мне?».
Клоны Gemini
Как мы писали выше, нейросеть не доступна с российских IP-адресов. Пользоваться оригинальной «Гемини» можно только через VPN. Но на просторах Рунета можно встретить нейросеть-копию на российском домене.
Лже-«Гемини» представляет собой кустарную нейросеть с открытым кодом, скорее всего, от российских или китайских разработчиков. На главной странице полно тизерного контента и сомнительных ссылок. Качество обработки промптов не выдерживает конкуренции с оригинальной Gemini: алгоритмы примитивные и подвязаны на контекст предыдущих запросов. Если попросить нейросеть сначала написать карточку товара для кафельной плитки, а потом на шариковую ручку, получите результат про ручку для кафельной плитки. Общее впечатление: лучше не тратить время.
Коротко о главном
- Gemini — нейросеть с общим доступом от Google. Может использоваться для решения рутинных задач по контенту: написание SEO-оптимизированных текстов, создание иллюстраций, транскрибирование, переводы. Также нейросеть умеет писать программный код.
- Также она хорошо справляется с редактурой текстов. С помощью «Гемини» можно закрывать многие рутинные задачи, к которым ранее привлекали технических писателей.
- Существуют как бесплатная, так и платная версия, с более продвинутыми алгоритмами. И там, и там для использования нужен аккаунт Google. Также у нейросети есть клон на российском домене, который не выдерживает конкуренции с оригиналом.
- У Gemini есть браузерная и мобильная версии. В России обе доступны только через VPN-сервисы.
- Нейросеть постоянно совершенствуется и обучается, в том числе, на запросах пользователей. Google регулярно обновляет алгоритмы Gemini, благодаря чему она выдает более точные и объемные ответы.
- Сильная сторона «Гемини» — контекстные подсказки, которые нейросеть пишет в конце ответов. Они помогают искусственному интеллекту лучше понять запрос пользователя и выдать максимально релевантный результат.
- Gemini может помочь с наполнением сайта контентом, в том числе визуальным. Нейросеть работает со всеми форматами текстов: информационные статьи, карточки товаров, коммерческие предложения, слоганы, email-рассылки.
Комментарии