4 шага к AI Power User: как стать продвинутым пользователем ChatGPT
Это вторая статья из серии про использование искусственного интеллекта руководителями и другими людьми умственного труда, которые решают на работе весьма нетиповые задачи и активно коммуницируют с другими людьми. В первой статье были самые простые вопросы, рецепты и примеры применения ИИ. А здесь мы рассмотрим ChatGPT в роли подчиненного сотрудника, использование имеющихся «знаний» для повышения качества результатов ИИ, а также решение комплексной задачи, включающее некоторые приемы промпт-инжиниринга.
Microsoft и LinkedIn в своем отчете 2024 Work Trend Index Annual Report пишут, что 75% людей интеллектуального труда используют Generative AI на работе, и около половины из них начали это делать лишь в последние полгода. Отчет также утверждает, что уже сформировался некий круг AI Power Users (правда, его размер неясен). Более 80% этих продвинутых пользователей, использующих ИИ на ежедневной основе и получающих от этого многочисленные преимущества, отвечают положительно на такие вопросы как:
- Перед тем, как начать новую задачу, я спрашиваю себя «Может ли ИИ помочь мне с этим?»
- Я ищу и пробую новые промпты и новые способы использования ИИ на работе.
Эта статья для вас, если вы хотите быть среди продвинутых пользователей, которые первыми получат конкурентное преимущество. Я имею ввиду преимущество на рынке труда в любой вашей профессиональной области, даже если она совсем не связана с ИИ.
В первой части статьи были рассмотрены не только вопросы, которые стоит себе задавать, но и конкретные 2 шага, предназначенные для достижения двух целей:
- Сократить за счет ИИ свои затраты времени, и освободить себя именно от рутины, а не от творчества
- Получать от ИИ не «общие слова», а конкретные результаты экспертного уровня, релевантные именно стоящей задаче и ее контексту.
По первому пункту было предложено отнюдь не универсальное решение: в некоторых случаях от рутины могут освободить лишь специализированные приложения с ИИ-функциями, а не ChatGPT.
По второму пункту был рассмотрен нехитрый подход, когда ChatGPT задает вам вопросы, поскольку ваши ответы на них — это очень простой способ сформировать контекст и уточнить требования к результату. Однако этого зачастую недостаточно для решения проблемы «слишком общих» и «слишком примитивных» результатов.
Ниже рассмотрим более продвинутые приемы для достижения тех же двух целей.
Содержание статьи
Шаг 3: ИИ учитывает «качественные» данные, подобранные человеком
Итак, вы знакомы с промпт-инжинирингом, но все равно часто сталкиваетесь с проблемой слишком общих / однобоких / неверных / некачественных ответов от ИИ. Тогда попробуйте задать себе еще два вопроса:
- «Как дать ИИ понять, что для меня является хорошим результатом?»
- «Какие существуют источники корректной информации по теме и как я могу указать ИИ на них?»
Для ответов на эти вопросы, возможно, вам потребуется не только ваш здравый смысл и опыт, но и кое-что еще:
- уметь подбирать примеры результата, понятные искусственному интеллекту;
- понимать некоторые технические аспекты — иметь базовые представления о Few-shot prompting и о Retrieval-Augmented Generation (RAG – технология для подключения объемных баз знаний к LLM);
- иметь навык подготовки данных для ИИ на основе этого понимания.
Продвинутый пользователь ИИ понимает, что для лучшего результата боту нужно добавить в контекст некие данные и/или хотя бы один пример результата хорошего качества. При наличии в промпте примеров потребуется меньше усилий для описания задачи вами (исследование с таким выводом можно посмотреть в статье Few-shot Prompting vs Detailed Instructions). Кроме того, за счет примеров или «базы знаний» улучшается соответствие результата собственной экспертизе человека, контексту компании, принятым в данной стране подходам и т.д.
На этом продвинутом уровне, при появлении новой задачи должен возникать вопрос типа «А какие уже имеющиеся / легко добываемые данные я могу дать ИИ для решения этой задачи?»
AI Power User знаком с несколькими ИИ-инструментами, поддерживающими файлы и другие источники знаний, например:
- GPTs от OpenAI и другие «фичи» в AI-чатботах, связанные с поиском по документам.
- SaaS, предназначенные для работы с большой базой знаний, к примеру, TextCortex, EmbedAI или NotebookLM от Google.
- Опенсорсные решения типа Danswer или BionicGPT (подойдут, если у вас есть технический бэкграунд и готовность при необходимости допрограммировать заложенные туда алгоритмы RAG).
- Для простых случаев — инструменты класса «Chat with your document»: например, такая фича есть в Adobe Acrobat. Инструментов такого типа очень много, но они помогают общаться лишь с одним документом или таблицей, но не выбирают подходящие документы из базы знаний.
По своему опыту могу сказать, что на данный момент (весна 2024) выбор подходящей информации из базы знаний с помощью RAG работает весьма ненадежно. Проблема в том, что вышеуказанным приложениям (пункты 1-3) сложно принять решение о том, какой из источников, входящих в базу знаний, следует использовать. И очень часто они не используют никакой источник, отвечая «из общих соображений».
Так что подключение большой базы знаний — это один из самых сложных навыков продвинутого пользователя ИИ.
Если это нужно для работы в компании крупного или среднего размера, то к таким задачам обычно привлекаются технари (программисты), чтобы подключать разные открытые LLM, играть с embeddings и даже переписывать алгоритм RAG под нужные кейсы. Иначе даже самые продвинутые пользовали могут потратить очень много времени зря, работая с базой знаний через такие приложения как GPTs (я уже не говорю о проблемах конфиденциальности такой базы знаний).
Но все же подключать базу знаний через RAG во многих задачах НЕ требуется. Дело в том, что конкуренция вынуждает OpenAI и других производителей LLM поддерживать все большее «контекстное окно». Этот максимальный размер контекста (входных данных) уже равен 128 тысяч токенов для моделей GPT-4o и Gemini 1.5 Pro, а для моделей семейства Claude 3 – 200 тысяч токенов.
Такой размер контекстного окна позволяет засунуть в модель ВСЮ «базу знаний», если она размером до десятков мегабайт. Как следствие, в этом случае можно просто прикладывать к промпту всю полезную для решения задачи информацию.
А для того, чтобы добавить знания, примеры результата или иную информацию непосредственно в диалог с ChatGPT, никаких технических знаний не требуется. Зачастую даже не нужно давать ему текст – достаточно дать ссылку на веб-страницу с этим текстом. В сложных случаях стоит понимать основы Few-shot промптинга: см. про короткие примеры и про длинные примеры.
Шаг 4: ИИ — сотрудник, человек — руководитель
Вернемся от проблемы некачественных «слишком общих» результатов к проблеме 1: времени на получение качественных результатов уходит так много, что проще было бы обойтись без ИИ. И зададим себе вопросы:
- «Как можно уменьшить число итераций, требуемых для получения качественного результата?»
- «Как использовать мой опыт общения с людьми для общения с ИИ?»
- «Как организовать мою с ИИ совместную работу?»
Если вы имеете опыт менеджмента, то у вас есть преимущество в общении с ChatGPT. Искусственный интеллект — это не совсем программа, принципы с общения с ним ближе не к программированию, а к руководству сотрудниками и к организации работы.
Менеджмент совсем необязательно означает постановку задачи начальником и ее выполнение подчиненным. Например, подчиненные приносят руководству на одобрение свои идеи, развернутые планы, промежуточные результаты. Руководитель экономит время за счет того, что включается в работу лишь на некоторых этапах рабочего процесса, каков бы он ни был — от подготовки квартального отчета до создания нового продукта. Но при этом он «держит руку на пульсе» и включается многократно, поскольку невозможно заранее все учесть и обо всем договориться.
Аналогично можете мыслить вы, представляя себя в роли «руководителя чат-бота»:
- Попросите ИИ написать вам готовый промпт, покритикуйте его, а лишь затем попросите его выполнить.
- В большинстве реальных задач одного промпта недостаточно, задача должна быть разбита на несколько взаимосвязанных подзадач. И декомпозицию на подзадачи вы тоже можете попросить ИИ.
- Укажите ИИ явно ваши роли: вы — руководитель, а он — сотрудник с такими-то компетенциями. И скажите, что его задача — согласовывать с вами каждый промежуточный результат его работы: список идей, план реализации, первую часть текста (если цель заключается в написании текста), и тому подобное.
- Главное — давайте ИИ небольшие конкретные и своевременные указания, как будто это ваш новый подчиненный. Как и подчиненный, ИИ еще не знаком с вашими предпочтениями и ожиданиями, так что если на него сразу обрушить все ваши ЦУ, он перегрузится и большую половину не учтет.
Зачем это нужно? Двигаясь небольшими шагами, вы быстрее придете к нужному результату.
Имею в виду, что это будет быстрее в сравнении с тем, когда вы сразу подробно описываете задачу, а потом критикуете финальный результат (который совсем не соответствует ожиданиям). Если бы так делали руководители, они бы зря тратили много своего времени и на полную постановку задачи на старте, и на бесконечные итерации после получения неудовлетворительных результатов.
Комплексный пример общения с ИИ
В качестве примера, использующего много разных приемов, рассмотрим приведенную в первой статье задачу создания текста «О компании». Ее можно переформулировать в виде набора тесно взаимосвязанных задач. Ниже — примерная последовательность промптов, которую я рекомендую для этой задачи.
- Предложи 3 варианта структуры веб-страницы «О компании», учитывая, что компания занимается … <вводные о вашем бизнесе и аудитории страницы>.
- Выбираем вариант 2, но только объединяем Клиенты и Истории успеха, а про партнеров не включаем. Ключевая информация о компании описана в файлах <файл интервью и файл презентации>. Предложи структуру из 6 блоков, в каждом пункте пиши заголовок и основные идеи блока.
- Замечания по блокам:
3. Преобразуй в 2 блока: ….
6. Убери про адреса и расположение офисов. - В каком формате нужны данные о продуктах, чтобы ты мог создать контент блока 3 и 4? По блокам 5 и 6 напиши, что следует учесть при подготовке текста и иллюстраций.
- Начнем с блока 3. В приложенном файле — таблица с описаниями продуктов, в последнем столбце … — их категории. Резюмируя описание продуктов категории …, создай описание категории из 20 слов.
- Исправленное мной описание категории: «…». По аналогии с этим сделай описание категории … длиной 30 слов. Мне важно, чтобы … <любые вводные>
- Отныне в ответ на каждый мой запрос ты должен генерировать контент указанного блока в формате тех. задания для веб-дизайнера. Стиль текста должен соответствовать стилю страницы …. Сопровождай каждый блок рекомендациями по картинкам или иному визуальному оформлению.
Начнем с блока 1, текста тут должно быть очень мало (1 экран на телефоне). Нужен слоган компании: … - …
См. пример реального диалога про страницу «О компании».
Как видим, ничего сложного. Важно, что не только результаты, но и сама постановка задачи рождается в процессе общения с ИИ. Так же происходит и в процессе общения хорошего менеджера со своим сотрудником.
Какие приемы здесь использованы?
- Расширение задачи: даже если имеем свое представление об идеальном результате, сначала просим варианты, чтобы не упустить что-то важное.
- Требования от ИИ: просим ИИ рассказать, что и в каком формате ему нужно.
- Примеры для ИИ: просим использовать имеющиеся файлы / веб-страницы
- как основу для контента;
- как образец стиля.
- Получение результата по частям, а также:
- однократная формулировка требований ко всем частям;
- использование исправленной версии предыдущей части в качестве образца для следующей части.
- Отношение к ИИ как к подчиненному сотруднику, а не как к программе: активно сотрудничаем, даем указания и обратную связь.
Заключение
Надеюсь, мне удалось проиллюстрировать, что для успешного применения ИИ очень важны следующие навыки:
- Умение подбирать задачи для ИИ и формулировать их совместно с ИИ.
- Навык подбора подходящих знаний и примеров в качестве контекста для ИИ.
- В случае недоступности таких знаний и примеров — совместное с ИИ-ботом обсуждение задачи таким образом, чтобы контекста было достаточно для качественных конкретных результатов.
Считаю, что именно такие «высокоуровневые» навыки принципиальны для того, чтобы ИИ нам помогал решать профессиональные задачи экспертного уровня, а не просто служил для резюмирования длинных текстов или для генерации типовых документов. Тогда как умение писать промпты с учетом особенностей той или иной LLM — вторично; и это умение не требует курсов по промпт-инжинирингу, а постепенно приходит с опытом общения с ИИ.
Пишите в комментариях, если вы не согласны с этим утверждением или если я забыл какие-то еще навыки.
А детализированный чек-лист со всеми вопросами, которые я рекомендую задавать себе на разных этапах знакомства с ИИ, вы можете взять в этом посте. Это ссылка на Telegram-канал ScrumTrek, где публикуются полезные советы по работе не столько с ИИ-ассистентами, сколько с людьми. На самом деле, между управлением людьми и ИИ-сотрудниками есть много общего! 😉
Как уменьшить число встреч в вашем календаре? Чтобы держать руку на пульсе и даже принимать решения, вы как менеджер можете не приходить на многие командные встречи, но получать от AI краткие выжимки из транскриптов встреч, с фокусом на интересующие вас вопросы.
Эта статья поможет не только новичкам в теме транскрибации аудио созвонов (онлайн-встреч, совещаний). Будет не менее полезна тем, кто уже применяет системы расшифровки / протоколирования совещаний (например, зарубежные Fireflies, tldv.io, Read.ai, MeetGeek или российские MyMeet, FollowUP, Timelist, Teamlogs) либо применяет видеоконференции с подобным функционалом (например, Zoom или МТС Линк).
Расшифровка аудио рабочих встреч (автоматическое создание стенограмм совещаний) — это относительно старая технология. Однако в последние годы основанные на ней системы-транскрибаторы совершили большой рывок, связанный с качеством расшифровки, юзабилити и новыми AI-функциями. Благодаря этому расшифровка встреч в 2024 году может стать действительно полезной для сотрудников и руководителей, а в итоге принести множество преимуществ на уровне компании.