Чего в настоящее время нельзя делать с помощью нейросетей
Какие опасности нейросетей мы недооцениваем?
Случалось ли вам встречать на улице человека, который один в один был бы похож на вас? Одежда, лицо, походка, манера общения, повадки полностью идентичны вашим. Как будто вас отсканировали и распечатали на принтере. Звучит немного жутковато, не так ли? А теперь представьте, что вы увидели видео, в котором такой человек что-то рассказывает о себе. В лучшем случае вы постараетесь вспомнить, когда гуляли так, что ничего не помнили, но могли наговорить такое на камеру. Пока все это звучит как простые рассуждения, но технологии уже вплотную приблизились к тому, чтобы создавать таких людей. Они уже есть, но скоро их станет намного больше.
Неважно, как мы представим лицо нейросетей. Опасности в них точно будут.
Откуда берется фейк?
Сейчас уже слишком много всего, что принято называть фейками. Они есть везде. Их можно найти в фотографиях, в новостях, в производстве товаров и в информационных услугах. Проще сказать где нет явлений, сопровождаемых этим словом. Пока с ними можно бороться. Можно изучить происхождение фотографии, проверить отличительные черты фирменного товара от подделки, а новости перепроверить. Хотя, новости являются отдельной темой.
В наше время потребитель контента не хочет ждать и требует от его создателя моментального производства, иногда ему даже плевать на качество, главное, чтобы быстро. Отсюда и рождаются ситуации, когда кто-то что-то сказал, а остальные, не проверив, растащили это по своим сайтам и газетам. В некоторых случаях требуется много времени на раскрутку этого клубка обратно и доказательство того, что это все было неправдой.
Объяснять, для чего это все делается, смысла нет. С одной стороны стоят те, кто просто хочет посмеяться над ситуацией, с другой — те, кто действительно не знали, что они неправы. Отдельное место, примерно посередине, занимают те, кому это банально выгодно. Это могут быть интересы влияния на разном уровне, включая политический. Иногда это бывает целью получения прибыли. Например, сеяние паники на фондовом рынке и проведение выгодных операций с ценными бумагами. Но зачастую это бывает связано с неприязнью к человеку (компании, продукту и т.д) с целью принизить его. Простым примером является “опускание” в рейтингах неугодного кому-то фильма или заведения. Конечно, для этого нужна армия тех, кто пойдет и поставит дизлайк (иногда даже ботов), но это уже отдельная история.
Что такое Deep Learning?
В последнее время этот термин звучит все чаще. Иногда он даже не имеет отношения к делу и его путают с чем-то другим. Так программный продукт выглядит более эффектно.
Не стоит думать, что понятие и основные принципы машинного обучения появились только несколько лет назад. На самом деле, им уже столько лет, что многие из нас тогда даже не родились. Основные принципы работы систем глубокого обучения и математические модели для их работы были известны еще в 80-е годы прошлого века.
В то время они не имели такого смысла из-за отсутствия одного важного компонента. Им являлась высокая вычислительная мощность. Только в середине двухтысячных появились системы, которые могут помочь работать в этом направлении и позволяют просчитывать всю необходимую информацию. Теперь машины развились еще сильнее и некоторые системы машинного зрения, голосового восприятия и некоторые другие работают настолько эффективно, что даже порой превосходят возможности человека. Хотя, на ответственные направления их пока не “сажают”, делая их дополнением возможностей человека с сохранением контроля над ними.
Мы их учим, но как они будут пользоваться своими знаниями и возможностями?
Что такое Deepfake? Когда появился Deepfake?
Несложно догадаться, что Deepfake это небольшая игра слов, связанная с Deep Learning и теми самыми фейками, о которых я рассказывал выше. То есть, Deepfake должен вывести подделку на новый уровень и разгрузить человека в этом нелегком деле, позволив создавать поддельный контент, не тратя на это силы.
В первую очередь, такие подделки касаются видео. То есть, любой человек сможет сесть перед камерой, сказать что-то, а его лицо будет заменено на другого человека. Выглядит жутковато, ведь, по сути, надо будет просто уловить основные движения человека и отличить подделку будет просто невозможно. Давайте разберемся, с чего это все началось.
Первая генеративно-состязательная нейросеть была создана студентом Стэнфордского университета. Произошло это в 2014 году, а звали студента Ян Гудфеллоу. По сути, он столкнул между собой две нейросети, одна из которых занималась генерацией лиц людей, а вторая анализировала их и говорила похоже или нет. Так они обучали друг друга и в один прекрасный день вторая нейросеть начала путаться и принимать сгенерированные изображения за реальные. Именно такая постоянно усложняющаяся система и рождает Deepfake.
Сейчас одним из главных популяризаторов идеи Deepfake является Хао Ли (Hao Li). Он занимается не только этим, но и многим другим. За это он был не раз удостоен различных наград, в том числе, и негласных. Кстати, он один из тех, кому стоит сказать спасибо за появление в iPhone X анимодзи. Если интересно, на его сайте можно ознакомиться с ним более подробно. Сегодня не он является главной темой обсуждения.
Вспомнили мы о нем только из-за того, что на всемирном экономическом форуме в Давосе он показал свое приложение, которое позволит заменить лицо человека, сидящего перед камерой, на любое другое лицо. В частности, он показывал, как работает система на примере лиц Леонардо Дикаприо, Уилла Смита и других известных людей.
Выглядит это немного жутковато. С одной стороны, можно только восхититься современными технологиями, которые позволяют сканировать лицо, на ходу менять его на другое и выдавать новую картинку. На все это тратятся доли секунды и система даже не тормозит. То есть, это позволяет не просто обработать готовое видео и заменить лицо, но и участвовать такому персонажу в каком-нибудь живом общении по видеосвязи.
Опасность Deepfake. Как изменить лицо на видео?
Можно сколько угодно говорить о том, что такая технология нужна, это очень круто и не надо наговаривать. Можно даже дойти до крайности и начать говорить о том, что это позиция лютого олдфага, который просто боится всего нового, но тут действительно опасностей больше, чем пользы.
Тот, кто не любит такой способ заработка, скажет, что так им и надо, пусть идут на завод. Но при самом печальном сценарии и завода не будет после такого. Кроме того, банально мы получаем человека, который обманом наварится на колебаниях стоимости ценных бумаг. Достаточно просто вовремя их купить и продать.
Ситуация может быть и хуже, если “шутник” выскажется от лица лидера крупного государства. Конечно, потом все вскроется, но за это время можно натворить немало неприятных дел. На фоне этого, просто подставить лицо знаменитости вместо актера в фильме для взрослых будет невинной шалостью.
С такими технологиями главное сканировать, а дальше дело техники. В прямом смысле слова.
Можно представить и обратную ситуацию, когда реальный человек что-то скажет, а потом будет всех уверять, что его подставили. Как быть в этой ситуации тоже не очень понятно. Это внесет такую смуту в новостные ленты, что перепроверить это в другом источнике просто не получится. В итоге станет вообще непонятно, что в этом мире правда, а что ложь. Вырисовывается картинка из фильмов о мрачном будущем, вроде Суррогатов или Терминатора, где Т-1000 представлялся другими людьми и, в том числе, звонил Джону Конору от имени его приемной матери.
Сейчас я даже не говорю о еще одном злоупотреблении, которое позволит собирать ложные улики. На фоне этого вся забавность игрушки становится слишком сомнительной.
Как выявить Deepfake?
Проблема даже не в том, что такие системы надо запретить, а в том, что это уже невозможно. Они уже есть и развитие технологий, в том числе, и считывания лиц привело к их появлению и распространению открытого кода. Даже если представить, что система в нынешнем виде перестанет существовать, надо понимать, что ее создадут заново. Просто еще раз научат нейросети работать между собой и все.
Когда нейросети выйдут из под контроля, вы сможете узнать об этом из нашего новостного канала в Telegram. Присоединяйтесь, пока не поздно.
Пока не все так страшно, и определить подделку можно буквально невооруженным глазом. Картинка похожа, но она достаточно грубая. Кроме этого, она иногда имеет некоторые проблемы с совмещением, особенно по границам лица. Но ничего не стоит на месте и развить ее еще больше совсем не сложно. Тот же Хао Ли уверен, что на это потребуется не больше нескольких месяцев, а для создания “масок”, которые не отличит даже компьютер, надо еще несколько лет. После этого пути назад уже не будет.
С одной стороны, от этого сможет защитить алгоритм, который уже создают YouTube и Facebook. Кстати, последние даже открыли конкурс на разработку технологии распознавания — Deepfake Detection Challenge («Задача по выявлению дипфейков»). Призовой фонд этого конкурса составляет 10 миллионов долларов. Конкурс уже идет и завершится в марте 2020 года. Еще можно успеть поучаствовать.
Заменить лицо на видео перестало быть проблемой.
Возможно, такая щедрость обусловлена фейковым видео с самим Марком Цукербергом. Если эти две вещи связаны, появление такого конкурса неудивительно.
Если замененное лицо будет полностью соответствовать оригиналу, противосила в лице специальной нейросети будет бессильна. В этом случае ей придется ловить минимальные отличия в мимике, движениях и манере говорить. В случае с известными людьми такая проблема будет решена на уровне видеосервиса, так как тот же YouTube знает, как двигается условный Дональд Трамп. Когда дело дойдет до менее известного человека, это будет сложнее. Хотя, это тоже можно будет доказать, посадив его перед камерой и ведя непринужденную беседу, пока нейросеть анализирует его движения. Получится что-то вроде изучения отпечатка пальца, но, как видим, это опять приведет к излишним сложностям.
Если вшить системы определения подлинности видео в камеры, их тоже можно будет обойти. Можно сделать так, чтобы камера маркировала снятое видео и было понятно, что оно не снято через отдельное приложение или не обработано в специальной программе. Но как в этом случае быть с видео, которые просто были обработаны. Например, смонтированное интервью. На выходе мы получим видео, в котором уже не будет того исходного ключа.
Немного мемов в конце.
Сценарий мрачного будущего
Напишите в комментариях, какой вы видите защиту от подделок, если учесть, что система наложения масок смогла сделать маски полностью идентичными оригинальным лицам. А из-за того, что они на видео, к ним нельзя даже применить распознавание глубины и объема. Кроме этого, допустим, что любой код и зашитый в изображение ключ можно взломать. Как говорится, было бы ради чего. Теперь можно обсуждать, все вводные есть.
Что может и чего не может нейросеть: пятиминутный гид для новичков
Если термины «катастрофическая забывчивость» и «регуляризация весов» вам пока ни о чем не говорят, читайте дальше: попробуем разобраться во всем по порядку.
За что мы любим нейросети
Основное преимущество нейронных сетей перед другими методами машинного обучения состоит в том, что они могут распознавать более глубокие, иногда неожиданные закономерности в данных. В процессе обучения нейроны способны реагировать на полученную информацию в соответствии с принципами генерализации, тем самым решая поставленную перед ними задачу.
К областям, где сети находят практическое применение уже сейчас, можно отнести медицину (например, очистка показаний приборов от шумов, анализ эффективности проведённого лечения), интернет (ассоциативный поиск информации), экономику (прогнозирование курсов валют, автоматический трейдинг), игры (например, го) и другие. Нейросети могут использоваться практически для чего угодно в силу своей универсальности. Однако волшебной таблеткой они не являются, и чтобы они начали функционировать должным образом, требуется проделать много предварительной работы.
Обучение нейросетей 101
Одним из ключевых элементов нейронной сети является способность обучаться. Нейронная сеть — это адаптивная система, умеющая изменять свою внутреннюю структуру на базе поступающей информации. Обычно такой эффект достигается с помощью корректировки значений весов.
Связи между нейронами на соседних слоях нейросети — это числа, описывающие значимость сигнала между двумя нейронами. Если обученная нейронная сеть верно реагирует на входную информацию, то настраивать веса нет необходимости, а в противном случае с помощью какого-либо алгоритма обучения нужно изменить веса, улучшив результат.
Как правило, это делают с помощью метода обратного распространения ошибки: для каждого из обучающих примеров веса корректируются так, чтобы уменьшить ошибку. Считается, что при правильно подобранной архитектуре и достаточном наборе обучающих данных сеть рано или поздно обучится.
Существует несколько принципиально отличающихся подходов к обучению, в привязке к поставленной задаче. Первый — обучение с учителем. В этом случае входные данные представляют собой пары: объект и его характеристику. Такой подход применяется, например, в распознавании изображений: обучение проводится по размеченной базе из картинок и расставленных вручную меток того, что на них нарисовано.
Самой известной из таких баз является ImageNet. При такой постановке задачи обучение мало чем отличается от, например, распознавания эмоций, которым занимается Neurodata Lab. Сети демонстрируются примеры, она делает предположение, и, в зависимости от его правильности, корректируются веса. Процесс повторяется до тех пор, пока точность не увеличивается до искомых величин.
Второй вариант — обучение без учителя. Типичными задачами для него считаются кластеризация и некоторые постановки задачи поиска аномалий. При таком раскладе истинные метки обучающих данных нам недоступны, но есть необходимость в поиске закономерностей. Иногда схожий подход применяют для предобучения сети в задаче обучения с учителем. Идея состоит в том, чтобы начальным приближением для весов было не случайное решение, а уже умеющее находить закономерности в данных.
Переобучение: в чем проблема и как ее решить
Главная проблема нейросетей — переобучение. Оно заключается в том, что сеть «запоминает» ответы вместо того, чтобы улавливать закономерности в данных. Наука поспособствовала появлению на свет нескольких методов борьбы с переобучением: сюда относятся, например, регуляризация, нормализация батчей, наращивание данных и другие. Иногда переобученная модель характеризуется большими абсолютными значениями весов.
Механизм этого явления примерно такой: исходные данные нередко сильно многомерны (одна точка из обучающей выборки изображается большим набором чисел), и вероятность того, что наугад взятая точка окажется неотличимой от выброса, будет тем больше, чем больше размерность. Вместо того, чтобы «вписывать» новую точку в имеющуюся модель, корректируя веса, нейросеть как будто придумывает сама себе исключение: эту точку мы классифицируем по одним правилам, а другие — по другим. И таких точек обычно много.
Очевидный способ борьбы с такого рода переобучением – регуляризация весов. Она состоит либо в искусственном ограничении на значения весов, либо в добавлении штрафа в меру ошибки на этапе обучения. Такой подход не решает проблему полностью, но чаще всего улучшает результат.
Второй способ основан на ограничении выходного сигнала, а не значений весов, — речь о нормализации батчей. На этапе обучения данные подаются нейросети пачками — батчами. Выходные значения для них могут быть какими угодно, и тем их абсолютные значения больше, чем выше значения весов. Если из каждого из них мы вычтем какое-то одно значение и поделим результат на другое, одинаково для всего батча, то мы сохраним качественные соотношения (максимальное, например, все равно останется максимальным), но выход будет более удобным для обработки его следующим слоем.
Третий подход работает не всегда. Как уже говорилось, переобученная нейросеть воспринимает многие точки как аномальные, которые хочется обрабатывать отдельно. Идея состоит в наращивании обучающей выборки, чтобы точки были как будто той же природы, что и исходная выборка, но сгенерированы искусственно. Однако тут сразу рождается большое число сопутствующих проблем: подбор параметров для наращивания выборки, критическое увеличение времени обучения и прочие.
Эффект от удаления аномального значения из тренировочного свода данных (источник)
В обособленную проблему выделяется поиск настоящих аномалий в обучающей выборке. Иногда это даже рассматривают как отдельную задачу. Изображение выше демонстрирует эффект исключения аномального значения из набора. В случае нейронных сетей ситуация будет аналогичной. Правда, поиск и исключение таких значений — нетривиальная задача. Для этого применяются специальные техники — подробнее о них вы можете прочитать по ссылкам (здесь и здесь).
Одна сеть – одна задача или «проблема катастрофической забывчивости»
Работа в динамически изменяющихся средах (например, в финансовых) сложна для нейронных сетей. Даже если вам удалось успешно натренировать сеть, нет гарантий, что она не перестанет работать в будущем. Финансовые рынки постоянно трансформируются, поэтому то, что работало вчера, может с тем же успехом «сломаться» сегодня.
Здесь исследователям или приходится тестировать разнообразные архитектуры сетей и выбирать из них лучшую, или использовать динамические нейронные сети. Последние «следят» за изменениями среды и подстраивают свою архитектуру в соответствии с ними. Одним из используемых в этом случае алгоритмов является метод MSO (multi-swarm optimization).
Более того, нейросети обладают определенной особенностью, которую называют катастрофической забывчивостью (catastrophic forgetting). Она сводится к тому, что нейросеть нельзя последовательно обучить нескольким задачам — на каждой новой обучающей выборке все веса нейронов будут переписаны, и прошлый опыт будет «забыт».
Безусловно, ученые трудятся над решением и этой проблемы. Разработчики из DeepMind недавно предложили способ борьбы с катастрофической забывчивостью, который заключается в том, что наиболее важные веса в нейронной сети при выполнении некой задачи А искусственно делаются более устойчивыми к изменению в процессе обучения на задаче Б.
Новый подход получил название Elastic Weight Consolidation (упругое закрепление весов) из-за аналогии с упругой пружинкой. Технически он реализуется следующим образом: каждому весу в нейронной сети присваивается параметр F, который определяет его значимость только в рамках определенной задачи. Чем больше F для конкретного нейрона, тем сложнее будет изменить его вес при обучении новой задаче. Это позволяет сети «запоминать» ключевые навыки. Технология уступила «узкоспециализированным» сетям в отдельных задачах, но показала себя с лучшей стороны по сумме всех этапов.
Армированный черный ящик
Еще одна сложность работы с нейронными сетями состоит в том, что ИНС фактически являются черными ящиками. Строго говоря, кроме результата, из нейросети не вытащишь ничего, даже статистические данные. При этом сложно понять, как сеть принимает решения. Единственный пример, где это не так — сверточные нейронные сети в задачах распознавания. В этом случае некоторые промежуточные слои имеют смысл карт признаков (одна связь показывает то, встретился ли какой-то простой шаблон в исходной картинке), поэтому возбуждение различных нейронов можно отследить.
Разумеется, указанный нюанс делает достаточно сложным использование нейронных сетей в приложениях, когда ошибки критичны. Например, менеджеры фондов не могут понять, как нейронная сеть принимает решения. Это приводит к тому, что невозможно корректно оценить риски торговых стратегий. Аналогично банки, прибегающие к нейронным сетям для моделирования кредитных рисков, не смогут сказать, почему этот самый клиент имеет сейчас именно такой кредитный рейтинг.
Поэтому разработчики нейросетей ищут способы обойти это ограничение. Например, работа ведется над так называемыми алгоритмами изъятия правил (rule-extraction algorithms), чтобы повысить прозрачность архитектур. Эти алгоритмы извлекают информацию из нейросетей либо в виде математических выражений и символьной логики, либо в виде деревьев решений.
Нейронные сети — это лишь инструмент
Само собой, искусственные нейронные сети активно помогают осваивать новые технологии и развивать существующие. Сегодня на пике популярности находится программирование беспилотных автомобилей, в которых нейросети в режиме реального времени анализируют окружающую обстановку. IBM Watson из года в год открывает для себя всё новые прикладные области, включая медицину. В Google существует целое подразделение, которое занимается непосредственно искусственным интеллектом.
Вместе с тем порой нейронная есть — не лучший способ решить задачу. Например, сети «отстают» по таким направлениям, как создание изображений высокого разрешения, генерация человеческой речи и глубокий анализ видеопотоков. Работа с символами и рекурсивными структурами также даётся нейросистемам нелегко. Верно это и для вопросно-ответных систем.
Изначально идея нейронных сетей заключалась в копировании и даже воссоздании механизмов функционирования мозга. Однако человечеству по-прежнему нужно разрешить проблему скорости работы нейронных сетей, разработать новые алгоритмы логического вывода. Существующие алгоритмы по меньшей мере в 10 раз уступают возможностям мозга, что неудовлетворительно во многих ситуациях.
При этом ученые до сих пор не до конца определились, в каком направлении следует развивать нейросети. Индустрия старается как максимально приблизить нейросети к модели человеческого мозга, так и генерировать технологии и концептуальные схемы, абстрагируясь ото всех «аспектов человеческой природы». На сегодняшний день — это что-то вроде «открытого произведения» (если воспользоваться термином Умберто Эко), где практически любые опыты допустимы, а фантазии – приемлемы.
Деятельность ученых и разработчиков, занимающихся нейросетями, требует глубокой подготовки, обширных знаний, использования нестандартных методик, поскольку нейросеть сама по себе — это не «серебряная пуля», способная решить любые проблемы и задачи без участия человека. Это комплексный инструмент, который в умелых руках может делать удивительные вещи. И у него еще всё впереди.
Чему научились нейросети к 2020 году и когда они заменят копирайтеров
Страшный сон копирайтера: заказчик закидывает техническое задание в хитрый сервис → искусственный интеллект за пару минут выдает гениальный текст, конвертирующий как не в себя. Спите спокойно, дорогие коллеги, если это и произойдет, то еще очень и очень нескоро.
Искусственный интеллект сегодня
Возможности искусственного интеллекта XXI века впечатляют. Он способен управлять рисками, бороться с преступностью, ставить медицинские диагнозы, предлагать варианты проведения досуга и проделывать множество прикольных штук с картинками.
Развлечения
Самое распространенное и простое – работа с картинками. Сегодня каждый владелец компьютера может воспользоваться сервисом, который в один клик сделает плоское изображение объемным.
Есть немало сервисов (и еще больше мобильных приложений), способных превратить, например, любое изображение в картину, а любого человека — в персонажа комиксов.
Можно сделать из портрета фотокарикатуру и даже гифку, которая заставляет человека менять выражение лица.
Около года назад интернет взорвало приложение FaceApp (AppStore, Google Play), которое позволяло людям посмотреть, как они – по мнению искусственного интеллекта – будут выглядеть через 20–30–50 лет.
Картинки можно даже озвучить – для этого компания Qosmo разработала нейросеть Imaginary Soundscape. Анализируя картинку, сеть воспроизводит звук, который, как считает искусственный интеллект, ей соответствует.
Если вы заскучали, перечитав все интересные книги и пересмотрев любимые фильмы, цифровой «мозг» вновь придет на помощь. Специалист по работе с искусственным интеллектом Марек Грибни создал нейросеть «рекомендатор», которая, проанализировав ваши пристрастия, посоветует, что посмотреть или почитать.
Нейросети могут отлично имитировать то, чего на свете нет. Например, сотрудник компании Uber Филипп Ван создал нейросеть, которая при каждом обновлении выдает живые, совершенно реальные фотографии людей… которых не существует.
Другая вариация нейросети того же автора создает несуществующих котиков, но куда менее успешно.
Нейросети не дадут остаться в одиночестве. Произнесите «Слушай, Алиса» при включенном «Яндекс.Браузере» – и вы получите электронную собеседницу. Она ответит на вопросы, пошутит, расскажет анекдот, а если что не так, может и обидеться. Все как в жизни, только в сети.
Нейросети способны изобретать новые виды спорта. Разработанная компанией Akqa нейросеть придумала гибрид футбола и регби. Это результат анализа 7 300 правил из 400 видов спорта.
Нейросети пишут музыку. Завоевавший популярность в 2019 году сервис AI Duet, созданный при участии Google, позволяет каждому почувствовать себя музыкантом. Нажмите несколько клавиш на виртуальной клавиатуре фортепиано – искусственный интеллект продолжит мелодию. Чем длиннее будет музыкальный фрагмент, тем дольше будет длиться и цифровое продолжение.
Прикладная польза
Нейросети умеют ставить медицинские диагнозы. Сотрудники Ноттингемского университета научили специализированную нейросеть оценивать риск сердечно-сосудистых заболеваний. Для этого в память нейросети загрузили данные 295 тысяч пациентов-«сердечников», после чего протестировали ее на примерах 80 тысяч историй болезней. Точность диагноза «инсульт» от нейросети составила 74–76 %, тогда как живые американские врачи поставили правильный диагноз только в 72,8 % случаев. А это 355 дополнительных жизней, которые можно было бы спасти.
Нейросети помогают бороться с преступностью. В 2017 году на китайском фестивале пива в Циндао были обезврежены 25 преступников, скрывавшихся от правосудия. Помогли этому 18 уличных камер, подключенных к системе распознавания лиц с базой данных правоохранительных органов. Преступники были обнаружены мгновенно – источники пишут про 1 секунду. Но даже если секунд было не 1, а 10 или 100 – результат впечатляет.
Искусственный интеллект заменяет водителей и автомехаников. Беспилотные автомобили уже работают в лондонском аэропорту Хитроу, в России такие такси возят людей в Сколково, а к 2025 году автомобили без водителей должны появиться и на массовом рынке. Предполагается, что искусственный интеллект будет хорошо ориентироваться на дороге, быстро реагировать на внештатные ситуации, а заодно проводить диагностику автомобиля. Концепты полностью беспилотных автомобилей есть в концернах Nissan, Toyota, Audi, Lexus и не только.
Не отстают и российские разработчики. В 2019 году началась, а в 2020 году продолжится работа по выводу на дороги отечественных беспилотников от концерна КАМАЗ, «КБ Аврора», НКБ ВС (Научно-конструкторского бюро вычислительных систем), университета Иннополиса и МАДИ. С 2019 года экспериментальные беспилотники от «Яндекса» уже появились на обычных дорогах Москвы. Они курсируют в отдаленных районах (Ясенево, Бутово, Коммунарка) и отмечены специальным знаком «А». К концу 2022 года Яндекс планирует вывести на дороги до 1 000 беспилотников.
Нейросети снижают банковские риски. Банковский скоринг стал обычной процедурой. Это анализ данных человека, подавшего заявку на кредит, и поведения заемщиков с похожими характеристиками. Объединяя информацию, скоринговая система оценивает риск невозврата кредита в каждом конкретном случае. Если вам отказали в кредитовании – возможно, виной стала не ваша кредитная история, а загадки искусственного интеллекта и неблаговидные поступки людей, которых нейросеть считает похожими на вас.
Но работать с текстами нейросетям пока сложно
Искусственный интеллект переводит. Самый простой пример работы – машинный перевод, который предоставляют и Google, и Яндекс, и куча специализированных сервисов.
С помощью этих инструментов перевести можно текст с любого языка. Но что получится в итоге? Получится не литературный перевод, а технический подстрочник. Из нескольких возможных значений слова нейросеть выбирает одно, и не факт, что то, которое вписывается в тематику. Проведем эксперимент: поручим «Google Переводчику» перевести русский текст на английский (самая стандартная языковая пара в рунете), а затем обратно. И оценим, что получилось.
Вот так выглядит после двух сетов машинного перевода сказка о курочке Рябе:
Сказка про Курочку Рябу для детей
Жили себе дед да баба,
И была у них курочка Ряба.
Снесла курочка яичко:
Яичко не простое, Золотое.
Дед бил, бил — не разбил;
Баба била, била — не разбила.
— Не плачь, дед, не плачь, баба.
Я снесу вам яичко другое,
Не золотое — простое.
Сказка о Цыпленке Рябе для детей
Дедушка и бабушка жили для себя,
И у них была курица Ряба.
Яйцо не простое, золотое.
Дедушка бил, бил – не ломался;
Баба бил, бил – не ломался.
Дедушка и женщина плачут!
– Не плачь, дедушка, не плачь, женщина.
Я положу тебе еще одно яичко
Уровень машинного перевода просматривается ясно: понять можно, литературой назвать сложно.
Искусственный интеллект пишет стихи. Забавный сервис есть у «Яндекса» – нейросеть «Автопоэт», которая составляет стихотворения из заголовков новостей и поисковых запросов.
Делает она это по собственному разумению, повлиять на результат нельзя, а посмотреть и получить удовольствие можно. «Автопоэт» выдает новое стихотворение при каждом обновлении страницы, иногда вставляя и нативную рекламу сервисов «Яндекса».
Смысла в таких стихотворениях минимум, но рифма и размер присутствуют.
Дополнительная функция – «Прослушать в исполнении автора».
Нейросети пытаются писать книги. В этом им помогают люди – самостоятельно, без начального пинка человека, делать это искусственный интеллект не научился. Специалисты компании Botnik Studios, разработчика одного из таких сервисов, ввели в память нейросети всю «поттериану» Джоан Роулинг. Проанализировав информацию, искусственный интеллект создал новое произведение – «Гарри Поттер и портрет того, что похоже на большую кучу золы». Книга получилась странной, написанной весьма коряво, но читать ее – уверяют разработчики – вполне возможно.
Нейросети сочиняют рассказы. Новая нейросеть «Шахерезада», о создании которой объявили ученые Технологического университета Джорджии, успешно сочиняет короткие рассказы такого вида:
Обучают нейросеть вновь люди: разработчики «Шахерезады» решили закупать у фрилансеров короткие рассказы, написанные простыми предложениями, и кормить ими искусственный интеллект.
Нейросети порываются писать тексты для сайтов. Канадский инженер Адам Кинг запустил проект под названием Talk to Transformer. Если ввести в этой программе несколько слов или фраз, искусственный интеллект дополнит их по своему вкусу, попытается сделать связный текст объемом около 1 000 знаков. Возможно, на английском сделать это ему удается, но против великого и могучего искусственный интеллект явно слабоват. Вот, например, какое продолжение предложил интеллектуальный генератор текста к классическому «Буря мглою небо кроет…»:
Задавая программе все новые связанные между собой фрагменты, можно собрать текст на простую тему, например, «Как правильно варить бульон». Но руководствоваться этими текстами как инструкциями настоятельно не рекомендуется! Впрочем, это и невозможно, судя по результату:
Еще один эксперимент. Переведем на английский фрагмент текста: «Давайте вместо долгого гадания того, заменит ли искусственный интеллект копирайтеров, просто на практике испытаем его возможности. Сразу нужно предупредить, что нейросеть не всегда выдает осмысленные тексты, и они пока доступны только на английском». И предложим дописать его генератору. Вот что получаем в итоге (в переводе на русский):
Есть и локальные попытки разработать генераторы уникального текста на русском. Они не слишком удачны, относятся, скорее, к категории «программисты шутят». Так разработчики Webboss самокритично назвали свой инструмент бредогенератором.
Можно вставить в поле слева любой текст. А можно и не вставлять – просто кликните на кнопку «Генерировать новый текст» и получите гарантированную порцию отборного, экологически чистого бреда. Справедливости ради замечу: для тех, кто заказывает тексты с одним только требованием – «уникальность!» – вариант может оказаться приемлемым.
Анна Агаева
редактор сайта для родителей family3.ru
Появятся новые специальности – например, создатель алгоритмов для написания текстов.
Нейросеть сейчас уже пишет музыку, создает картины, осваивает литературный жанр.
Конечно, произведения бедноваты по смыслу («пришел-стукнул-открыл-сказал»), но разве не по этому принципу сейчас пишутся сценарии большинства сериалов?
Нейросеть хороша в поиске и обработке данных (в этом с ней сложно тягаться любой человеческой единице), умеет создавать на их основе некий творческий продукт, который можно назвать новым, но довольно условно.
Существует и встречный процесс — снижение запросов публики. И многим качества такого «комбикорма» вполне достаточно.
С другой стороны, текстовые продукты смогут быть настолько индивидуализированы, что будут подстраиваться не только под конкретного человека, но и под его настроение, которое будут улавливать с помощью датчиков, сенсоров. И в зависимости от этого тексты, которые увидите именно вы, будут ругать власть / всех мужиков или наоборот вещать о красоте всего сущего / радости быть девочкой.
Это значит, что для массового рынка нейросеть скоро подвинет многие профессии, которые раньше относили к творческим. В то же время появятся новые — «создатели алгоритмов для написания текстов», например.
Нейросети пытаются создавать бренды, опираясь на ключевые слова. Пример — сервис Namelix. Вот что происходит: ты выбираешь ключевые слова. Задаешь длину названия. Выбираешь стиль названия из десятка предложенных, где есть имена собственные, слова с опечатками или слова, которые с большой вероятностью могут стать брендом.
Потом задаешь слова-ассоциации, так или иначе связанные с идеей. Кликаешь на «Генерировать название». Получаешь варианты.
Еще один инструмент, с помощью которого можно попытаться сэкономить и не платить копирайтеру за нейминг — Hipsterbusiness. Этот сервис рандомно соединяет слова. Если долго-долго мучиться, может получиться что-то забавное, напоминающее название придорожного трактира или пивного паба.
Светлана Свиридова
неймер, копирайтер
Генераторам плевать на вашу целевую аудиторию, им не понять метафоры, игру слов, современные тренды.
Как вспомогательные ресурсы для вдохновения, вот когда совсем не идет процесс генерации названий, когда нападает так называемый креативный запор — очень изредка можно использовать генераторы. Но для качественной разработки названия под конкретный бриф и конкретную задачу они совершенно не годятся.
Генераторам плевать на вашу ЦА, на маркетинговые исследования, на ценовую категорию, им не опишешь конкурентные преимущества, им не понять метафоры, игру слов, современные тренды, юмор и т. д. Генератор никогда не сделает человечное название!
Хотя когда допускается, что название может быть неологизмом – вымышленным словом, помочь копирайтеру они все же способны. Помочь, но не заменить. То же самое касается копирайтинга. Какие-то SEO-тексты еще куда ни шло доверить машине, но продающие, сторителлинг, коммерческие предложения, которые зачастую пишутся четко под клиента – ну никак! А личные посты в соцсетях? Неужели мы готовы отдать нашу душу на съедение холодному расчету и алгоритмам?
Подводим итоги
1953 год. Фантастический рассказ писателя Пьера Буля «Идеальный робот»:
«В настоящее время еще рано помышлять о приборе, способном сочинить рассказ, – говорил ученый, – хотя не следует отвергать эту возможность в будущем… Пока ограничимся короткими фразами.
Изобрести прибор, произносящий отдельные слова, не так уж трудно. Слова являются простой комбинацией конечного числа гласных и согласных, и их синтез можно свести к чисто механической операции, начиная с исходной буквы… Затем можно вообразить себе второй этап, на котором будет происходить первичное сопоставление. Если будет выбрано существительное «баран», очевидно, робот сумеет скомбинировать это слово грамматически с подходящим прилагательным, иначе говоря – выбрать нужное из таких словосочетаний, как «жидкий баран», «туманный баран» или «белый баран», исключая те, что нарушают строгие правила соответствия грамматического рода и числа, как, например, «лучезарная баран» или «белые баран». Пока мы еще не сталкивались с какими-либо трудностями в этом отношении…
– «Жидкий баран» – бессмысленное словосочетание, – прервал профессора Дух противоречия.
– Дай же мне закончить! Все в свое время… Мы не предвидим особых осложнений и на следующем этапе: при образовании законченной простейшей фразы по всем правилам синтаксиса. Эти правила точно определены, так что машина сумеет принять их так же, как человеческий мозг, а может быть, и еще лучше. Так мы добьемся образования некоторого количества грамматически и синтаксически правильных фраз, вроде «жидкий баран летает в заостренном небе» или же «белый баран ест траву»…
– Вот тут-то я тебя и поймал! – обрадовался Дух противоречия. – Большинство твоих фраз, как ты говоришь, грамматически и синтаксически правильных, будут бессмысленны!
– Они будут безупречны с точки зрения формы».
… Прошло 67 лет, но будущее пока не наступило.
Искусственный интеллект научился писать тексты – это правда. В них есть разные части речи, есть понятные словосочетания, знаки препинания и структура предложений. Они вполне могут быть безупречны с точки зрения формы. Но смысла, эмоций и души в них пока даже меньше, чем в текстах по 10 р. / 1 000 знаков, которые заказывают на биржах.
Так что именно копирайтинг – тексты, которые мотивируют людей к конкретным действиям – пока вне досягаемости для искусственного интеллекта. Друзья, пока жидкий баран летает в заостренном небе – копирайтеры в безопасности.
А чтобы ИИ точно не забрал вашу работу, постоянно работайте над собой – прокачивайте свои навыки и компетенции. В этом вам помогут онлайн-курсы TeachLine, например, «Коммерческий автор» и «Редактура и фактчекинг».
В Google и «Яндексе», соцсетях, рассылках, на видеоплатформах, у блогеров