Аникаев Владислав Анатольевич : другие произведения.

5. По следам Билла Гейтса

Самиздат: [Регистрация] [Найти] [Рейтинги] [Обсуждения] [Новинки] [Обзоры] [Помощь|Техвопросы]
Ссылки:
Школа кожевенного мастерства: сумки, ремни своими руками
 Ваша оценка:

  Искусственный интеллект - слуга, друг или змея подколодная?
  
  5. По следам Билла Гейтса
  
  А все же Билл Гейтс авторитет. Может, его мнение в Microsoft уже не имеет веса, но для интернет-обывателя он еще на виду. И любой, узнав о его пожертвованиях и благотворительных фондах слюни распустит: дивиденды создателя Microsoft никто не отменял. Возможно, у пенсионера Гейтса уже нет влияния и желания влиять на ведущиеся разработки, но его информированность о текущих проектах в родном Microsoft'е и у друзей-конкурентов не подлежит сомнению. Вот и его опасения об угрозах становления ИИ не голословны и были как-то озвучены в предыдущих разделах.
  Что ж, капитан сошел на берег, а корабль Microsoft по-прежнему на плаву.
  Посмотрим, как Microsoft вписывается в нашу тему об ИИ, и не последнюю роль в теме играет пресловутый OpenAI.
  "Нужно больше понимать о структуре управления и планах доходов на будущее, - написал Илон Маск в Twitter. - OpenAI был создан как некоммерческая организация (НКО) с открытым исходным кодом. Ни то, ни другое уже не является правдой".
  И действительно в конце 2019 года OpenAI объявила о партнерстве с Microsoft, а в 2020 году отказалась от своего статуса НКО.
  В корпоративном блоге опубликовали следующее сообщение:
  "Мы хотим увеличить нашу способность привлекать капитал, продолжая выполнять нашу миссию, и ни одна из ранее существовавших юридических структур, о которых мы знаем, не обеспечивает правильного баланса. Наше решение заключается в создании OpenAI LP как гибрида коммерческой и некоммерческой организации, которую мы называем компанией с ограниченной прибылью (LP)".
  Благодаря новой структуре прибыли инвесторы OpenAI могли бы заработать в 100 раз больше своих первоначальных инвестиций, но ничего сверх этого. Оставшиеся деньги пойдут на некоммерческую работу.
  Microsoft инвестировала в разработчика ИИ $1 млрд, и OpenAI заявила, что будет лицензировать свою технологию исключительно у Microsoft.
  С каждым годом алгоритмы OpenAI становятся более сложными и комплексными - вместе с этим растут требования к вычислительной мощности компьютеров. Для решения этой проблемы компания объединилась с Microsoft. OpenAI эта сделка дала не только дополнительный миллиард долларов инвестиций, но и доступ к облачным ресурсам Microsoft Azure для разработки и тестирования искусственного интеллекта. Взамен Microsoft сможет первой получать доступ к технологиям OpenAI, которые можно использовать в других облачных продуктах.
  В СМИ уже просачиваются слухи о новой ОС от Microsoft с элементами ИИ (WindowsAI?) - Что это: только API для пользователей или попытка доминирования в мировой паутине? - Не все пункты соглашения доступны общественности, но ходить строем теперь придется под музыку Microsoft.
  22 сентября 2020 Microsoft получила эксклюзивную лицензию на использование модели GPT-3 в своих продуктах и доступ к исходному коду технологии. Остальные разработчики по-прежнему могут получить доступ к алгоритму только через API. Бывший сооснователь OpenAI Илон Маск негативно отнёсся к этой сделке.
  Благодаря партнерству с Microsoft, разработчики OpenAI смогли перейти к реализации новой задачи - создать так называемый AGI (Artificial General Intelligence), на русский язык этот термин переводят как "общий искусственный интеллект" (ОИИ). Это масштабная модель, которая умеет выполнять сразу несколько задач и подстраиваться под человека, лучше понимая его запросы. А так же нужно приблизиться к решению проблемы современных нейросетей, которые умеют действовать только в определенных рамках, ограниченных исходными данными и настройками. Нужны новые идеи и алгоритмы: скорей всего требуются нейросети, настраивающиеся без учителя по выборкам из потока данных.
  Чтобы масштабировать возможности искусственного интеллекта, Microsoft и OpenAI начали строить вычислительную платформу, которая справится с любым объемом данных. В результате появился новый облачный суперкомпьютер на базе технологий Azure, который по производительности входит в пятерку самых мощных компьютеров мира.
  Суперкомпьютер работает на 285 тысячах процессорных ядер, 10 тысячах графических блоков и со скоростью сетевого подключения 400 Гб/с. Вычислительная мощность такого уровня нужна для обработки миллионов текстов, документов, фотографий и другой информации.
  Уже через неделю после анонса суперкомпьютера OpenAI представила третье поколение алгоритма GPT-3 (Generative Pretrained Transformer), который обучили на более чем 500 гигабайтах текста - это в десять раз больше, чем в предыдущей языковой модели. Для понимания масштаба: в систему загрузили всю "Википедию", несколько сотен книг, статей и других источников. Главное отличие этого алгоритма от предыдущих - большой набор задач и понимание сложных запросов. Систему можно попросить написать стихотворение на основе нескольких примеров, и получится новое уникальное произведение. Еще новый алгоритм GPT-3 умеет переводить тексты между несколькими языками, отвечать на вопросы по статьям, решать арифметические задачи и создавать новые тексты. Получается что-то вроде большой и очень сложной программы, которая умеет работать с текстами в разных направлениях.
   OpenAI открыла доступ к чат-боту ChatGPT. Проект покорил пользователей интернета, которые начали верить в его способность заменить человека в художественной и научной литературе.
  ChatGPT на удивление легко и добросовестно справляется с самыми невероятными задачами, которые ему поручают пользователи Сети: он выдаёт грамотные исторические справки и пишет стихи о криптовалюте. Популярность проекта удивила даже его создателей - глава OpenAI Сэм Альтман (Sam Altman) сообщил, что чат-бот пользуется куда более высоким спросом, чем предполагалось.
  Также разработчики ChatGPT предупредили, что он "иногда пишет правдоподобные, но неверные или бессмысленные ответы" и порой бывает "излишне многословным" из-за того, как его обучили. Ложку дёгтя добавили и некоторые пользователи: он дал подробный, но неверный ответ на вопрос по алгебре и как-то научился обходить запреты на публикацию изречений, связанных с насилием, преступлениями и расизмом. - Да, плохому можно быстро "научиться". Запреты запретами, но надо бы уметь самому GPT анализировать сформированный текст.
  Несмотря на то, что данный ИИ пока используется лишь как чат-бот, он может применяться и в других сферах. Например, он может быть использован для поиска информации в Сети (уже промелькнула информация о выпуске поисковика Bing от Microsoft с алггоритмами GPT-4, также Microsoft предоставила новую версию интернет-браузера Edge с новым поисковиком и интерфейсом ChatGPT). 
  ChatGPT обязательно продолжит совершенствоваться, но даже в теперешнем виде он представляет ощутимую угрозу для Google. Есть мнение, что поисковый гигант оказался на пороге того, чего так опасаются крупнейшие игроки кремниевой долины - глобальных технологических изменений, способных разрушить бизнес. Вот уже более 20 лет поисковая служба Google служит крупнейшей в мире точкой входа пользователей в интернет, и терять такой актив в компании не хотят.
  Google когда-то стала одним из разработчиков лежащей в основе ChatGPT технологии. Технологией, которая оказалась доступной для множества новых, более мелких компаний, каждая из которых может создать угрозу для поиска Google. На сегодня поисковая машина Google за счет размещения в ней рекламы приносит компании более 80 % доходов.
  По данным издания The New York Times, в компании Google полагают, что искусственный интеллект ChatGPT может оставить без работы целые отделы компании. Когда речь заходит о "трех законах робототехники" Азимова, то обычно фразу про то, что "робот не может причинить вред человеку" рассматривают с точки зрения вреда здоровью. В случае же с ChatGPT ущерб может быть причинен благосостоянию. 
  Но Google не собирается сдаваться, продолжая совершенствовать свою поисковую машину и повышая ее интеллект. Приоритетным направлением при этом называют создание "этического" ИИ, ограждающего пользователей от ложной и "токсичной" информации.
  А конкуренция тем временем крепчает, и в процессе интеллектуализации электронных технологий опять объявился Илон Маск, который на базе тысяч процессоров обещает для общего использования предоставить если не альтернативу ChatGPT под названием TruthGPT, то ИИ, специализирующийся на независимой подаче новостной информации. Конечно, там, судя по названию, будут только "правдивые" сведения ("правда и только правда и ничего кроме правды", но включение рекламы такие проекты подразумевают по умолчанию). Сомнительно, что даже любое событие можно осветить непредвзято, не говоря уже об интерпретации событийного контекста. Скорей всего этот ход Маска подтверждает его политические амбиции, но будет ли монополизация "правды" Истиной для всего человечества? - Можно, конечно, подождать и не роптать заранее, но очень уж заманчиво доверять правильному новостному каналу под названием TruthGPT.
  "Масштаб коммерческого и творческого потенциала, который может быть раскрыт с помощью модели GPT-3, огромен, и некоторые из этих возможностей настолько новы, что мы их даже не представляем. Непосредственная помощь человеческому творчеству и изобретательности в таких областях, как написание и композиция, описание и обобщение больших блоков данных длинной формы (включая код), преобразование естественного языка в другой язык - возможности ограничены только идеями и сценариями, которые мы можем предложить", - говорится в сообщении Microsoft в блоге.
  Бегло рассмотрим последние наработки OpenAI, связанные в основном с моделированием творческой деятельности человека.
  OpenAI, уже прославившаяся благодаря генератору DALL-E, способному генерировать изображения по текстовым описаниям, выпустила новый революционный продукт. Компания сообщила о новейшей разработке POINT-E, готовой создавать 3D-фигуры из "облака" точек - тоже с помощью текстовых описаний.
  Вполне возможно, что скоро мир увидит не только забастовки обычных авторов цифровых картин, но и художников, занимающихся 3D-моделированием, которое используется сегодня буквально повсеместно в медиасфере.
  Специалисты OpenAI обучили нейросеть Point-E создавать 3D-модели на массиве данных из "нескольких миллионов" трёхмерных объектов. В компании продолжат обучение алгоритмов, а также будут работать над тем, чтобы повысить качество детализации генерируемых моделей.
   Сперва Point-E создаёт обычное изображение по текстовому запросу пользователя, а после преобразует его в трёхмерную форму. На выходе у нейросети получается 3D-модель, состоящая из набора точек. У таких моделей низкая детализация, но их можно полноценно использовать в разработке игр или создании анимационных видео.
  В компании OpenAI сообщили, что на генерацию 3D-модели уходит всего пара минут. При этом нейросети не требуется специальное мощное оборудование - она способна создавать трёхмерные объекты на ПК с обычной видеокартой.
   В OpenAI подчеркнули, что пока Point-E существует лишь в виде ранней версии, но у компании большие надежды на эту технологию. Специалисты полагают, что через некоторое время нейросеть сможет стать вспомогательным инструментом для разработчиков и аниматоров.
  Вернемся к DALL-E, на примере которой увидим проблемы использования ИИ в человеческом обществе, в частности затронем проблему авторских прав.
  Пока одни спорят, способны ли сгенерированные нейросетью изображения поставить крест на сервисах продажи стоковых картинок, другие уже берут технологию на вооружение и организуют торговлю созданным с помощью алгоритмов ИИ контентом. Именно такой проект готовится реализовать известный сервис Shutterstock.
  Анонсировано расширенное партнёрство с OpenAI, которая интегрирует свою ИИ-модель DALL-E 2 в платформу Shutterstock. Дополнительно Shutterstock основала фонд Contributor Fund, с помощью которого компания будет платить компенсации авторам контента, используемого для тренировки ИИ.
  Shutterstock и OpenAI сотрудничают в данной сфере не впервые. С 2021 года одна продавала другой изображения и метаданные для тренировки DALL-E, в OpenAI считают эти материалы критически важными для тренировки модели. Теперь художники будут буквально конкурировать с ИИ, который учился на их работах.
  Компенсация авторам изображений поднимает ряд этических и правовых вопросов. Представитель Shutterstock заявил, что с новой технологией связано много спорных моментов, в том числе затрагивающих вопросы собственности. По мнению компании, поскольку для обучения использовались изображения многих художников, созданные ИИ изображения не могут иметь автора, а компенсацию за них должны получать авторы, чьи работы были использованы при создании каждого экземпляра изображения. Доля каждого будет рассчитана исходя из вклада в виде изображений и метаданных. Но пока даже примерно неизвестно, сколько будут платить каждому автору ($1 за каждый заимствованный мегапиксель?)
  Сайт Stack Overflow, предназначенный для организации взаимопомощи программистам, временно запретил пользователям публикацию справочных материалов, сгенерированных чат-ботом ChatGPT. По словам модераторов, создавать подсказки с помощью искусственного интеллекта ChatGPT слишком легко, и они выглядят весьма правдоподобно. Тем не менее, очень часто они неправильные.
  Чат-бот ChatGPT - экспериментальное решение, разработанное компанией OpenAI на основе генератора текстов GPT-3.5. Сетевая демо-версия продукта до сих пор активно используется пользователями. Проблема в том, что бот способен решать массу задач, от написания стихов и песен до сценариев и формулирования ответов на задаваемые вопросы, но при всей убедительности текстов, они очень часто содержат грубые ошибки, особенно когда речь идёт о темах, посвящённых работе с программным кодом. Впрочем, ошибки совершаются и в других сферах: составляя биографию известной личности, ChatGPT способен вставлять в текст некорректные данные. Таким же образом он создаёт вполне "правдоподобный", но неработающий код.
  В основу ChatGPT положены большие языковые модели (Large Language Model, LLM). Они анализируют огромные массивы текстов, формируют закономерности и на их основе предлагают собственные решения, буквально предугадывая, каким должно быть следующее слово в предложении. Такие модели не имеют точного представления о работе некоторых систем, в результате чего фактически генерируется недостоверная информация. Пока трудно оценить, какая часть подготовленных ими материалов недостоверна. В Stack Overflow решили, что риск дезинформации пользователей слишком велик. При этом многие эксперты опасаются, что с ростом числа сгенерированных неверных ответов растёт и риск того, что ими поделятся в Сети, погружая последнюю в хаос - контент, созданный реальными пользователями, просто утонет в море сгенерированных материалов.
  Пока данных о вреде, наносимом LLM в реальном мире, немного, но события на Stack Overflow служат подтверждением существования пугающей тенденции. По словам модераторов, до введения запрета на ChatGPT на площадке уже появились тысячи сгенерированных ответов, каждый из которых требует детальной проверки.
  Эксперты опасаются, что ситуация повторится и на других платформах - лавина сгенерированного ИИ контента не позволит ознакомиться с мнениями настоящих пользователей.
  Пользователи Stack Overflow поддержали запрет, хотя отметили, что распознать "искусственный" контент будет непросто. Совета спросили и у самого ChatGPT. В ходе многочисленных экспериментов тот выдал вполне разумный ответ. "В целом, разрешать ли сгенерированные ИИ ответы на Stack Overflow - сложное решение, которое должно осторожно рассматриваться сообществом", - заявил бот.
  OpenAI научила ИИ преобразовывать команды на английском языке в программный код.
  Компания OpenAI, занимающаяся исследованиями в области систем искусственного интеллекта, представила новое решение на основе алгоритма Codex. Оно способно интерпретировать команды на английском языке для последующей их реализации в виде программного кода, позволяющего строить несложные сайты и ПО.
  По словам разработчиков, теперь Codex может заметно упрощать как работу опытных программистов, так и помогать обучению начинающих. ИИ буквально превращает поток слов в настоящее ПО вроде сайтов или рудиментарных, несложных игр. Например, пользователь может описать базовый внешний вид сайта или его функциональность, перечислив требования вроде местоположения меню или текстовых блоков с помощью обычного разговорного английского, а Codex сгенерирует готовый продукт исходя из собственных "представлений" о том, что необходимо выполнить.
  В этом варианте навыков программирования в некоторых случаях не требуется вовсе. Впрочем, в основном Codex будет работать только как "помощник" или "заместитель" программиста, реализующий концептуальные идеи "творцов" максимально простым способом.
  По словам технического директора и сооснователя OpenAI Грега Брокмана (Greg Brockman), новый инструмент рассчитан на широкий круг программистов. В первую очередь он позволит избавить специалистов от монотонной повторяющейся работы, используя библиотеки, функции, API.
  Codex построен на основе алгоритма GPT-3 - созданного OpenAI для генерации "осмысленных" текстов на основе анализа многих терабайт текстовых материалов в интернете. При этом он может вызвать негативную реакцию разработчиков, выкладывающих в сеть свободное ПО с открытым исходным кодом. Алгоритм использует дополнительные данные, которые буквально "выгребли" из репозиториев свободного ПО для последующего анализа.
  OpenAI заявила, что не нарушает каких-либо законов об авторских и смежных правах. Тем не менее многие ожидают критики со стороны волонтёров, создававших бесчисленное число строк кода - компания намерена наживаться на усилиях сообщества, выкладывавшего свой софт для бесплатного разбора и использования. Пока программисты не имеют общей или хотя бы доминирующей позиции в отношении вновь созданного инструмента.
  OpenAI также представила Jukebox - искусственный интеллект, сочиняющий музыку с осмысленными текстами и вокалом. Зарубежные журналисты сообщают, что это самый впечатляющий ИИ для написания музыки, который они видели.
  Система Jukebox обучалась на основе множества отрывков из песен самых разных жанров, от классического рока до хип-хопа. Подобно тому, как другие нейронные сети способны имитировать стили рисования знаменитых художников, новый проект OpenAI может создавать музыкальные композиции как у исполнителей, на треках которых он обучался. Например, он может сочинить музыку в стиле кантри-певца Джонни Кэша, рэпера Drake и даже российской поп-группы "Тату".
  "Мы показываем, что наши модели искусственного интеллекта могут создавать песни на основе самых разных музыкальных жанров, таких как рок, хип-хоп и джаз. Они могут создать мелодию, ритм и тембры для самых разных инструментов, а также стили и голоса певцов, которые будут звучать вместе с музыкой", - объяснили представители OpenAI.
  На данный момент музыка OpenAI впечатляет, но далека по качеству от идеала. Искусственному интеллекту пока явно не хватает мастерства, чтобы воссоздать полную структуру музыки с куплетами и повторяющимися припевами.
  На создание одной минуты музыкального трека искусственному интеллекту Jukebox требуется около 9 часов. Так что компания пока не может создать приложение, где музыкальные композиции сможет создавать каждый. Зато разработчики опубликовали результаты работы Jukebox. Послушать их можно на специальном сайте.
  С учетом того, что ИИ научился рисовать изображения по их текстовому описанию, писать стихи, эссе и прочие тексты, создавать программные коды, сочинять музыку и создавать музыкальные композиции, - все это начинает конкурировать с людьми творческих профессий - художниками, аниматорами, писателями, поэтами, эссеистами, программистами, кодировщиками, композиторами, музыкантами, певцами и пр. В конце концов наши "культурные" запросы вполне могут быть удовлетворены предложением от ИИ, а те профессии, что во все времена формировали культуру общества будут не востребованы.
 Ваша оценка:

Связаться с программистом сайта.

Новые книги авторов СИ, вышедшие из печати:
О.Болдырева "Крадуш. Чужие души" М.Николаев "Вторжение на Землю"

Как попасть в этoт список

Кожевенное мастерство | Сайт "Художники" | Доска об'явлений "Книги"