Решение NBD Biblion создавать рецензии на книги исключительно с помощью алгоритмов из области искусственного интеллекта (ИИ) вызывает бурную реакцию.
Мы видим такую реакцию не только среди более чем семисот человек, предоставивших «Библион» описания книг.
Исследователи литературы, преподаватели и читатели также участвуют в дебатах, которые разворачиваются через блоги, Twitter и другие средства массовой информации .
Естественно, дискуссия привлекает внимание и литературоведов Института Гюйгенса.
Как исследователи литературы, мы используем вычислительные технологии почти во всех наших исследованиях.
Трудно оспорить полезность , смысл и эффективность таких приложений. Основываясь на этом опыте и знаниях, мы считаем, что шаг «Библиона» по использованию компьютерных алгоритмов для описания книг является не только интересным, но и логичным и даже хорошим развитием.
Но есть некоторые «если» и «но».
Сначала скажем, чему мы аплодируем.
Применить как инструмент
Годовой выпуск книг в настоящее время настолько велик, что даже если число профессиональных рецензентов увеличится, не каждая книга может быть оценена рецензией.
Большинство книг не идентифицированы из-за нехватки человеческого потенциала.
Поэтому их шансы быть купленными и прочитанными резко снижаются — они фактически исключаются с самого начала.
Если цифровые технологии могут помочь лучше понять этот огромный диапазон, то мы считаем, что нам следует в первую очередь развивать и применять эту технологию в качестве инструмента.
Исследователи и программисты, применяющие и разрабатывающие эти методы, обычно хорошо осведомлены об ограничениях и недостатках этой технологии.
Большое международное сообщество внимательных философов, специалистов по этике, социологов, медиа-ученых и (цифровых) гуманитариев также внимательно и критично следит за этими событиями.
Поэтому недоразумения, злоупотребления и злоупотребления в применении методов машинного обучения и искусственного интеллекта обычно быстро разоблачаются .
Мы считаем, что было бы полезно, если бы мы также позволили этим экспертам высказать свое мнение, прежде чем мы будем осуждать планы использования алгоритмов.
Человеческий черный ящик
Но давайте посмотрим на проблему и с другой точки зрения.
Действительно ли группа из семисот человек работает лучше, чем несколько цифровых ботов, описывающих книги?
Семьсот человеческих голов в этой группе содержат всевозможные культурно обусловленные предположения о том, что такое хорошо написанная книга.
Существуют также всевозможные субъективные мнения о том, какие темы важны и интересны, какие истории скучны, что такое клише и что такое красивый стиль.
Учитывая все обстоятельства, эти семьсот человек представляют собой пугающе малую часть читательской аудитории, которую они якобы обслуживают.
Если пример с Цумом можно считать средним, то о качестве человеческого черного ящика еще остается место для дискуссий.
Этот обзор демонстрирует некоторую уверенность в себе. «Шедевр» — вот вердикт. Но кто это решает?
И на каком основании?
Насколько много рецензент, говорящий об удовольствии от чтения «при ревущем огне и при тусклом освещении», знает о привычках чтения сотен тысяч самых разных читателей, которые берут книги в библиотеках?
Наш человеческий мозг довольно хорошо умеет делать эффективный выбор в одном ограниченном контексте. Но наш индивидуальный мозг на самом деле плохо приспособлен для формирования репрезентативной и плюриформной картины ошеломляющего разнообразия читающей публики и большого разнообразия потребностей этой аудитории в чтении, и поэтому мало приспособлен для определения того, какая книга «хороша» для какой. читатель. .
Не существует ни одного архетипического читателя, для которого мы могли бы писать рецензии, но при написании рецензий человек-рецензент предполагает наличие такого архетипического читателя.
Рецензенты неосознанно и непреднамеренно часто пишут рецензии для людей, которым нравится читать толстую книгу у потрескивающего огня.
Это действительно не поможет вам как молодому человеку, любящему хип-хоп. (И это тоже предположение.)
Элита рецензентов
Аудитория голландских книг становится все больше и разнообразнее, а ее потребности в чтении меняются со временем, культурой, обществом и событиями.
Поэтому эту аудиторию все меньше и меньше беспокоит то, что элита рецензентов считает стоящим чтения и хорошим.
Они предпочитают заглянуть на Goodreads , чтобы узнать, что думают о книге другие читатели, и вручить приз зрительских симпатий NS роману , который профессиональные критики еще не сочли достойным зажечь этот уютный потрескивающий огонь.
Поэтому мы считаем, что библиотеки, которые должны обслуживать все более разнообразную аудиторию и которые наводнены гигантским ассортиментом книг, действительно имеют большую потребность в сопоставимых оценках книг по ряду фиксированных аспектов, которые были подтверждены результатами тысяч читателей. .
В этом отношении у алгоритмов есть как минимум одно неоспоримое преимущество: они могут целостно прочитать все, что выдается в книгах, и сделать это за несколько секунд. Хитрость, конечно, в том, чтобы заставить их сделать что-нибудь полезное с этой информацией.
Это самая сложная часть: определить измеримые и воспроизводимые свойства текстов, которые связаны с наблюдаемым опытом чтения среди читателей с разным, но знакомым опытом.
Мы проводим исследования в этом направлении в Институте Гюйгенса уже несколько лет .
Из этого опыта мы знаем, как трудно это сделать. Что мы также знаем, так это то, что алгоритмы пока не очень хороши в этом, но люди-рецензенты справляются с этим еще хуже.
И это, наконец, подводит нас к тому, что нам не нравится в этой ситуации.
Радикальный выбор
Радикальный выбор Biblion отказаться от всех рецензентов-людей и столь же внезапно сделать выбор в пользу исключительно машинных описаний также стал для нас неожиданностью, поскольку мы знаем, что качество рекомендательных систем зависит от непрерывной оценки.
Снова и снова оказывается, что такие системы необходимо постоянно критически тестировать, чтобы гарантировать, что алгоритм делает то, что вы от него ожидаете. А оценка проводится путем неоднократного сравнения ваших результатов с тем, что думают оценщики-люди.
Но «Библион» действительно разозлил их не очень полезным «ходом» в общении.
Как Biblion сможет гарантировать, что их алгоритм обучения не приведет к быстрому развитию гиперрадикальных предпочтений в чтении, если не будет четкого процесса непрерывной оценки?
Тщательная секретность
Поскольку Biblion использует программное обеспечение Bookarang , неизвестны как основной процесс машинного обучения, так и процесс оценки.
По деловым соображениям Bookarang всегда тщательно хранила работу и источник своего программного обеспечения в секрете. У нас есть вопросы и сомнения по поводу этой прозрачности, например, потому, что метаданные, которые использует Bookarang, поступают от издателей.
И мы знаем, что издатели «прагматично» присваивают некоторые метаданные с целью продаж. Рассмотрите научно-популярные книги с пометкой «литературный роман», если это дает им больше шансов быть видимыми в обычном или онлайн-книжном магазине.
Это значит, что метаданные уже, как говорится, достаточно предвзяты. Неясно, как автоматизированный процесс обрабатывает такие предвзятые данные.
Кроме того, неясно, как Bookarang сделал свой алгоритм устойчивым к культурным и социальным предубеждениям, которые без исключения заложены в данные. Обратите внимание: в данных, а не в алгоритме.
Каким бы благонамеренным, правильно разработанным и оцененным ни был алгоритм обучения, если вы впоследствии скормите этот алгоритм исключительно фашистскими текстами, вы автоматически получите рекомендательную систему со слегка правоэкстремистским предпочтением чтения. И это гораздо менее преувеличено , чем вы думаете.
Книги, которые мы читаем, также являются данными, свидетельствующими о наших предрассудках и предпочтениях.
То же самое касается издателей и их решений о том, какие книги публиковать, а какие нет.
Любой элитизм и систематический расизм в нашей читательской культуре безупречно усваиваются и пропагандируются компьютерными алгоритмами.
Прозрачность – это ключ к успеху
Таким образом, наш вывод таков: да, нам следует в основном использовать новые вычислительные и цифровые технологии, поскольку они открывают множество возможностей для достижения лучшей координации между спросом на чтение и предложением чтения.
Но нам следует делать это только в том случае, если мы также сможем изучить и оценить эту технологию прозрачно и критически.
Последнее в случае «Библиона» и «Букаранга» пока не представляется возможным.
Мы хотели бы, чтобы NBD Biblion провела аудит (официальную проверку программного обеспечения) технологии Bookarang независимыми внешними экспертами.
Затем эти эксперты могут составить список того, как процесс выглядит в настоящее время и какие данные используются для создания описаний.
Экспертиза для таких критических исследований в области технологий искусственного интеллекта широко доступна в Нидерландах.
Исследователи из Института Гюйгенса, которые работают над книгами, читателями и искусственным интеллектом, очень хотят сыграть свою роль в таком аудите и поделиться своими выводами со всеми.
Книги, ридеры и все технологии, которые их связывают, близки нашим сердцам.
Карина ван Дален-Оскам, Марин Кулен, Юлия Нойгартен и Йорис ван Зундерт