Летняя школа WWSSS’17

С 1 по 8 июля в Санкт-Петербурге проходит ежегодная международная Летняя школа Web Science 2017, организаторами которой в этом году выступили лаборатория Интернет-исследований Национального исследовательского университета Высшей школы экономики и Лаборатория компьютерных технологий Университета ИТМО. Web Science – новая междисциплинарная площадка для обсуждения того, как Всемирная паутина (World Wide Web) трансформирует наше общество. Для изучения этого влияния исследователи сегодня используют основы как социальных наук, так и компьютерных. Участниками WWSSS’17 стали специалисты из разных сфер, но всех их объединяет интерес к сети Интернет как к социально-технической системе.

В рамках WWSSS’17 каждый участник может посетить доклады, посвященные основным тенденциям в разных областях веб-науки, среди которых аналитика веб-данных, вычислительная социальная наука для решения крупных проблем общества, теоретические социальные исследования с онлайн-экспериментами, введение в науку о городских данных и другое. Кроме того, можно ознакомиться с практическими учебными пособиями, посвященными обработке, анализу и методам обработки данных, с отдельными презентациями на стендовых панелях, а также все участники повысят навыки работы в междисциплинарной команде. 

Поскольку продвижение междисциплинарной коммуникации и сотрудничества является основной целью школы, студенческие команды формируются из представителей разных дисциплин. Вместе они работают над конкретными задачами, связанными с предоставленными наборами данных и наставляются местными инструкторами. Все команды должны будут представить результаты своей работы в последний день школы. Кроме того, все участники должны будут представить свое текущее исследование во время постерной сессии и обсуждений. 

По словам организаторов, для участия в Школе необязательно владеть знаниями в каждой из заявленных областей, однако ученики должны быть заинтересованы в последних трендах Web Science, в приобретении навыков интеллектуального анализа данных, также им необходимо уметь работать в команде.

«Большинство ребят приехали из Европы, есть представители Китая, Кореи, Индии, США, Мексики и Чили. Участникам были предоставлены на выбор двадцать разных наборов данных, напрямую связанных с тематикой школы. Они достаточно разные и иногда связаны с совершенно неожиданными темами – например, с исследованием онлайн-поведения работниц сферы коммерческого секса. Большинство наборов данных, конечно, менее “острые”. Вместе с наборами предлагаются также варианты того, какую работу можно провести с ними. Участники выбирали, что им наиболее интересно. На основе их предпочтений, а также компетенций, мы составили команды. Но окончательное задание нужно было выработать уже в самих группах. Кто-то попытается понять, чем отличаются люди с избыточной массой тела от близких к анорексии с точки зрения посещаемых мест, кто-то решит посмотреть на то, как меняется лексика и тональность в освещении прессой определенных тем. В среднем, в группах работают по шесть человек, хотя эта цифра несколько варьируется. К тому же к группам приписаны менторы, как технические, так и, скажем, “идеологические”, но некоторые менторы помогают сразу нескольким группам, да и некоторые участники задействованы в работе сразу нескольких групп. С одной стороны, у ребят не так уж много времени: меньше недели, и за это время им нужно успеть и посетить лекции, и насладиться петербургским летом. С другой стороны, участники проходили отбор, поэтому мы надеемся, что в конце школы они представят свои исследования, которые будут совмещать в себе как применение современных методов анализа данных, так и глубокую предметную аналитику. Мы ожидаем, что результаты удачных проектов будут позднее опубликованы», – рассказывает один из организаторов школы со стороны Университета ИТМО, сотрудник кафедры компьютерных технологий Андрей Фильченков. 

Первые три дня летней школы прошли в Университете ИТМО, где лекции о веб-науке прочитали семь спикеров из разных стран. Так, одним из докладчиков стал профессор Школы вычислительной техники, директор Центра экстремального поиска Национального университета Сингапура Чуа Тат-Сенг.



В рамках доклада «От изображения к видео» профессор рассказал слушателям об эпохе беспрецедентной эволюции глубоких методов обучения.

«В качестве Святого Грааля искусственного интеллекта задача соединения визуального и текстового, возможно, приобретает самые заметные выгоды в последние годы. Например, сегодняшние алгоритмы способны превзойти людей в ряде масштабных задач визуального распознавания и могут описывать или отвечать на простые вопросы об изображении/видео на естественном языке – все это было немыслимо всего несколько лет назад», – сказал Чуа Тат-Сенг.

Человек давно занимается разными видами распознавания с помощью машинного обучения, пытаясь довести его до совершенства. Как правило, системы распознают речь и изображения – эти технологии используются в разных областях: от приложений, рассказывающих о калорийности продукта, до криминалистики. Однако распознавание движущихся объектов на видео остается одной из самых трудоемких задач для исследователей, так как при отсутствии статики объекты, перекрывающие друг друга, не всегда с легкостью считываются машинами. Сингапурский профессор работает над анализом мультимедийного контента: от распознавания статичного изображения исследователь с коллегами движется в сторону распознавания видео и дальнейшего использования VR/AR технологий. 

Успех, а самое главное – применение визуальной обработки изображения облегчает человеку жизнь во многих сферах, однако по сравнению с анализом и вычленением информации из видео, его можно использовать в ограниченном количестве областей. Примером того, как машинное распознавание становится для человека инструментом поиска, служит портал Visenze, где любой пользователь может загрузить фото понравившегося ему платья, сумки или кроссовок, после чего система сама предложит ему выбор товаров по принципу подобия.

В чем же преимущество видеоконтента перед статичным изображением и почему Чуа Тат-Сенг предлагает бросить силы на изучение видео? Дело в том, что формат видео предлагает более фундаментальное понимание содержания изображения: здесь и трансформация объектов, и сущность связи между объектами, и отношения между ними (поэтому рождается гораздо больше приложений). На видео визуальные отношения между объектами и субъектами могут меняться с течением времени, в то время как визуальные отношения на картинках фиксированы и не могут повествовать историю. Кроме того, видео обеспечивает более широкий набор функций для внедрения VR-технологий (динамическое взаимодействие между объектами, такое как «ходить» и «бегать», насыщение контента аналитическими данными). Другими словами, чтобы выйти за рамки простого медиаконтента, отвечающего за возможность выполнения сложного ответа на вопросы, людям нужно перейти от сущности (изображения) к отношениям (видео). Сегодня разработчики уже научили машины различать объекты на видео, устанавливать между ними связи и описывать каждое движение объектов и субъектов, однако теперь им предстоит сосредоточиться на изучении роли языка и языковых средств обучения для обнаружения связей между объектами, а также использовать уже существующие наработки в качестве базы для приложений.