Стачка.Искусственный интеллект

Секция посвящена технологиям искусственного интеллекта, которые уже прочно вошли в нашу жизнь и продолжают развиваться. Поговорим о:

  • анализе больших объемов данных;
  • распознавании образов в реальном времени;
  • системах принятия решений;
  • автоматизации и т.д.

Несомненно, за развитием искусственного интеллекта будущее. Приглашаем это будущее обсудить.

Купить билеты


Валерий Бабушкин
Директор по моделированию и анализу данных / Руководитель группы аналитики @ X5 Retail Group / Yandex
Москва
Как ускорить А/Б тесты в 10-100 раз

Доклад принят в программу конференции


из Доклады

    А/Б тестирование весьма каверзная задача, особенно когда количество данных слишком мало, чтобы сделать выводы за адекватное количество времени. Хочу рассказать историю о том, как в одном сервисе переключились на новую, самую важную метрику, в связи с чем количества необходимого для А/Б трафика упало в 2 раза и отом, как мы решили эту проблему с помощью Линеаризации, перевзвешивания, машинного обучения и теоремы Баеса


    Александр Сербул
    руководитель отдела направления контроля качества интеграции и внедрений "1С-Битрикс" @ 1С-Битрикс
    Москва
    Гибкое управление проектами в области машинного обучения и BigData

    Доклад принят в программу конференции


    из Доклады

      В докладе простыми словами расскажем, как применять популярные гибкие методологии (Agile, Scrum) в сложных проектах, связанных с машинным обучением, математикой, большими данными. Пройдем все этапы от проектирования, анализа, защиты бизнес-идеи и подбора команды, до оценок качества и конверсии сервиса «на бою». Разберем возможности быстрого запуска подобных проектов с использованием готовых облачных сервисов «Amazom Sage Maker», а также поделимся успешным опытом реализации ML-проектов внутри компании.

      Доклад будет полезен менеджерам, заинтересованным в снижении издержек и рисков запуска проектов по машинному обучению, AI и большим данным в организациях. Также, доклад будет интересен всем, кто хочет привлечь в проект внешние ML-команды, стартапы, научные организации, в т.ч. через организацию конкурсов и хакатонов.


      Александр Паринов
      Ведущий архитектор систем компьютерного зрения @ X5 Retail Group
      Москва
      Albumentations. Как мы сделали библиотеку для аугментации изображений

      Доклад принят в программу конференции


      из Доклады

        Чтобы обучить сверточную нейронную сеть требуется большое количество данных. Аугментация изображений - простой и быстрый способ увеличить обучающую выборку и получить более качественные модели. Существующие библиотеки для аугментаций нас не устроили: они были слишком медленными, поддерживали ограниченный набор преобразований, не умели работать с данными для разных типов задач, их документация была неполной. Мы хотели, чтобы наша библиотека одновременно предоставляла удобный интерфейс на Python и при этом работала достаточно быстро. Также приходилось решать проблемы, присущие любому Open Source проекту - как писать понятную документацию и примеры использования, как чинить баги и не допускать появления большого числа ошибок в новых релизах, как продвигать библиотеку и как следовать пожеланиям сообщества и дальше развивать проект.


        Алексей Натекин
        Основатель @ Open Data Science
        Москва
        Название доклада уточняется

        Программный комитет не принял решения по этому докладу


        из Голосование

        Тезисы доклада уточняются


        Catalyst.DL – fast & reproducible DL experiments

        Программный комитет не принял решения по этому докладу


        из Голосование

        Catalyst.DL – fast & reproducible DL

        При работе в области DL требуется проводить множество различных экспериментов, проверять десятки гиперпараметров, пробовать разные модели и тюнить их гиперпараметры. Кроме этого, под каждый новый проект приходится писать новый пайплайн по обучению, валидации и инференса модели.

        При всем таком разнообразии кода, конфигов, моделей очень сложно не запутаться и не забыть, где и что лежало.

        В этом докладе я расскажу вам про Catalyst.DL – библиотеку для упрощения разработки DL решений. Фреймворк содержит ряд best practices, так и уже готовые пайплайн под задачи классификации и сегментации.

        Получилось ли ускорить проверку гипотез? Воспроизводятся ли результаты? Какой seed самый лучший? Давайте выясним!


        Catalyst.RL – reproducible RL research framework

        Программный комитет не принял решения по этому докладу


        из Голосование

        Несмотря на большой прогресс в области RL и, возможно, именно из-за него, крайне сложно провести сравнению различных алгоритмов RL. Чтобы исправить этот недостаток и быть уверенным в работоспособности новых решений мы представляем Catalyst.RL - библиотеку для проведения RL исследований с акцентом на воспроизводимость и гибкость.

        В этом докладе я расскажу вам про обучение с подкреплением, про то, как появилась эта библиотека, какие открытия уже были сделаны с ее помощью, а какие соревнования - выиграны.

        Есть ли воспроизводимость результатов в RL? Что требуется, чтобы этого добиться? Все просто – переходите на catalyst.


        Семён Бессонов
        Разработчик машинного обучения @ СКБ Контур
        Екатеринбург
        Деплой в продакшн и повторное использование компонентов моделей машинного обучения

        Программный комитет не принял решения по этому докладу


        из Голосование

        Переносить исследовательские наработки в продакшн порой сложно и дорого. Один из вариантов упрощения этой задачи — использование Sklearn Pipelines для вынесения базовых и распространенных обработок данных в отдельную библиотеку.

        Мы внедрили такое решение в команде из 15 специалистов по data science и 15 разработчиков, совместно работающих над множеством продуктов с машинным обучением, и я готов поделиться опытом.

        В докладе я расскажу про этот способ, его проблемы и ограничения, затрону интеграцию с Pandas, использование Docker и Kubernetes для деплоя контейнеров.

        Доклад будет полезен специалистам в области data science, разработчикам и тимлидам команд, которые хотят перейти от исследований с использованием ML/DS к продакшну.


        Петр Ермаков
        Senior Data Scientist @ DataGym.ru / Lamoda
        Москва
        Python DS puzzlers

        Программный комитет не принял решения по этому докладу


        из Голосование

        Работа с данными в Python не предвещает беды и сюрпризов.

        Да и какие тут еще пазлеры? Нетривиальное поведение возможно только в Java. Но не тут то было!

        В интерактивном формате вместе с аудиторией мы откроем новые возможности выстрелить себе в ногу и облажаться в Python-е для DataScience


        Azamat Berdyshev
        Senior Deep Learning Engineer @ BTS Digital
        Astana
        Абстракции в вычислениях машинного обучения

        Программный комитет не принял решения по этому докладу


        из Голосование

        Мы рассмотрим конфликт между dynamism, generics & speed в вычислениях машинного обучения. Я попытается донести, что при правильной абстракции вычислений, несмотря на то, что мы наблюдаем в Python, R, MATLAB и др., можно писать код, обладающий всеми тремя качествами.

        Мы также попытаемся понять, какие из существующих ограничений софта являются фундаментальными (т.е. от железа), а какие случайными (т.е. связаны с дизайном софта, историческим багажом и др.).

        Это будет сопровождаться обзором Джулии – (уже не так уж и) нового языка для дифференцируемого программирования


        Артур Кузин
        Руководитель направления нейронных сетей @ X5 Retail Group
        Москва
        Компьютерное зрение и Видеоаналитика в ритейле

        Программный комитет не принял решения по этому докладу


        из Голосование

        В сети X5 Retail Group 14к+ магазинов, в которых будет развернута видеоаналитика для решения различных задач. А именно: определение доступности товаров на полке, контроль сотрудников, определение очередей.

        В докладе будет рассказано про основные подходы к решению задачи. Будет описан процесс разработки пайплайна на примере соревнований по машинному обучению на платформе kaggle и datasouls.

        Также будут показаны примеры работы решений в проде на реальных магазинах.