Machine Learning

Стачка.MachineLearning

С каждым днем машинное обучение и анализ данных становятся все доступнее!

Все больше данных, все больше типовых решений, все больше статей и открытого кода. Все больше задач, которые можно решить эффективнее если применить даже простые подходы. Хотя конечно же многие решения требуют исследований и нетривиальных знаний теории.

Вот мы и расскажем о том как это делается и покажем, что внутри этих страшных вещей на самом деле крутится вполне понятная математика (хоть и не всегда простая). Да-да, та самая математика, которую оказывается надо было учить в универе. Итак если вы хотите:

  • заниматься машинным обучением или анализом данных, но не знаете с чего начать и в каком направлении двигаться.
  • разобраться в том как управлять проектом в сфере ML и узнать опыт сторонних компаний.
  • узнать на что сегодня способны и не способны вездесущие нейронные сети.
  • понять какие вообще бывают ML проекты, из чего состоят будни специалиста и с какими задачами приходится сталкиваться.

Приходите и мы будем разбираться во всем этом!


Спикер
Моя должность @ Моя компания
Мой город

Иван Голованов
Руководитель отдела разработки CAM-систем @ Glidewell Dental
igolovanov@adalisk.com

В нашей компании Adalisk (подрядчик крупнейшей в США компании по зубному протезированию Glidewelldental) мы занимаемся автоматизацией производства зубных протезов – коронок, мостов, имплантов и т.д. Самая сложная и недетерминированная часть производства – дизайн протеза, который в настоящее время выполняется в CAD-системе на компьютере. Каждый протез делается под конкретного человека и уникален по своей геометрии, отвечая конкретному челюстному слепку, при этом у каждого дизайн-техника своё субъективное видение, что такое хорошая зубная коронка. Помимо задачи генерации дизайна, мы решаем также ряд задач по автоматической классификации входных данных: определение номера реставрируемого зуба, выделение его соседей и пр. В докладе будет рассказано о том, как мы автоматизируем различные этапы производства с помощью нейронных сетей, постепенно сводя влияние человеческого фактора к минимуму.

Даже в простых «потоковых» задачах типа предварительной сортировки массива входных зубных слепков по департаментам человек склонен допускать довольно много ошибок – в наших условиях несколько процентов; с помощью несложной распознающей сети процент ошибок можно понизить до долей процента.

В более неформальных случаях, таких как разработка дизайна будущей коронки, применение методов глубокого обучения позволяет стабилизировать качество при резком сокращении среднего времени, которое зубной техник тратит на дизайн единицы продукции.

Для решения таких задач ключевым компонентом с одной стороны является быстрый доступ к данным (общий объем наших данных составляет более 5 млн. кейсов, или порядка 150 Тб, они хранятся в облаке Amazon) и удобные средства для преселекции - выборки случаев с нужным зубом и типом реставрации и пр., для этого мы используем разработанный в компании сервис CMS+Orcas. С другой стороны, необходимо оперативно тестировать натренированные локально сети (разные сети при этом используют разные фреймворки), и с наименьшими изменениями переводить их из режима тестирования в рабочий, высоконагруженный режим. Для этого мы используем внутренний сервис DLFrame, который единообразно хранит и «прогоняет» сети, обеспечивая надёжность, быстрый отклик и масштабируемость.

Наша группа сотрудничает с институтом Беркли (США) в части разработки глубоких нейронных сетей. По результатам работы написана статья.