6 самых полезных проектов машинного обучения прошлого года (2018)

Прошедший год был удачным для ИИ и машинного обучения. Многие новые эффективные приложения машинного обучения были обнаружены и представлены, особенно в области здравоохранения, финансов, распознавания речи, дополненной реальности и более сложных 3D и видео приложений.

Мы увидели большой толчок в сторону более ориентированных на приложения исследований, а не теоретических. Несмотря на то, что это может иметь свои недостатки, в настоящее время оно оказывает существенное положительное влияние, генерируя новые исследования и разработки, которые можно быстро превратить в ценность для бизнеса и клиентов. Эта тенденция сильно отражена во многих работах по МЛ с открытым исходным кодом.

Давайте посмотрим на топ-6 наиболее практически полезных проектов ML за прошедший год. Эти проекты опубликовали код и наборы данных, которые позволяют отдельным разработчикам и небольшим группам учиться и сразу создавать ценность. Они могут быть не самыми теоретически новаторскими работами, но они применимы и практичны.

Fast.ai

Библиотека Fast.ai была написана для того, чтобы упростить обучение быстрым и точным нейронным сетям с использованием современных лучших практик. Он абстрагируется от всей той мелкой работы, которая может возникнуть при внедрении глубоких нейронных сетей на практике. Он очень прост в использовании и разработан с учетом практического мышления, применяемого практиками. Первоначально созданная для студентов курса Fast.ai, библиотека написана поверх простой в использовании библиотеки Pytorch в четкой и лаконичной форме. Их документация тоже на высшем уровне.

 

Detectron

Detectron — это исследовательская платформа Facebook AI для исследования объектов и сегментации экземпляров, написанная на Caffe2. Он содержит реализации широкого спектра алгоритмов обнаружения объектов, включая:

  • Маска R-CNN : обнаружение объектов и сегментация экземпляров с использованием структуры Faster R-CNN
  • RetinaNet : Функциональная сеть на основе пирамид с уникальным Focal Loss для обработки сложных примеров.
  • Быстрее R-CNN : наиболее распространенная структура для сетей обнаружения объектов

Все сети могут использовать одну из нескольких дополнительных классификационных магистралей:

Более того, все они поставляются с предварительно обученными моделями в наборе данных COCO, поэтому вы можете использовать их прямо из коробки! Все они уже были протестированы с использованием стандартных метрик оценки в модельном зоопарке Detectron .

 
Detectron

FastText

Еще одна из исследований Facebook, библиотека fastTextпредназначена для представления и классификации текста. Он поставляется с предварительно обученными моделями векторов слов для более чем 150 языков. Такие векторы слов могут быть использованы для многих задач, включая классификацию текста, суммирование и перевод

 

AutoKeras

Auto-Keras — это программная библиотека с открытым исходным кодом для автоматического машинного обучения (AutoML). Он был разработан DATA Lab из Техасского университета A & M и участниками сообщества. Конечная цель AutoML — предоставить легкодоступные инструменты глубокого обучения специалистам в области знаний с ограниченным опытом в области данных или машинного обучения. Auto-Keras предоставляет функции для автоматического поиска лучшей архитектуры и гиперпараметров для моделей глубокого обучения.

 

Допамин

Dopamine — это исследовательская структура для быстрого прототипирования алгоритмов обучения с подкреплением, созданная Google. Он нацелен на гибкость, но прост в использовании, реализует стандартные алгоритмы RL, метрики и отличительные черты .

Согласно документации Dopamine, их принципы проектирования:

  • Простые эксперименты : чтобы помочь новым пользователям проводить эксперименты
  • Гибкая разработка : облегчить генерацию новых и инновационных идей для новых пользователей
  • Компактность и надежность : обеспечение реализации некоторых старых и более популярных алгоритмов.
  • Воспроизводимые : Убедитесь, что результаты воспроизводимы
 

vid2vid

Проект vid2vid является публичной реализацией Pytorch самого современного алгоритма синтеза видео в видео от Nvidia. Цель синтеза видео в видео состоит в том, чтобы изучить функцию отображения из входного исходного видео (например, последовательности масок семантической сегментации) в выходное фотореалистичное видео, которое точно отображает содержание исходного видео.

Самое замечательное в этой библиотеке — ее опции: она предоставляет несколько различных приложений vid2vid, включая сцены с автоматическим управлением / городские сцены, лица и позу человека. Он также поставляется с обширными инструкциями и возможностями, включая загрузку набора данных, оценку задач, функциональность обучения и мульти-графический процессор!

 
Преобразование карты сегментации в реальное изображение

Похвальные грамоты

  • ChatterBot: машинное обучение для диалогового движка и создание чат-ботов
  • Kubeflow: инструментарий машинного обучения для Kubernetes
  • imgaug: увеличение изображения для глубокого изучения
  • imbalanced-learn: пакет python под scikit learn специально для работы с несбалансированными наборами данных
  • mlflow: платформа с открытым исходным кодом для управления жизненным циклом ML, включая эксперименты, воспроизводимость и развертывание.
  • AirSim: симулятор для автономных транспортных средств, построенный на Unreal Engine / Unity, от Microsoft AI & Research

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте как обрабатываются ваши данные комментариев.