Прошедший год был удачным для ИИ и машинного обучения. Многие новые эффективные приложения машинного обучения были обнаружены и представлены, особенно в области здравоохранения, финансов, распознавания речи, дополненной реальности и более сложных 3D и видео приложений.
Мы увидели большой толчок в сторону более ориентированных на приложения исследований, а не теоретических. Несмотря на то, что это может иметь свои недостатки, в настоящее время оно оказывает существенное положительное влияние, генерируя новые исследования и разработки, которые можно быстро превратить в ценность для бизнеса и клиентов. Эта тенденция сильно отражена во многих работах по МЛ с открытым исходным кодом.
Давайте посмотрим на топ-6 наиболее практически полезных проектов ML за прошедший год. Эти проекты опубликовали код и наборы данных, которые позволяют отдельным разработчикам и небольшим группам учиться и сразу создавать ценность. Они могут быть не самыми теоретически новаторскими работами, но они применимы и практичны.
Fast.ai
Библиотека Fast.ai была написана для того, чтобы упростить обучение быстрым и точным нейронным сетям с использованием современных лучших практик. Он абстрагируется от всей той мелкой работы, которая может возникнуть при внедрении глубоких нейронных сетей на практике. Он очень прост в использовании и разработан с учетом практического мышления, применяемого практиками. Первоначально созданная для студентов курса Fast.ai, библиотека написана поверх простой в использовании библиотеки Pytorch в четкой и лаконичной форме. Их документация тоже на высшем уровне.

Detectron
Detectron — это исследовательская платформа Facebook AI для исследования объектов и сегментации экземпляров, написанная на Caffe2. Он содержит реализации широкого спектра алгоритмов обнаружения объектов, включая:
- Маска R-CNN : обнаружение объектов и сегментация экземпляров с использованием структуры Faster R-CNN
- RetinaNet : Функциональная сеть на основе пирамид с уникальным Focal Loss для обработки сложных примеров.
- Быстрее R-CNN : наиболее распространенная структура для сетей обнаружения объектов
Все сети могут использовать одну из нескольких дополнительных классификационных магистралей:
- ResNeXt {50101152}
- RESNET {50101152}
- Функциональные сети пирамид (с ResNet / ResNeXt)
- VGG16
Более того, все они поставляются с предварительно обученными моделями в наборе данных COCO, поэтому вы можете использовать их прямо из коробки! Все они уже были протестированы с использованием стандартных метрик оценки в модельном зоопарке Detectron .

FastText
Еще одна из исследований Facebook, библиотека fastTextпредназначена для представления и классификации текста. Он поставляется с предварительно обученными моделями векторов слов для более чем 150 языков. Такие векторы слов могут быть использованы для многих задач, включая классификацию текста, суммирование и перевод

AutoKeras
Auto-Keras — это программная библиотека с открытым исходным кодом для автоматического машинного обучения (AutoML). Он был разработан DATA Lab из Техасского университета A & M и участниками сообщества. Конечная цель AutoML — предоставить легкодоступные инструменты глубокого обучения специалистам в области знаний с ограниченным опытом в области данных или машинного обучения. Auto-Keras предоставляет функции для автоматического поиска лучшей архитектуры и гиперпараметров для моделей глубокого обучения.

Допамин
Dopamine — это исследовательская структура для быстрого прототипирования алгоритмов обучения с подкреплением, созданная Google. Он нацелен на гибкость, но прост в использовании, реализует стандартные алгоритмы RL, метрики и отличительные черты .
Согласно документации Dopamine, их принципы проектирования:
- Простые эксперименты : чтобы помочь новым пользователям проводить эксперименты
- Гибкая разработка : облегчить генерацию новых и инновационных идей для новых пользователей
- Компактность и надежность : обеспечение реализации некоторых старых и более популярных алгоритмов.
- Воспроизводимые : Убедитесь, что результаты воспроизводимы

vid2vid
Проект vid2vid является публичной реализацией Pytorch самого современного алгоритма синтеза видео в видео от Nvidia. Цель синтеза видео в видео состоит в том, чтобы изучить функцию отображения из входного исходного видео (например, последовательности масок семантической сегментации) в выходное фотореалистичное видео, которое точно отображает содержание исходного видео.
Самое замечательное в этой библиотеке — ее опции: она предоставляет несколько различных приложений vid2vid, включая сцены с автоматическим управлением / городские сцены, лица и позу человека. Он также поставляется с обширными инструкциями и возможностями, включая загрузку набора данных, оценку задач, функциональность обучения и мульти-графический процессор!

Похвальные грамоты
- ChatterBot: машинное обучение для диалогового движка и создание чат-ботов
- Kubeflow: инструментарий машинного обучения для Kubernetes
- imgaug: увеличение изображения для глубокого изучения
- imbalanced-learn: пакет python под scikit learn специально для работы с несбалансированными наборами данных
- mlflow: платформа с открытым исходным кодом для управления жизненным циклом ML, включая эксперименты, воспроизводимость и развертывание.
- AirSim: симулятор для автономных транспортных средств, построенный на Unreal Engine / Unity, от Microsoft AI & Research