Bilan: Google Cloud AI allume le machine learning

Google dispose de l'une des plus grandes piles de machine learning du secteur, actuellement centrée sur sa plate-forme Google Cloud AI et Machine Learning. Google a créé TensorFlow en open source il y a des années, mais TensorFlow est toujours le cadre d'apprentissage en profondeur le plus mature et le plus largement cité. De même, Google a lancé Kubernetes comme open source il y a des années, mais c'est toujours le système de gestion de conteneurs dominant.

Google est l'une des principales sources d'outils et d'infrastructure pour les développeurs, les scientifiques des données et les experts en apprentissage automatique, mais historiquement, l'IA de Google n'a pas été très attrayante pour les analystes commerciaux qui manquent de connaissances sérieuses en science des données ou en programmation. Cela commence à changer.

La plate-forme d'IA et d'apprentissage automatique de Google Cloud comprend des éléments constitutifs de l'IA, la plate-forme et les accélérateurs d'IA, ainsi que des solutions d'IA. Les solutions d'IA sont relativement nouvelles et s'adressent aux chefs d'entreprise plutôt qu'aux scientifiques des données. Ils peuvent inclure la consultation de Google ou de ses partenaires.

Les blocs de construction de l'IA, qui sont pré-entraînés mais personnalisables, peuvent être utilisés sans connaissance approfondie de la programmation ou de la science des données. Néanmoins, ils sont souvent utilisés par des spécialistes des données qualifiés pour des raisons pragmatiques, essentiellement pour accomplir des tâches sans formation approfondie sur les modèles.

La plate-forme d'IA et les accélérateurs sont généralement destinés aux spécialistes des données sérieux et nécessitent des compétences en codage, une connaissance des techniques de préparation des données et beaucoup de temps de formation. Je recommande d'y aller uniquement après avoir essayé les blocs de construction pertinents.

Il manque encore des liens dans les offres d'IA de Google Cloud, en particulier dans la préparation des données. L'élément le plus proche de Google Cloud pour un service d'importation et de conditionnement de données est le Cloud Dataprep de Trifacta; Je l'ai essayé il y a un an et j'ai été déçu. Cependant, l'ingénierie des fonctionnalités intégrée à Cloud AutoML Tables est prometteuse et il serait utile de disposer de ce type de service pour d'autres scénarios.

Le revers sombre de l'IA est lié à l'éthique et à la responsabilité (ou à leur absence), ainsi qu'à des biais de modèle persistants (souvent à cause de données biaisées utilisées pour la formation). Google a publié ses principes d'IA en 2018. C'est un travail en cours, mais c'est une base d'orientation, comme indiqué dans un récent article de blog sur l'IA responsable.

Il y a beaucoup de concurrence sur le marché de l'IA (plus d'une douzaine de fournisseurs), et beaucoup de concurrence sur le marché du cloud public (plus d'une demi-douzaine de fournisseurs crédibles). Pour rendre justice aux comparaisons, je devrais écrire un article au moins cinq fois plus long que celui-ci, donc même si je déteste les laisser de côté, je devrai omettre la plupart des comparaisons de produits. Pour la comparaison la plus évidente, je peux résumer: AWS fait la plupart de ce que fait Google, et est également très bon, mais facture généralement des prix plus élevés.

Blocs de construction Google Cloud AI

Les blocs de construction Google Cloud AI sont des composants faciles à utiliser que vous pouvez intégrer dans vos propres applications pour ajouter des données visuelles, linguistiques, de conversation et structurées. De nombreux éléments constitutifs de l'IA sont des réseaux de neurones pré-entraînés, mais peuvent être personnalisés avec l'apprentissage par transfert et la recherche de réseaux de neurones s'ils ne répondent pas à vos besoins. AutoML Tables est un peu différent, en ce sens qu'il automatise le processus qu'un scientifique des données utiliserait pour trouver le meilleur modèle d'apprentissage automatique pour un ensemble de données tabulaires.

AutoML

Les services Google Cloud AutoML fournissent des réseaux neuronaux profonds personnalisés pour la traduction de paires de langues, la classification de texte, la détection d'objets, la classification d'images, ainsi que la classification et le suivi des objets vidéo. Ils nécessitent des données étiquetées pour la formation, mais ne nécessitent pas de connaissances significatives en apprentissage profond, apprentissage par transfert ou programmation.

Google Cloud AutoML personnalise les réseaux neuronaux profonds de haute précision testés au combat de Google pour vos données balisées. Plutôt que de partir de zéro lors de la formation de modèles à partir de vos données, AutoML met en œuvre un apprentissage automatique par transfert profond (ce qui signifie qu'il commence à partir d'un réseau neuronal profond existant formé sur d'autres données) et une recherche d'architecture neuronale (ce qui signifie qu'il trouve la bonne combinaison de couches réseau supplémentaires. ) pour la traduction de paires de langues et les autres services énumérés ci-dessus.

Dans chaque domaine, Google dispose déjà d'un ou plusieurs services pré-formés basés sur des réseaux de neurones profonds et d'énormes ensembles de données étiquetées. Ceux-ci peuvent très bien fonctionner pour vos données non modifiées, et vous devriez le tester pour gagner du temps et de l'argent. S'ils ne font pas ce dont vous avez besoin, Google Cloud AutoML vous aide à créer un modèle qui le fait, sans que vous sachiez comment effectuer un apprentissage par transfert ou comment concevoir des réseaux de neurones.

L'apprentissage par transfert offre deux grands avantages par rapport à la formation d'un réseau neuronal à partir de zéro. Premièrement, il nécessite beaucoup moins de données pour la formation, car la plupart des couches du réseau sont déjà bien entraînées. Deuxièmement, il s'entraîne beaucoup plus rapidement, car il n'optimise que les couches finales.

Alors que les services Google Cloud AutoML étaient auparavant présentés ensemble sous forme de package, ils sont désormais répertoriés avec leurs services pré-formés de base. Ce que la plupart des autres entreprises appellent AutoML est réalisé par Google Cloud AutoML Tables.

Lire la critique complète de Google Cloud AutoML

Tables AutoML

Le processus habituel de science des données pour de nombreux problèmes de régression et de classification consiste à créer une table de données pour l'apprentissage, à nettoyer et à conditionner les données, à effectuer l'ingénierie des fonctionnalités et à essayer de former tous les modèles appropriés sur la table transformée, y compris une étape d'optimisation. les hyperparamètres des meilleurs modèles. Google Cloud AutoML Tables peut exécuter tout ce processus automatiquement une fois que vous avez identifié manuellement le champ cible.

AutoML Tables recherche automatiquement dans le zoo de modèles de Google des données structurées pour trouver le meilleur modèle pour vos besoins, allant des modèles de régression linéaire / logistique pour des ensembles de données plus simples aux méthodes avancées de recherche approfondie, d'ensemble et d'architecture pour les plus grands et plus complexes. Il automatise l'ingénierie des fonctionnalités sur un large éventail de primitives de données tabulaires - telles que les nombres, les classes, les chaînes, les horodatages et les listes - et vous aide à détecter et à prendre en charge les valeurs manquantes, les valeurs aberrantes et d'autres problèmes de données courants.

Son interface sans code vous guide tout au long du cycle de vie de l'apprentissage automatique de bout en bout, ce qui permet à tous les membres de votre équipe de créer facilement des modèles et de les intégrer de manière fiable dans des applications plus larges. AutoML Tables fournit des données d'entrée complètes et des fonctionnalités d'explicabilité du comportement du modèle, ainsi que des garde-corps pour éviter les erreurs courantes. AutoML Tables est également disponible dans les environnements API et notebook.

AutoML Tables est en concurrence avec Driverless AI et plusieurs autres implémentations et frameworks AutoML.

API Vision

L'API Google Cloud Vision est un service d'apprentissage automatique pré-formé pour la catégorisation des images et l'extraction de diverses fonctionnalités. Il peut classer les images en des milliers de catégories pré-entraînées, allant des objets et animaux génériques trouvés dans l'image (comme un chat), aux conditions générales (par exemple, crépuscule), aux points de repère spécifiques (Tour Eiffel, Grand Canyon), et identifier les propriétés générales de l'image, telles que ses couleurs dominantes. Il peut isoler des zones qui sont des visages, puis appliquer des analyses géométriques (orientation du visage et points de repère) et émotionnelles aux visages, bien qu'il ne reconnaisse pas les visages comme appartenant à des personnes spécifiques, à l'exception des célébrités (qui nécessitent une licence d'utilisation spéciale). Vision API utilise l'OCR pour détecter le texte dans les images dans plus de 50 langues et différents types de fichiers. Il peut également identifier les logos des produits et détecter les adultes,contenu violent et médical.

Lire la revue complète des API Google Cloud Machine Learning

API Video Intelligence

L'API Google Cloud Video Intelligence reconnaît automatiquement plus de 20 000 objets, lieux et actions dans les vidéos stockées et diffusées en continu. Il distingue également les changements de scène et extrait des métadonnées riches au niveau de la vidéo, du plan ou de l'image. Il effectue en outre la détection et l'extraction de texte à l'aide de l'OCR, détecte le contenu explicite, automatise le sous-titrage et les sous-titres, reconnaît les logos et détecte les visages, les personnes et les poses.

Google recommande l'API Video Intelligence pour extraire les métadonnées afin d'indexer, d'organiser et de rechercher votre contenu vidéo. Il peut transcrire des vidéos et générer des sous-titres codés, ainsi que signaler et filtrer le contenu inapproprié, le tout de manière plus rentable que les transcripteurs humains. Les cas d'utilisation incluent la modération de contenu, les recommandations de contenu, les archives multimédias et les publicités contextuelles.

API de langage naturel

Le traitement du langage naturel (PNL) est une grande partie de la «sauce secrète» qui fait que les entrées dans la recherche Google et l'Assistant Google fonctionnent bien. L'API Google Cloud Natural Language expose cette même technologie à vos programmes. Il peut effectuer une analyse de syntaxe (voir l'image ci-dessous), une extraction d'entité, une analyse des sentiments et une classification de contenu, dans 10 langues. Vous pouvez spécifier la langue si vous la connaissez; sinon, l'API tentera de détecter automatiquement la langue. Une API distincte, actuellement disponible pour un accès anticipé sur demande, se spécialise dans le contenu lié à la santé.

Lire la revue complète des API Google Cloud Machine Learning

Traduction

L'API Google Cloud Translation peut traduire plus d'une centaine de paires de langues, peut détecter automatiquement la langue source si vous ne la spécifiez pas et se décline en trois versions: Basic, Advanced et Media Translation. L'API de traduction avancée prend en charge un glossaire, la traduction par lots et l'utilisation de modèles personnalisés. L'API de traduction de base est essentiellement ce qui est utilisé par l'interface grand public de Google Translate. AutoML Translation vous permet de former des modèles personnalisés à l'aide de l'apprentissage par transfert.

L'API de traduction multimédia traduit le contenu directement à partir de l'audio (discours), qu'il s'agisse de fichiers audio ou de flux, en 12 langues, et génère automatiquement la ponctuation. Il existe des modèles distincts pour la vidéo et l'audio des appels téléphoniques.

Lire la revue complète des API Google Cloud Machine Learning