3 alternatives Kaggle pour la science des données collaborative

Quelle est la meilleure façon d'obtenir une bonne réponse à une question difficile? Demandez à un groupe de personnes et faites-en un concours. C'est depuis longtemps l'approche de Kaggle en matière de science des données: transformer des missions difficiles, comme rendre la détection du cancer du poumon plus précise, en compétitions payantes, où les meilleures équipes et les meilleurs algorithmes gagnent.

Maintenant, Kaggle se lance dans Google, et bien que tous les signes indiquent qu'il est conservé tel quel pour le moment, il y aura des inquiétudes quant aux perspectives à long terme d'un site avec une communauté aussi dévouée et une approche idiosyncratique.

Voici trois autres sites qui partagent une mission similaire, sinon explicitement suivie dans les traces de Kaggle. (Notez que certains sites, comme CrowdAnalytix, peuvent considérer les solutions acceptées dans les concours comme des travaux à la location et donc leur propriété.)

CrowdAI

Produit de l'École Polytechnique Fédérale de Lausanne en Suisse, CrowdAI est une plateforme open source permettant d'héberger des défis de données ouvertes et de mieux comprendre comment les problèmes en question ont été résolus. La plate-forme est assez nouvelle, avec seulement six défis proposés jusqu'à présent, mais les tutoriels dérivés de ces défis sont détaillés et précieux, fournissant des méthodologies étape par étape pour reproduire ce travail ou créer quelque chose de similaire. Les exercices existants couvrent des cadres courants tels que Torch ou TensorFlow, c'est donc un bon endroit pour acquérir des détails pratiques pour les utiliser.

DrivenData

DrivenData, créé par un cabinet de conseil spécialisé dans les problématiques de données professionnelles, héberge des challenges en ligne d'une durée de quelques mois. Chacun se concentre spécifiquement sur les problèmes urgents auxquels le monde entier est confronté, comme la prévision de la propagation de maladies ou l'extraction des données Yelp pour améliorer les processus d'inspection des restaurants. Comme Kaggle, DrivenData dispose également d'un tableau de liste des emplois en science des données - une fonctionnalité que les gens craignent de manquer dans Kaggle après l'acquisition.

CrowdAnalytix

Soutenu par des investisseurs d'Accel Partners et de SAIF Partners, CrowdAnalytix se concentre sur l'hébergement de concours de résolution de problèmes basés sur les données, plutôt que sur le partage des informations qui en résultent. Des concours sont proposés pour trouver des solutions à des problèmes dans des catégories telles que la modélisation, la visualisation et la recherche, et chacun a des primes de plusieurs milliers de dollars. Certains défis précédents incluent la prévision des coûts réels des demandes d'indemnisation des travailleurs ou des retards des compagnies aériennes. D'autres concours, cependant, ne sont pas organisés pour de l'argent, mais pour fournir une option compétitive pour apprendre une discipline connexe, telle que le langage R.