Valorisez vos données avec le Big Data

OVH cloud Big Data

Valorisez vos données avec le Big Data

Les données deviennent de plus en plus importantes aujourd'hui. Les usages se multiplient, ce qui amplifie le volume d'informations à traiter. Selon l’étude d’IDC « Data Age 2025 », publiée en 2017, la datasphère (le volume total de données stockées dans les systèmes informatiques) sera multipliée par cinq d’ici 2025. Cela équivaudra à 34 To par personne !

De la cryptomonnaie dans le secteur bancaire au big data dans le domaine de la santé, en passant par le machine learning dans le commerce, la robotique et l’IoT dans l’industrie et les véhicules autonomes dans le transport, les données bouleversent le monde. Elles sont le moteur de la transformation numérique de tous les secteurs économiques. 

Data overview

Vue d’ensemble des données dans le monde actuel

Demain, chaque entreprise devra faire face à de nouveaux scénarios que nous commençons tout juste à imaginer. Personne ne peut rester à l’écart, au risque d’être rapidement dépassé par une concurrence qui, en ayant trouvé de nouvelles manières d’utiliser les données, serait plus productive, connaîtrait mieux le marché ou proposerait de nouveaux services plus adaptés aux besoins des clients. C’est innover ou mourir.

Adoption du cloud

Innover ou disparaître

En même temps qu’elles changent le monde, ces données se transforment et évoluent sans cesse. Non seulement leur volume s'accroît, mais elles deviennent aussi de plus en plus complexes : images, sons, publications sur les réseaux sociaux, cartographie, mesures des capteurs, données satellitaires… Le stockage et le traitement de toutes ces informations hétérogènes et non structurées constituent un véritable défi.

Les données, un actif vital pour les entreprises

Sans défi, aucune révolution n’est possible. Il faut une problématique pour pouvoir proposer une solution innovante, qui représente un changement de paradigme. Mais aucune révolution n’est sans risque. L’augmentation du volume et de la complexité des données représente ainsi de nouvelles menaces pour les organisations.

En devenant critiques pour les business models, leur perte peut sérieusement affecter la continuité d'activité des entreprises. De plus, dans certains secteurs où la sécurité est primordiale, comme la banque et la santé, le non-respect des normes de conformité peut entraîner des amendes ainsi que des indemnisations de plusieurs millions d’euros.

D’autre part, la maîtrise de ces risques entraîne toujours une augmentation des coûts au niveau des infrastructures et des ressources humaines. Des dépenses que toutes les organisations ne sont pas en mesure d’assumer.

Pour faire face à ces problématiques, la plupart des entreprises ont cherché une nouvelle approche en se tournant vers le cloud.

La nécessaire adoption du cloud

De par ses caractéristiques, le cloud vient répondre aux défis engendrés par la croissance exponentielle et la diversification des données. Il permet de pallier les difficultés liées à la mise en place d’infrastructures capables d’héberger des volumes massifs d'informations, de soutenir leur croissance et de supporter les prérequis des nouvelles technologies associées.

Face à de tels challenges autour des données, il devient inconcevable d’y répondre avec une implémentation on-premises conventionnelle. Par ailleurs, dans le cloud, les temps de déploiement sont considérablement réduits selon l’hébergeur.

Démarrer avec Public Cloud

Un hébergeur à la hauteur du défi

Mais tous les services cloud ne sont pas les mêmes. Seul un cloud SMART peut aider les entreprises à reprendre le contrôle de leurs données, afin qu'elles puissent innover et entreprendre librement. Notre cloud est Simple et rapide à mettre en œuvre ; il est Multilocal, proche de chacun partout dans le monde ; il possède un prix Accessible et prédictible ; il est Réversible, ouvert et interopérable ; il est Transparent et responsable. Nous sommes convaincus qu’un cloud SMART comme le nôtre est nécessaire pour que la révolution des données soit un progrès pour tous.

D’ailleurs, tout projet d’une certaine taille devra relever trois défis majeurs que tous les fournisseurs de cloud ne sont pas en mesure de relever avec succès : intelligence, volume et sécurité.

Intelligence

Intelligence

Il semble y avoir un consensus sur le fait que le big data et l’intelligence artificielle forment l’un des principaux piliers du développement d’une entreprise. Les sociétés sont conscientes que, grâce aux données, elles peuvent acquérir les connaissances leur permettant de mieux comprendre le contexte économique et social dans lequel elles agissent, puis prendre la meilleure décision au bon moment. Grâce à ces mêmes données, elles ont maintenant la possibilité de bâtir de nouveaux services basés sur le machine learning ou le deep learning. En effet, presque tous les cadres affirment que leur société investit dans ce type d’initiatives.

Face au besoin de s’assurer que les systèmes d’une entreprise sont capables de gérer la complexité de l’intelligence artificielle et de l’apprentissage cognitif, OVH propose des solutions pour accélérer ces initiatives sur l’ensemble du parcours de la donnée. Elles vous facilitent ainsi le chemin vers le big data et l’intelligence artificielle. Ces services sont disponibles à l’heure ou au mois et, pour encore plus de simplicité, peuvent être managés.

Volume

Volume

L’exécution de tâches d’analyse prédictive – pour optimiser les opérations, le développement de nouveaux produits et services à valeur ajoutée, ainsi que le respect de réglementations de plus en plus strictes – va obliger les entreprises à gérer d’énormes volumes de données. Pour pouvoir stocker toutes les informations qui alimentent les systèmes d’intelligence artificielle et les traiter à grande vitesse, il est nécessaire de disposer d'infrastructures appropriées.

 

En tant que fournisseur de cloud natif, nos solutions vous permettent de stocker et de traiter de grands volumes de données de manière sécurisée, évolutive et réversible.

En très peu de temps, vous pouvez disposer d'une infrastructure de production s'appuyant sur des composants matériels de dernière génération et offrant une garantie de disponibilité. Nos services, hébergés dans nos propres datacenters répartis sur quatre continents, peuvent être interconnectés à travers un réseau dédié pour faire face à la croissance des données facilement. De plus, ils sont fondés sur des standards du marché ou sur des solutions open source.

À tout moment, vous avez donc la possibilité de compléter nos produits avec ceux d’un autre hébergeur, voire de changer de fournisseur. Nous voulons que nos clients puissent nous quitter simplement, s’ils le souhaitent.

Security

Sécurité

Comme évoqué plus haut, la sécurité des données est un autre défi majeur. Au cours des derniers mois, le record d’intensité des attaques par déni de service (DDoS) a été battu à plusieurs reprises. De nombreuses failles de sécurité ont également été rendues publiques. Ce n’est pas par hasard si l’une des plus grandes craintes des entreprises en matière de sécurité est d’être victime d’une cyberattaque.

Avec la généralisation de l’IoT, les capteurs et autres wearables sont susceptibles de collecter des données personnelles. Ils constituent ainsi une nouvelle source potentielle de vulnérabilité. Les entreprises qui recueillent ces informations doivent garantir leur intégrité, afin de protéger la vie privée des utilisateurs et de respecter la réglementation en vigueur.

Chez OVH, nous savons que la sécurité et la protection des données sont essentielles. Tous nos services incluent donc par exemple notre protection anti-DDoS par défaut.

Ils offrent également une haute disponibilité, que nous assurons grâce à la redondance et aux certifications de conformité aux normes les plus exigeantes. Quant à nos datacenters, ils sont connectés via notre propre réseau mondial dédié de 18 Tbit/s.

EU flag

De plus, en tant que société européenne, nous sommes soumis à une réglementation très stricte en matière de protection des données. Lors de notre expansion en Amérique du Nord, nous avons créé un isolement juridique de sorte que nos services à l’extérieur des États-Unis ne soient assujettis ni au Patriot Act ni au Cloud Act. Notre ferme engagement en faveur de la souveraineté des données est l’une des raisons pour lesquelles OVH a été choisi comme fournisseur officiel de l’initiative IA4EU (Artificial Intelligence for the European Union), qui vise à promouvoir une vision européenne de l’intelligence artificielle, axée sur des valeurs éthiques.

Par ailleurs, contrairement à ce qui peut paraître de prime abord, la sécurité n’est pas seulement une question technique. Dans la pratique, le principal obstacle à la mise en œuvre de mesures appropriées est souvent l’aspect financier. Disposer d’infrastructures sécurisées, disponibles en permanence et garantissant la protection des données implique des frais qui, chez de nombreux fournisseurs, augmentent de manière exponentielle ou sont totalement imprédictibles, voire les deux.

Chez OVH, vous maîtrisez vos coûts. Nous proposons des tarifs transparents et abordables pour que vous n’ayez pas, par exemple, à renoncer à un plan de continuité de votre activité par manque de budget. Nos services cloud n’ont pas de période d’engagement et, selon la solution, vous pouvez choisir entre une facturation régulière ou à la demande, sur le principe du pay-as-you-go.

Les solutions OVH au service de votre stratégie de données

OVH est fier de participer à l’essor de multiples entreprises à travers le monde, en les accompagnant dans leurs projets autour des données de A à Z. Notre offre couvre tout le parcours des informations, de la collecte jusqu'au stockage et à l’analyse, en passant par la réalisation de prédictions établies via l’apprentissage automatique.

Infographie story data

 

Notre « lab » gratuit OVH Data Collector, un puissant collecteur s'appuyant sur le cloud OVH, vous permet de recueillir facilement des données. Vous pouvez ensuite les répliquer, les interroger et les transporter pour alimenter votre application.

Pour stocker des données, nous vous proposons de nombreuses solutions répondant à tous vos besoins, du bare metal aux plateformes managées clés en main : des serveurs dédiés spécifiquement conçus pour le stockage de grandes quantités d'informations, comme les nouveaux Advance STOR ; le stockage centralisé NAS-HA ; les solutions de stockage évolutives telles que l’Object Storage ou l’offre de block storage, fondées respectivement sur les technologies OpenStack Swift et Ceph ; Logs Data Platform et Metrics Data Platform pour stocker et analyser des logs et des métriques de manière quasi illimitée ; ou Cloud Databases, une solution de bases de données managées.

Une fois les données collectées et stockées dans un service adapté, nous vous proposons deux approches pour construire votre cluster big data. D’un côté, Data Analytics Platform vous offre la possibilité de déployer en moins d’une heure un cluster de production Apache Hadoop prêt à l’emploi et sécurisé. De l’autre, Managed Cloudera vous permet de tirer profit de l’expertise de nos partenaires Claranet et Cloudera pour disposer d’une solution big data Apache Hadoop entièrement managée.

Enfin, pour apprendre de vos données et profiter au maximum du potentiel de l’intelligence artificielle, OVH vous fournit l’infrastructure nécessaire, avec des serveurs dédiés et des instances Public Cloud boostés par des GPU NVIDIA de dernière génération. Plus récemment, nous avons franchi une nouvelle étape en vous proposant tous les logiciels nécessaires. Nous sommes ainsi le seul fournisseur de cloud européen à vous apporter le catalogue de conteneurs accélérés par GPU NVIDIA GPU Cloud (NGC). Celui-ci vous permet d’installer des applicatifs comme TensorFlow ou PyTorch dans vos instances en quelques clics. Des logiciels clés en main pour la data science, comme Jupyter ou Dataiku DSS, sont également disponibles. Enfin, vous pouvez aussi tester nos labs Machine Learning Platform et OVH AI Market Place.

public cloud data ovh

NVIDIA NGC Platform

OVH et NVIDIA s’associent pour proposer la meilleure plateforme d’accélération GPU pour le deep learning et le calcul haute performance.

Le NVIDIA GPU Cloud d’OVH combine la flexibilité du Public Cloud et la puissance de la carte graphique NVIDIA Tesla V100, pour fournir un catalogue complet de conteneurs à accélération GPU, pouvant être déployés et maintenus dans le cadre d’applications d’intelligence artificielle.

Il permet aux utilisateurs d’exécuter leurs projets sur une plateforme fiable et performante qui respecte confidentialité, réversibilité et transparence de la localisation des données.

 

hadoop big data ovh

Data Analytics Platform

Déployer un cluster big data est un processus long et contraignant. OVH Data Analytics Platform vous simplifie votre métier. En moins d’une heure, nous vous livrons une stack Apache Hadoop, préconfigurée et prête à l’usage.

En nous basant sur un standard de distribution Hadoop open source, nous préconfigurons tous les services nécessaires à vos traitements de données et sécurisons vos flux avec le monde externe ainsi que vos utilisateurs.

data collector ovh

Data Collector

La première étape pour tirer parti de vos données, c'est de les collecter. Data Collector d'OVH vous permet d'ingérer des informations dans des temps records. Et ce, tout en conservant une réplication en temps réel depuis de nombreuses sources, telles que des bases de données ou des bus de messages. Vous pouvez ensuite les pousser dans un cluster big data (nous vous livrons un topic Apache Kafka nativement).

Ainsi utilisé, vous bénéficiez de toutes vos données avec un minimum d'impact sur votre infrastructure de production.

public cloud machine learning ovh

Machine learning

Concevez, déployez et utilisez rapidement des modèles de machine learning, sans vous préoccuper de l’infrastructure de votre plateforme. Vous pouvez ainsi vous focaliser sur votre valeur ajoutée.

Utilisable en ligne de commande ou via une interface web,  Prescience vous permet d'automatiser toutes les tâches de sélection, d'entraînement et de déploiement de vos modèles de machine learning. De multiples cas d'usage s'offrent à vous : détection de fraude, optimisation de processus de supply chain, recherche scientifique… Le tout dans le cloud, avec un paiement à l'usage et un respect de vos données.

Les données comme moteurs de l’innovation

Copernicus program

Comme nous l’avons déjà vu, de nombreuses entreprises collectent en permanence des données qu’elles doivent stocker au fur et à mesure dans leurs systèmes d’information, tout en assurant un niveau de sécurité maximum. C’est le cas, par exemple, de l’Agence spatiale européenne (ESA) qui, par l’intermédiaire de son partenaire Serco, héberge les informations du programme Copernicus dans le Public Cloud d'OVH. Plusieurs pétaoctets annuels de données géographiques, thermiques et non structurées, provenant de l’observation de la Terre par les satellites Sentinel, sont stockés continuellement dans notre cloud public. Le volume d’informations à entreposer ne cesse d'ailleurs d’augmenter, notamment en raison de la mise en orbite de nouveaux satellites plus efficaces.

Les applications de ces données sont infinies : prévision de l’état des océans, surveillance de la qualité de l’air, développement d’outils pour créer des services climatiques ou encore calcul de la rentabilité de l’installation de panneaux solaires. C’est ce qu’a fait la startup espagnole dotGIS qui, à partir de ce type d'informations géographiques, a développé SolarMap. À l’aide de technologies telles que le big data et le business analytics, cette solution trouve les meilleures toitures pour installer des panneaux solaires selon la surface et les courbes de radiation solaire quotidiennes. SolarMap a également reçu le soutien d’OVH. Grâce à notre programme d’innovation pour les startups Digital Launch Pad, elle a conçu une architecture de clusters haute disponibilité avec un load balancer, établie sur des serveurs dédiés avec GPU d'OVH. Le vRack, notre réseau privé, leur permet de transférer et livrer rapidement tout ce volume de données de manière fluide.

Digital map

Mais le big data a de multiples applications. Les sociétés l’utilisent souvent pour faire du marketing prédictif. En étudiant les actions entreprises par les clients avant de résilier un service, ou lorsqu’ils ont cessé d’acheter des produits, il est possible de reconnaître des patterns de comportement. Le nombre de connexions au site web, les appels au support ou encore le rythme d’achat sont des indicateurs qui, une fois corrélés, peuvent aider à détecter un client insatisfait et à prendre les mesures appropriées. Par exemple, chez OVH, nous avons développé ce type de stratégie en interne afin de garantir la satisfaction de nos clients.

Et ce n’est pas le seul domaine dans lequel nous utilisons du big data. À l’aide de capteurs et de sondes, nous collectons des données telles que la température d’une salle de datacenter, le nombre de kWh dans chaque prise de courant, la présence dans les bureaux… En les corrélant avec des informations provenant d’autres sources, comme les conditions météorologiques ou les tarifs des fournisseurs, il est possible de déterminer rapidement quel est l’élément le plus consommateur d’énergie. Nous pouvons ainsi réduire nos coûts et notre empreinte environnementale.

Ce ne sont là que quelques exemples de la manière dont nos clients et nous-mêmes utilisons les informations dans différents domaines économiques et sociaux. Depuis l’épicentre de cette révolution, nous travaillons sans cesse pour que nos utilisateurs et partenaires puissent innover en toute liberté. Et ils nous confient ce qu’ils ont de plus précieux : leurs données.

Christophe Mogentale, Technical Director of Elokence

Elokence

"Nous gérons un jeu en ligne, qui totalise 4 millions de parties par jour et consomme d’importants volumes de données. Auparavant, nous stockions les résultats des jeux sur des bases de données relationnelles classiques. Nous sommes depuis passés au big data avec OVH. Ainsi, notre volume d’informations stockables et exploitables n’est plus limité. La solution clés en main OVH Data Analytics Platform nous a également permis de gagner un temps considérable lors de la mise en place d’un cluster big data nativement sécurisé. Nous pouvons désormais exploiter toutes nos données de manière performante et sans contrainte."

Christophe Mogentale, Technical Director de Elokence

Retrouvez-nous également sur