Outils de stockage de données.

Stockage de données local & Cloud

Hello les amis !!!

Les scientifiques ont souvent, beaucoup de données à traiter, celles-ci peuvent dans de très nombreux cas se compter en téraoctet et dans de rares cas en pétaoctet.Aujourd’hui, à l'heure de l’internet des objets (en anglais : Internet of things )et de la consommation en ligne de nombreuses données sur vos modes de vie et de consommation sont collectées par les grandes entreprises puis analysées par des scientifiques afin de prédire quels sont les produits que vous achèterez à l’avenir. Ce champ de la recherche qui s’intéresse particulièrement aux habitudes de consommation se nomme le data mining. Le domaine du data mining comme l’indique son nom consiste à miner des données afin d’en extraire des informations de valeur. Il est d’ailleurs prédit qu’à partir 2020 , plus de 40 zettaoctets de données seront générés chaque année. La problématique du stockage de données est importante pour tout computer scientist. Dans cet article, nous ne verrons pas comment stocker 40 zettaoctets de données, nous nous consacrerons plutôt à trouver des solutions qui permettent de stocker une grande quantité de données (supérieur à un téraoctet).

Il existe globalement deux choix de gestion de données dans le stockage le premier est celui de garder ses données en local le second est d’utiliser le cloud afin de stocker ses données.

Stocker ses données en local.

Stocker ses données en local signifie qu’il faut assurer soi-même la sécurité de son travail. Il existe principalement trois moyens de stocker des données localement.

Le premier est de stocker ses données sur le disque dur de son ordinateur, c’est la méthode qui permet le plus directement l’accès aux données, mais c’est également la méthode où le risque de pertes des données ou de vol des données est le plus fort.Il est important de savoir qu’il existe deux catégories de disque dur, la première se nomme (hard drive disk) HDD, la seconde (Solid state drive) SSD.

Les HDD sont des disques durs qui ont un fonctionnement mécanique, ils ont principalement trois composants, des plateaux , un moteur , et une tête de lecture et d’écriture.En bref, un disque dur mécanique écrira et lira à l’aide de sa tête de lecture, des données sur les plateaux, la tête de lecture étant fixe, afin de pouvoir écrire et lire sur n’importe qu’elle région du plateau un moteur entrainera ceux-ci en rotation. C’est la raison pour laquelle, les vendeurs utilisent le terme de tour par minute afin de certifier de la qualité du disque dur. Un disque dur ayant un grand nombre de tours par minute (>10000) aura un prix élevé, mais il vous permettra d’accéder plus rapidement à vos données et donc cela se ressentira sur la vitesse de l’ordinateur, car il aura un faible temps de latence et donc ne ramera pas. Inversement les HDD avec un tr/min <7000 auront un prix faible, mais en contrepartie l’ordinateur sera ralenti. Du fait que le disque HDD est mécanique, il doit impérativement ne recevoir aucun choc, auquel cas il cessera de fonctionner et vous perdrez toutes vos données.Ces dernières années, le nombre de HDD dans les ordinateurs a commencé à réduire au profit de disque SSD.

Les disques durs SSD sont une technologie basée sur la mémoire flash, il n’inclut donc aucun composant mécanique. De ce fait, ces disques durs sont beaucoup plus rapides, consomment nettement moins d’énergie, ont une durée de vie plus longue (garantie jusqu’à 5 ans pour les SSD contre 2 ans pour les HDD) et surtout ils ne craignent pas les chocs. En contrepartie, ils sont beaucoup plus chers, en 2018 il faut compter environ 50 euros pour un disque dur 1 To HDD contre 260 euros pour un SSD de même taille. [1,2]De manière générale, lors d’un achat d’un disque SSD, vous n’aurez pas besoin de connaître sa vitesse, car celui-ci est si rapide que vous ne noteriez pas la différence même en achetant un plus rapide. Néanmoins, il est bon de savoir que sur les fiches techniques des SSD l’on trouve la vitesse d’écriture et de lecture exprimée en mégaoctet par seconde. En moyenne, un SSD peut écrire et lire près de 500 Mo par seconde soit environ 1 Go toute les deux secondes[1].

C’est donc à vous selon votre budget de décider de votre support de stockage . Le tableau récapitulatif ci-dessous résume ce que nous venons d’évoquer :

Nom HDD SSD
Accès rapide aux données + +++
Résistance aux chocs - +++
Prix (Go/€) ++ -
Capacité de stockage +++ +++
Durée de vie ++ +++

Nous ne vous recommandons pas de stocker vos données sensibles sur votre ordinateur, car d’une part si celui-ci est équipé d’un HDD le moindre choc pourrait vous faire tout perdre, et d’autre part si l'on vous vole votre ordinateur vous perdrez également tout. Enfin, ce n’est pas un endroit où stocker des données confidentielles, car un ordinateur est vite piraté.

La seconde solution locale de stockage de données est l’utilisation d’un support amovible tel qu’un disque dur externe ou encore une clé USB. Stocker sur un support amovible vos données n’est pas une solution de sécurité optimale, mais elle peut dans certains cas être plus sûre. Prenons le cas où vous travailler sur quelque chose d’important qui ne doit surtout pas être dérobé, mais que vous ayez besoin de votre ordinateur également pour effectuer des taches usuelles. Du fait que votre support de données est externe, vous pouvez à chaque fin d’utilisation le placer dans un lieu sur sans pour autant perdre l’usage de votre ordinateur. De plus, certaines personnes vont même plus loin que ça, elles s’assurent quand elles utilisent le support amovible d'être déconnectées du NET et remettent la connexion qu’après avoir enregistré leur travail et retirer le support. De cette façon, elles sont sûres et certaines de ne pas être piratées. Enfin, les plus paranos d’entre nous iront jusqu’à crypter leurs données assurant ainsi une protection quasi définitive contre toute menace extérieure.Enfin, les seuls inconvénients de cette solution de stockage seraient la perte, le vol ou la mort du matériel. Il est possible de parer à cela en faisant des copies de votre travail sur plusieurs supports. La sous-section suivante est adressée à la méthode de stockage NAS, une méthode qui permet de stocker une quantité énorme de données (>10 teraoctet), tout en assurant la sécurité de celle-ci.

Network Attached Storage NAS Vous pouvez utiliser un serveur de stockage en réseau, plus couramment appelé NAS (de l'anglais Network Attached Storage ). Il s’agit d’une machine, comme celle présentée ci-dessous, qui accepte plusieurs disques durs, les données sont alors stockées sur plus d’un disque. Ainsi si l'un des disques meurt, il n’y a pas de perte de données, car celles-ci avaient préalablement été dupliquées sur les autres disques. L’on dit alors que les données sont stockées en « redondance ».

Illustration d'un serveur NAS
Les avantages phares d’un NAS sont qu’il peut accueillir une grande quantité de données (>100 teraoctets), que les disques durs présents à l’intérieur sont facilement changeables, on peut donc agrandir sa capacité de stockage aisément, et la mort d’un disque n’a pas d’impact sur les données, car stockées en redondance. L’inconvénient majeur c’est qu’il n’est pas portable. Un NAS peut couter environ 150 € pour une version capable d’accueillir deux disques durs contre environ 1000 € pour une version capable d’accueillir 12 disques.

Stocker ses données avec le Cloud.

La seconde option de stockage de données est le cloud.

Le cloud (littéralement nuage : en anglais) est une méthode de stockage de données qui a pris de l’importance ces dernières années. Lorsque nous stockons nos données sur le cloud, celles-ci sont réparties sur un ensemble de serveurs se trouvant dans l’internet. Grâce à ce système intelligent de répartition de données, les données sont protégées de tous les dangers possibles (vol, catastrophe naturelle, défaillance matérielle), car des experts en sécurité les prennent en charge. De plus, certaines plateformes de stockage proposent des offres adaptées aux types de données que vous souhaitez stocker et à l’usage que vous en faites. C’est le cas de Github qui permet d’héberger des projets informatiques, de Grammarly qui permet de stocker votre texte et de corriger votre texte anglais en ligne où encore Google doc qui permet de stocker des documents et de les éditer en ligne. De nombreuses entreprises telles que DropBox, iCloud, Google drive, Box ou encore OneDrive propose des offres de stockage pas cher pour tout type de fichier dans le cloud. Une particularité de ces offres est le fait qu’elle offre toute gratuitement un espace de stockage compris entre 5 et 15 GO selon l’offre que l’on choisit. En ce qu’il s’agit de l’espace payé, vous obtiendrez aisément pour un prix compris entre 8 et 13 euros 1TB de stockage. Il existe également des offres de stockage illimité, à partir de 12 euros par mois. Ou encore des offres payées à vie, ainsi sur iCloud, vous pouvez obtenir 500 Gb à vie pour 175 $. Pour résumer, les avantages des offres cloud basiques sont la facilité d’utilisation, le faible coût, la sécurité contre le piratage et contre les désastres naturels, une grande capacité de stockage et de nombreux service supplémentaire pratique tels que la possibilité de partage entre amis, entre groupes, etc.

Pour les utilisateurs avertis ou pour ceux qui ont des besoins particuliers en stockage, il existe les services d’Amazon pour le web. Amazon propose différents services dans le Cloud « streaming de bureau, serveur de calcul, reconnaissance vocale, et d’autres services incluant le stockage. Il existe différentes offres de stockage que nous avons décidé de vous présenter ci-dessous : Contrairement aux plateformes cloud présentées plus haut, qui proposent une dizaine d’offres pour tous les clients, AWS propose plutôt au client de créer un espace de stockage sur mesure en fonction de ses besoins.C’est pour cette raison, qu’Amazon, facture ses clients proportionnément au Go qu’ils ont stocké sur leurs serveurs et au nombre d’accès à qu’ils ont fait durant le mois. Il existe deux grandes offres Amazon relatives au stockage général de données pour utilisateurs avancés : Amazon simple storage service et Amazon Elastic Block Store.


Amazon simple storage service(Amazon  S3)

Différents modes de stockage sont proposés par Amazon S3 : « Stockage standard, Stockage en accès Standard – Peu fréquent, Stockage dans Glacier »Le stockage standard coute environ 0,023 USD par Go stocké et 0,01 par tranche de 1 000 accès et par Go transféré. Le stockage standard -peu fréquent vous couteras 0,012 5 USD par Go stocké et 0,01 par tranche de 1 000 accès et par Go transféré. Le stockage en glacier vous coutera 0,05 USD par Go stocké et 0,01 par tranche de 1 000 accès et par Go transféré. Vous l’aurez compris, si vous avez besoin d’accéder souvent à vos données vous devriez privilégier le stockage standard. À contrario si vous n’y accédez que rarement, il vaut mieux choisir le stockage en Glacier.


Amazon Elastic Block Store (Amazon EBS)

Amazon EBS est une offre de stockage de données qui vous permet de choisir le type de volume (HDD ou SSD) sur lesquels vous souhaitez stocker vos donnez. Cette offre propose un niveau de sécurité élevé pour vos données, il vous est même possible de crypter les volumes sur lesquels les données sont stockées.Niveau prix, il vous faudra débourser environ 0,10 $ par Go/mois pour un disque SSD, et 0,045 $ pour un HDD pour des disques à usage général.Il existe de nombreuses autres alternatives de stockage que nous n’avons pas présenté ici, car le document aurait été trop lourd. Nous laissons donc à la charge du lecteur la recherche d’un moyen de stockage adapté à ses besoins.

Référence :

[1] https://www.materiel.net/disque-ssd/
[2] https://www.materiel.net/disque-dur/
Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 2.0 Generic License.