Wednesday, 2 July 2014

Big Data: Qu'est-ce que nous pouvons savoir?

Ce post est la premier part de mon réponse à mon professeur de français concernant la conversation que nous avons eu aujourd’hui. Je vais écrire premièrement à propos de la statistique, la définition de Big Data, la relation entre Big Data et la statistique. Finalement, je vais écrire sur les avantages et les limitations de Big Data.

Analyse statistique

Scientifiques, gouvernements et enterprises utilisent l'analyse statistique pour trouver des motifs statistiques ou pour faire inférences. Mais le statistique est comme la science: il n'y a pas de absolues et l'incertitude est presque axiomatique. Quelle est la signification de ceci? La signification de ceci est que tu ne peux avoir 100% certitude que les motifs dans ton data sont vrais. Parfois, tu trouves un motif statistique que tu penses que est réal, mais le motif n'est pas réal. Il s'appelle positif faux. Parfois, tu trouves un motif statistique que tu penses que n'est pas réal, mais le motif est réal. Il' s'appelle négatif faux. Les négatives faux et les positifs faux son problèmes grands dans les sciences.

Big Data

Actuellement, les ordinateurs peuvent garder quantités incroyables d'information. Donc, nous pouvons faire des analyse statistiques sur quantités très grands de data. Big Data s'appelle "Big Data" parce que la quantité d'information que tu veux analyser est "grand".

Analyse statistique et Big Data

Data a besoin d'être analysé. Qu'est-ce que tu utiliser pour analyser le Big Data? La statistique! Simplement parce que tu as un quantité grand de data, tu ne peux avoir 100% certitude. Ton certitude n'augmente pas seulement parce tu as plus de data. Si tu n'analyse pas ton data correctement, tu n'as pas de certitude. Plus de data signifie plus d'opportunités de faire des négatives faux ou des positifs faux.

Big Data: la lumière dans un monde sombre

Big Data peut être très utile pour améliorer les problèmes dans notre monde. Pauvreté, éducation, redistribution de ressources et beaucoup d'autres problèmes. Big Data peut faire des entreprises et gouvernements plus efficace.

Big Data: l'Everest métaphorique

Il y a une chose beau dans la cime de la montagne et tu veux la prends. Si tu veux faire l'ascension de cette montagne, premièrement, tu besoin de savoir faire l'ascension de montagnes petits. Si tu ne sais pas faire l'ascension de montagnes petits et tu fais l'ascension de l'Everest, tu vas perdre. Google Flu Trends a perdu. En 1936, le Literary Digest a fait une analyse sur beaucoup de data de sondage. Le Literary Digest a prédit que Landon va gagner l'élection. George Gallup a utilisé un petit quantité de data et il a prédit que Roosevelt va gagner. Et Roosevelt a gagné. Le Literary Digest a échoué. Qu'est-ce que nous pouvons apprendre de ces échecs? Le Literary Digest a eu beaucoup de data  et George Gallup a eu un petit quantité de data. Pourquoi est-ce que le Literary Digest a échoué s'il a eu un quantité grand de data?

Parce que data n'est pas vérité

Le data de le Literary Digest a été biasé et le data de George Gallup viens de échantillonnage aléatoire. Souvent, nous utilisons l'analyse statistique quand nous n'avons pas tout l'information à propos de notre sujet. Donc, nous devons d'être prudent quand nous n'avons tout le data et nous utilisons un échantillon. Le quantité de data de ton échantillon est important mais la quantité n'est pas tout. "Grand" signifie une chance grande de trouver motifs importantes mais "grand" signifie aussi une chance grande de faire des négatives faux ou des positifs faux.

1 comment:

  1. Oui, le Big Data est vraiment préoccupant... Bonne recherche, bravo!!
    J'ai beaucoup appris...
    A bientôt
    Philippe

    ReplyDelete