20.06.2016 []
Bonjour,
En effet, le Datalake s’apparente plus à une évolution de nos architectures décisionnelles bien connues à base d’entrepôts de données devenus trop petits face à l’appétit d’informations généré par l’explosion des SI connectés et la transformation ‘digitale’ des entreprises et de la société dans son ensemble. La nouveauté consiste plus en une nouvelle capacité d’infrastructure : pouvoir stocker et accéder à une masse d’informations considérables et pas forcéments structurées ni cohérentes entre elles. La seconde évolution confirme une tendance du décisionnel dans les années 2000: ne plus constituer une strate particulière et ‘isolée’ du SI (SI décisionnel vs SI opérationnel), mais participer à un SI global accessible tant dans les processus coeur de métier ou support (plus opértationnels) que de pilotage (plus décisionnels).
Le ‘puits de données’ et la notion de ‘donnée pivot’ me semble adresser plus la recherche de cohérence dans le SI opérationnel, voire global, et s’apparente plus aux mécanismes d’EAI et de MDM que nous avons connus dans les années 90 puis 2000. Elle nécessite une conception puis une administration pour construire et garantir cette cohérence dans le temps.
Les deux approches s’opposent donc en termes de finalité : consolider la profusion de données quelle que soit leur pertinence ou cohérence vs disposer des ‘justes données’ (en quantité et en qualité). La première approche nous fait la promesse d’une mémoire infinie mais peut-être inutile alors que la seconde nous laisse entrevoir le graal de la cohérence tant recherchée par les urbanistes 🙂
Certes au-delà de la constitution de vastes collections d’informations le big data nous promet des traitements toujours plus intelligents et autonomes de ces masses digitales. Mais la data science naissante est loin d’avoir fait ses preuves opérationnelles. En analyse, les conclusions ne sortent pas encore spontanément du lac, et on a encore besoin d’intuition humaine et d’hypothèses à vérifier, comme par le passé ! La différence, c’est la quantité d’informations à disposition. Pour conclure sur une note d’humour, et réconcilier les deux approches, on pourrait donc dire que pour le moment, le Datalake n’est qu’un puits … sans fond 🙂
19.06.2016 []
pour info et pour relancer le débat voici la définition du Gartner transmise par Pierre Bonjour à tous,Suite à la demande de…
17.06.2016 []
Bonjour Michel, Je serai présente à la réunion. Cordialement ratnam
15.06.2016 []
prochaine réunion du groupe de travail se tiendra dans les locaux d’Oresys rue de Londres. Ce sera l’occasion de reprendre…