LA FICHE D’IDENTITE

 

  • Nombre de pages : 300 pages
  • Dimensions du produit: 21,6 x 1,6 x 17,8 cm
  • Editeur : ENI
  • Date de parution : 14 mai 2014
  • Collection : 
  • Prix : 21,95 €
  • Lien Amazon

Alors, voici un livre très intéressant apportant une solution Big Data, c’est à dire, comment gérer des données de plusieurs millions de lignes. Ayant pratiquer succinctement l’option PowerPivot d’Excel, j’attends de ce livre une formation sur cette option.

Il s’agit de la seconde édition de l’éditeur ENI, et comme pour la première, le livre semble assez austère, en noir et blanc : à noter tout de même qu’il ne s’agit pas d’un dictionnaire de mots, il semble bien y avoir un grand nombre d’impression d’écran.

Cet ouvrage m’a été proposé par Christophe Naël, dirigeant de Data Story, ancien collègue de travail comptable, reconverti dans la mise en forme des données : attention Christophe, je serais sans pitié 😉

L'auteur

Mais qui est Jean-Philippe GOUIGOUX ?

Ingérnieur en Génie des Sytèmes Mécaniques (Université de Technologie de Compiègne), diplômé de l’université de Canfield en Angleterre (Master of Science, spécialité Advanced Automation and Design), Jean-Philippe GOUIGOUX est aujourd’hui Directeur Technique et Architecte SOA chez un éditeur de logiciels. Expert .NET (certifié MCTS SQL Server et MCPD Entreprise Architect) il est spécialisé en urbanisation des SI, sécurité logicielle et gestion de la performance. Jean-Philippe GOUIGOUX est reconnu Microsoft MVP (Most Valuable Professionnal) dans la spécialité “Inégration” depuis 2011.

Alors ça c’est un CV…

La Forme

La présentation : un livre assez épais, sobre.

La qualité du papier : papier épais.

Le poids de l’ouvrage : 474 grammes le bébé.

Couleur ou noir et blanc : Noir et blanc.

Les images : les images sont nombreuses et de bonnes qualités.

Le Fond

Thèmes abordés sont les suivants : 

PRESENTATION POWER PIVOT

10 PAGES

ANALYSE DES DONNEES

DES SOLUTIONS POUR LES GROS VOLUMES

L’APPROCHE POWERPIVOT

INSTALLATION ET PREMIERES UTILISATIONS

33 PAGES

INSTALLATION DE POWERPIVOT

PREMIERE UTILISATION

MANIPULATIONS SIMPLES

GESTION DES SOURCES DE DONNEES

54 PAGES

PARTICULARITES DES TYPES DE DONNEES

CHOIX D’UNE SOURCE DE DONNEES

BASES DE DONNEES

BASES DE DONNEES MULTIDIMENSIONNELLES

FLUX DE DONNEES

FICHIERS

SHAREPOINT

PRESSE-PAPIERS

TABLEAUX EXCEL

COMMENT BIEN PREPARER LES DONNEES

MISE EN RELATION DES DONNEES

31 PAGES

PROBLEMATIQUE

MISE EN PLACE DES DONNEES

EXEMPLE SUR LES BASES DE DONNEES

MISE EN PLACE DE CALCULS

50 PAGES

UTILITE DES CALCULS

CRÉER DES CHAMPS CALCULES

CRÉER DES COLONNES POWERPIVOT

REPORTING

54 PAGES

COMPOSITION D’ANALYSES

FORMATAGE DU CONTENU

MISE EN PAGE

RAPPORTS INTERACTIFS AVEC POWERVIEW

FONCTIONS AVANCEES

25 PAGES

PUBLICATION DANS SHAREPOINT

POUR LES EXPERTS

LE FUTUR

Le premier chapitre de cet ouvrage nous liste les outils existants aujourd’hui pour traiter de gros volumes de données et pourquoi la combinaison Volume/Vitesse/Sources de données différentes est une combinaison très difficile à mettre en place, même avec le meilleur matériel et les meilleurs techniciens du monde.

De part ce constat, l’auteur nous présente succinctement les avantages, inconvénients, limites et controverses du PowerPivot d’Excel tels que : l’avantage principal est de mettre à disposition aux utilisateurs finaux (ou analystes) les données sur un logiciel qu’ils maîtrisent et des données qu’ils vont pouvoir manipuler en fonction de leurs besoins et de leur métier alors que dans des solutions Big Data ce sont les techniciens systèmes qui utilisent des outils dont l’utilisateur final n’aura pas la main ou ne saura pas modifier. La limitation émise par les détracteurs du PowerPivot est le fait que le cube et donc les données soient stockées dans un classeur Excel et l’intégrité des données est remise en cause. Cependant l’auteur nous indique qu’avec une personne dédiée à l’analyse et à la consolidation des données, cette limitation peut être largement réduite et le PowerPivot apporte une grande souplesse pour l’utilisateur que bons nombres d’outils ne proposent pas et surtout gratuitement.

Bon voilà les choses sont dites, passons à l’action. 😉

Le second chapitre nous indique comment installer PowerPivot : vous allez pouvoir télécharger sur le site de l’ENI des sources de données qui seront utilisées dans l’ensemble de cet ouvrage. Vous pourrez ainsi suivre les exemples et faire vos propres tests sur des sources de données plus ou moins conséquentes. Dans un premier exemple, nous importons des données puis nous réalisons une table croisée dynamique sous excel : l’auteur nous indique comment la modifier en ajoutant des champs, des valeurs, des segments, des filtres…

Ensuite le chapitre 3 nous présente les différentes sources de données : nous étudions en premier les bases de données de type SQL. L’auteur nous montre comment installer SQL Server puis comment se connecter à une base. Nous allons ensuite pouvoir visualiser une vue Diagramme de notre schéma de données (liaison entre les tables) et ensuite créer une table croisée dynamique. Le nombre de champs disponible étant important, l’auteur nous propose de créer une perspective ou une vue, pour faciliter la visualisation des champs nécessaires dans notre analyse. L’auteur nous présente ensuite les autres sources de données tels que les flux de données, les fichiers, Sharepoint, le presse-papiers, un tableau Excel. Il détaille leur paramétrage et leur utilisation.

Un dernier sous-chapitre vous indiquera comment bien préparer vos données tant dans le typage des colonnes que dans le nommage. Plus vos colonnes, vos données, vos calculs seront correctement paramétrés en amont de votre reporting, plus cela sera simple à réaliser dans Excel et surtout à analyser.

Le chapitre suivant nous explique comment mettre en relation des données c’est à dire comment lier deux sources de données : on nous y apprend à créer une clé primaire permettant de joindre les deux tables puis d’en faire la liaison sur un exemple de liaison des départements et des régions. Si vous avez quelques notions de développement et de gestion de bases de données, cela vous semblera évident mais pour les novices le chapitre est très bien détaillé en mode pas à pas.

Dans le chapitre 5, l’auteur détaille tout l’intérêt de réaliser des calculs dans le PowerPivot au lieu de les faire dans Excel : en effet, lorsque vous réaliserez une table croisée dynamique sous Excel issu de votre cube, les calculs auront déjà été réalisés et permettront à Excel d’optimiser les temps de réponses. De plus, le fait d’avoir une source de données complète, analysée et fiable, vous permettra d’utiliser les outils Excel (Table croisée dynamique, graphiques, sparkline…) tout à fait sereinement. J’ai découvert dans ce chapitre comment masquer des colonnes d’une table croisée dynamique sans masquer la colonne mais en passant par l’option “Champs, éléments et jeux” dans l’onglet “Analyse du tableau croisé dynamique” : trop bien, ça va mettre très utile.

Nous arrivons ensuite au chapitre sur le Reporting : ce qui correspond à la mise en forme des données via les tables croisées dynamiques et les graphiques. Dans ce chapitre, l’auteur vous apprend à mettre en forme vos données, à utiliser des segments (et ses connexions à plusieurs TCD) et des chronologies, à formater au mieux vos données, à utiliser la mise en forme conditionnelle, la gestion des sous-totaux, des pourcentages, … Enfin un VRAI chapitre sur les tableaux croisées dynamiques 😉

L’auteur nous présente également PowerView nous permettant de créer des Dashboard c’est à dire des ensembles de graphiques et tableaux sur une seule page avec quelques segments pour filtrer les données souhaitées : il vous faudra cependant vérifier que le complément est bien installé ainsi que SylverLight (Bizarrement l’auteur ne nous indique ni où le télécharger ni comment l’installer, je vous mets le lien de téléchargement en cliquant <<ICI>>)

Enfin, le dernier chapitre nous présente les fonctions avancées, de la publication dans Sharepoint à l’installation du Power Query pour gérer vos différentes sources de données dans un ETL (Extract, Transform, Load) : cet outil vous permettra d’automatiser la mise en forme finale d’une source de données exploitable à partir d’une ou plusieurs sources de données, chapitre très intéressant : l’auteur souligne tout de même que cette fonctionnalité (à télécharger <<ICI>>), est encore expérimentale.

EN RESUME

Ouvrage très intéressant, très bien détaillé dans lequel, j’en suis sûr, tout expert d’Excel apprendra beaucoup de choses. Cet ouvrage n’est pas à destination des utilisateurs novices d’Excel : il faut une bonne maîtrise des bases de données notamment. Si, comme moi, cette fonctionnalité PowerPivot reste pour vous une fonctionnalité annexe d’Excel, je vous invite tout de même à lire cet ouvrage qui, si vous devez gérer des connexions à des sources de données comportant beaucoup de lignes, vous offrira une solution très intéressante.

Le rapport Qualité / Prix

Cet livre coûte 22€ : il nous fait découvrir un peu plus le monde de la BI (Business Intelligence) via Excel et via ses outils tels que Power Pivot, Power View et le Power Query. Pour ma part, j’y ai découvert une façon d’interroger les données, et une méthodologie de préparation très intéressantes pour, qu’une fois correctement préparées et formatées, ces données soient à disposition dans leur mise en forme via les tableaux croisés dynamiques et les graphiques. Donc très bon qualité/Prix.

LA NOTE

AVANTAGES :

– Ouvrage très détaillé, en mode pas à pas, avec des fichiers de données téléchargeables.

– La chronologie de l’auteur dans sa réflexion et son analyse

– Le chapitre sur les tableaux croisés dynamiques très complet

INCONVENIENTS :

– Si on peut appeler cela un inconvénient, cet ouvrage est à destination de personnes ayant un bon niveau sur les bases de données, sur l’analyse de celles-ci ainsi que sur Excel.

– Je sais j’insiste mais des images en couleur auraient été très appréciées 😉

Lorsque l’on souhaite travailler avec Excel et que la ou les sources de données sont conséquentes, ou doivent être fusionnées ou retravaillées, cet ouvrage vous apporte une solution détaillée, avec des exemples simples et clairs. Moi qui m’intéresse de très prêt au poids des données et à leur intégrité, j’ai trouvé ce livre très intéressant.

NOTE /20 DE L'OUVRAGE

Partager l'article :