LA FICHE D’IDENTITE
- Nombre de pages : 300 pages
- Dimensions du produit: 21,6 x 1,6 x 17,8 cm
- Editeur : ENI
- Date de parution : 14 mai 2014
- Collection :
- Prix : 21,95 €
- Lien Amazon
Alors, voici un livre très intéressant apportant une solution Big Data, c’est à dire, comment gérer des données de plusieurs millions de lignes. Ayant pratiquer succinctement l’option PowerPivot d’Excel, j’attends de ce livre une formation sur cette option.
Il s’agit de la seconde édition de l’éditeur ENI, et comme pour la première, le livre semble assez austère, en noir et blanc : à noter tout de même qu’il ne s’agit pas d’un dictionnaire de mots, il semble bien y avoir un grand nombre d’impression d’écran.
Cet ouvrage m’a été proposé par Christophe Naël, dirigeant de Data Story, ancien collègue de travail comptable, reconverti dans la mise en forme des données : attention Christophe, je serais sans pitié 😉
L'auteur
Mais qui est Jean-Philippe GOUIGOUX ?
Ingérnieur en Génie des Sytèmes Mécaniques (Université de Technologie de Compiègne), diplômé de l’université de Canfield en Angleterre (Master of Science, spécialité Advanced Automation and Design), Jean-Philippe GOUIGOUX est aujourd’hui Directeur Technique et Architecte SOA chez un éditeur de logiciels. Expert .NET (certifié MCTS SQL Server et MCPD Entreprise Architect) il est spécialisé en urbanisation des SI, sécurité logicielle et gestion de la performance. Jean-Philippe GOUIGOUX est reconnu Microsoft MVP (Most Valuable Professionnal) dans la spécialité “Inégration” depuis 2011.
Alors ça c’est un CV…
La Forme
La présentation : un livre assez épais, sobre.
La qualité du papier : papier épais.
Le poids de l’ouvrage : 474 grammes le bébé.
Couleur ou noir et blanc : Noir et blanc.
Les images : les images sont nombreuses et de bonnes qualités.
Le Fond
Thèmes abordés sont les suivants :
PRESENTATION POWER PIVOT |
10 PAGES |
|
ANALYSE DES DONNEES |
|
DES SOLUTIONS POUR LES GROS VOLUMES |
|
L’APPROCHE POWERPIVOT |
INSTALLATION ET PREMIERES UTILISATIONS |
33 PAGES |
|
INSTALLATION DE POWERPIVOT |
|
PREMIERE UTILISATION |
|
MANIPULATIONS SIMPLES |
GESTION DES SOURCES DE DONNEES |
54 PAGES |
|
PARTICULARITES DES TYPES DE DONNEES |
|
CHOIX D’UNE SOURCE DE DONNEES |
|
BASES DE DONNEES |
|
BASES DE DONNEES MULTIDIMENSIONNELLES |
|
FLUX DE DONNEES |
|
FICHIERS |
|
SHAREPOINT |
|
PRESSE-PAPIERS |
|
TABLEAUX EXCEL |
|
COMMENT BIEN PREPARER LES DONNEES |
MISE EN RELATION DES DONNEES |
31 PAGES |
|
PROBLEMATIQUE |
|
MISE EN PLACE DES DONNEES |
|
EXEMPLE SUR LES BASES DE DONNEES |
MISE EN PLACE DE CALCULS |
50 PAGES |
|
UTILITE DES CALCULS |
|
CRÉER DES CHAMPS CALCULES |
|
CRÉER DES COLONNES POWERPIVOT |
REPORTING |
54 PAGES |
|
COMPOSITION D’ANALYSES |
|
FORMATAGE DU CONTENU |
|
MISE EN PAGE |
|
RAPPORTS INTERACTIFS AVEC POWERVIEW |
FONCTIONS AVANCEES |
25 PAGES |
|
PUBLICATION DANS SHAREPOINT |
|
POUR LES EXPERTS |
|
LE FUTUR |
Le premier chapitre de cet ouvrage nous liste les outils existants aujourd’hui pour traiter de gros volumes de données et pourquoi la combinaison Volume/Vitesse/Sources de données différentes est une combinaison très difficile à mettre en place, même avec le meilleur matériel et les meilleurs techniciens du monde.
De part ce constat, l’auteur nous présente succinctement les avantages, inconvénients, limites et controverses du PowerPivot d’Excel tels que : l’avantage principal est de mettre à disposition aux utilisateurs finaux (ou analystes) les données sur un logiciel qu’ils maîtrisent et des données qu’ils vont pouvoir manipuler en fonction de leurs besoins et de leur métier alors que dans des solutions Big Data ce sont les techniciens systèmes qui utilisent des outils dont l’utilisateur final n’aura pas la main ou ne saura pas modifier. La limitation émise par les détracteurs du PowerPivot est le fait que le cube et donc les données soient stockées dans un classeur Excel et l’intégrité des données est remise en cause. Cependant l’auteur nous indique qu’avec une personne dédiée à l’analyse et à la consolidation des données, cette limitation peut être largement réduite et le PowerPivot apporte une grande souplesse pour l’utilisateur que bons nombres d’outils ne proposent pas et surtout gratuitement.
Bon voilà les choses sont dites, passons à l’action. 😉
Le second chapitre nous indique comment installer PowerPivot : vous allez pouvoir télécharger sur le site de l’ENI des sources de données qui seront utilisées dans l’ensemble de cet ouvrage. Vous pourrez ainsi suivre les exemples et faire vos propres tests sur des sources de données plus ou moins conséquentes. Dans un premier exemple, nous importons des données puis nous réalisons une table croisée dynamique sous excel : l’auteur nous indique comment la modifier en ajoutant des champs, des valeurs, des segments, des filtres…
Ensuite le chapitre 3 nous présente les différentes sources de données : nous étudions en premier les bases de données de type SQL. L’auteur nous montre comment installer SQL Server puis comment se connecter à une base. Nous allons ensuite pouvoir visualiser une vue Diagramme de notre schéma de données (liaison entre les tables) et ensuite créer une table croisée dynamique. Le nombre de champs disponible étant important, l’auteur nous propose de créer une perspective ou une vue, pour faciliter la visualisation des champs nécessaires dans notre analyse. L’auteur nous présente ensuite les autres sources de données tels que les flux de données, les fichiers, Sharepoint, le presse-papiers, un tableau Excel. Il détaille leur paramétrage et leur utilisation.
Un dernier sous-chapitre vous indiquera comment bien préparer vos données tant dans le typage des colonnes que dans le nommage. Plus vos colonnes, vos données, vos calculs seront correctement paramétrés en amont de votre reporting, plus cela sera simple à réaliser dans Excel et surtout à analyser.
Le chapitre suivant nous explique comment mettre en relation des données c’est à dire comment lier deux sources de données : on nous y apprend à créer une clé primaire permettant de joindre les deux tables puis d’en faire la liaison sur un exemple de liaison des départements et des régions. Si vous avez quelques notions de développement et de gestion de bases de données, cela vous semblera évident mais pour les novices le chapitre est très bien détaillé en mode pas à pas.
Dans le chapitre 5, l’auteur détaille tout l’intérêt de réaliser des calculs dans le PowerPivot au lieu de les faire dans Excel : en effet, lorsque vous réaliserez une table croisée dynamique sous Excel issu de votre cube, les calculs auront déjà été réalisés et permettront à Excel d’optimiser les temps de réponses. De plus, le fait d’avoir une source de données complète, analysée et fiable, vous permettra d’utiliser les outils Excel (Table croisée dynamique, graphiques, sparkline…) tout à fait sereinement. J’ai découvert dans ce chapitre comment masquer des colonnes d’une table croisée dynamique sans masquer la colonne mais en passant par l’option “Champs, éléments et jeux” dans l’onglet “Analyse du tableau croisé dynamique” : trop bien, ça va mettre très utile.
Nous arrivons ensuite au chapitre sur le Reporting : ce qui correspond à la mise en forme des données via les tables croisées dynamiques et les graphiques. Dans ce chapitre, l’auteur vous apprend à mettre en forme vos données, à utiliser des segments (et ses connexions à plusieurs TCD) et des chronologies, à formater au mieux vos données, à utiliser la mise en forme conditionnelle, la gestion des sous-totaux, des pourcentages, … Enfin un VRAI chapitre sur les tableaux croisées dynamiques 😉
L’auteur nous présente également PowerView nous permettant de créer des Dashboard c’est à dire des ensembles de graphiques et tableaux sur une seule page avec quelques segments pour filtrer les données souhaitées : il vous faudra cependant vérifier que le complément est bien installé ainsi que SylverLight (Bizarrement l’auteur ne nous indique ni où le télécharger ni comment l’installer, je vous mets le lien de téléchargement en cliquant <<ICI>>)
Enfin, le dernier chapitre nous présente les fonctions avancées, de la publication dans Sharepoint à l’installation du Power Query pour gérer vos différentes sources de données dans un ETL (Extract, Transform, Load) : cet outil vous permettra d’automatiser la mise en forme finale d’une source de données exploitable à partir d’une ou plusieurs sources de données, chapitre très intéressant : l’auteur souligne tout de même que cette fonctionnalité (à télécharger <<ICI>>), est encore expérimentale.
EN RESUME,
Ouvrage très intéressant, très bien détaillé dans lequel, j’en suis sûr, tout expert d’Excel apprendra beaucoup de choses. Cet ouvrage n’est pas à destination des utilisateurs novices d’Excel : il faut une bonne maîtrise des bases de données notamment. Si, comme moi, cette fonctionnalité PowerPivot reste pour vous une fonctionnalité annexe d’Excel, je vous invite tout de même à lire cet ouvrage qui, si vous devez gérer des connexions à des sources de données comportant beaucoup de lignes, vous offrira une solution très intéressante.
Le rapport Qualité / Prix
Cet livre coûte 22€ : il nous fait découvrir un peu plus le monde de la BI (Business Intelligence) via Excel et via ses outils tels que Power Pivot, Power View et le Power Query. Pour ma part, j’y ai découvert une façon d’interroger les données, et une méthodologie de préparation très intéressantes pour, qu’une fois correctement préparées et formatées, ces données soient à disposition dans leur mise en forme via les tableaux croisés dynamiques et les graphiques. Donc très bon qualité/Prix.
LA NOTE
AVANTAGES :
– Ouvrage très détaillé, en mode pas à pas, avec des fichiers de données téléchargeables.
– La chronologie de l’auteur dans sa réflexion et son analyse
– Le chapitre sur les tableaux croisés dynamiques très complet
INCONVENIENTS :
– Si on peut appeler cela un inconvénient, cet ouvrage est à destination de personnes ayant un bon niveau sur les bases de données, sur l’analyse de celles-ci ainsi que sur Excel.
– Je sais j’insiste mais des images en couleur auraient été très appréciées 😉
Lorsque l’on souhaite travailler avec Excel et que la ou les sources de données sont conséquentes, ou doivent être fusionnées ou retravaillées, cet ouvrage vous apporte une solution détaillée, avec des exemples simples et clairs. Moi qui m’intéresse de très prêt au poids des données et à leur intégrité, j’ai trouvé ce livre très intéressant.